如果你有一个现代化的磁带备份解决方案,备份过程中可能有一些dedup排序。这些重复数据删除过程通常是检查被写入到备份平台的数据,然后删除重复值以节省磁带上的空间。 然而,如果你正在使用备份压缩,无论是原生备份压缩或第三方备份压缩工具,几乎都会完全抹杀重复数据删除程序的效果。 重复数据删除系统原理 有两种不同类型的重复数据删除系统,包括固定长度重复数据删除和可变长度重复数据删除。
固定宽度的重复数据删除系统使用固定宽度的过程寻找重复的数据。它们将文件分解成大小为1K的固定宽度的字符串(不同的厂商使用不同长度的字符串,但为讨论方便起见,我们将假定一个1K的固定宽度的字符串)。然后,凡是重……
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
如果你有一个现代化的磁带备份解决方案,备份过程中可能有一些dedup排序。这些重复数据删除过程通常是检查被写入到备份平台的数据,然后删除重复值以节省磁带上的空间。
然而,如果你正在使用备份压缩,无论是原生备份压缩或第三方备份压缩工具,几乎都会完全抹杀重复数据删除程序的效果。
重复数据删除系统原理
有两种不同类型的重复数据删除系统,包括固定长度重复数据删除和可变长度重复数据删除。固定宽度的重复数据删除系统使用固定宽度的过程寻找重复的数据。它们将文件分解成大小为1K的固定宽度的字符串(不同的厂商使用不同长度的字符串,但为讨论方便起见,我们将假定一个1K的固定宽度的字符串)。然后,凡是重复字符串的指针均把指针指向1K长度的原始字符串的指针。
变长系统基本上做同样的事情,但他们不使用固定长度的字符串。因为他们使用可变长度字符串能更好的调整以删除更小的重复值,这可能会小至每一个字。
例如,如果你有一个包含员工名的表,你使用1K固定宽度字符串的重复数据删除系统,可能不会删除任何重复数据。但是,如果你有一个可变长度字符串的系统,如果有重复的姓名(比如在名字列),那么根据数据库文件中的重复数据量,你会轻松得到一些重复数据。
为什么不用压缩呢?
不用压缩的数据库备份的原因在于每个值是唯一的。当数据压缩每一行而其中姓“Smith”的记录已经将重复的删除。此外,数据库(至少是OLTP数据库)已经通过规范化过程删除大量的重复数据。
两星期前,我参加了南加州Quantum实验室的一个压缩的数据库备份,因而看到它如何在压缩备份中删除重复数据(其中一些备份数据是加密的)。我们见证了什么是不可能的,我们在压缩备份文件中我们得到了0%的重复数据删除。
DBA关心什么?
作为DBA,我们关心这一点,因为我们要与企业环境的其他部门很好的合作,如果不需要则不要浪费资源。正因为如此,你会希望与存储和备份小组一起工作来为你的系统产生最佳方案。这意味着你正在进行没有压缩的备份以便重复数据删除过程更加有效的在你的文件中删除重复数据,这取决于你的数据集。在SQL Server平台上会让备份运行较长的时间,但只要备份仍然适合于备份窗口则可确定。你只有通过和备份与/或存储管理员一起工作才能发现这个结论并确定在特定的工作环境如何最佳工作。
作者
相关推荐
-
说说数据库备份的那些事
数据备份对于DBA来说是一项最基本的工作,但又是十分关键的,每个SQL Server上面执行的最重要的任务之一都是运行备份和恢复。
-
Oracle Cloud推出数据库备份与存储云服务
甲骨文公司近日宣布推出Oracle数据库备份服务(Oracle Database Backup Service)和Oracle存储云服务(Oracle Storage Cloud Service)。
-
SQL Server DBA的六大日常职责
SQL Server有哪些关键任务需要DBA放到日常list中的呢?本文就将介绍六个SQL Server DBA的日常职责。
-
将SQL Server备份拆分成多个文件
DBA可以试着将SQL Server备份拆分成多个文件以减少备份时间,并使用多个驱动器来存储备份文件。