Veritas NetBackup™ Deduplication 指南
- 介绍 NetBackup Media Server Deduplication Option
- 规划部署
- 关于 MSDP 存储和连接要求
- 关于 NetBackup 介质服务器重复数据删除
- 关于 NetBackup Client Direct 重复数据删除
- 关于 MSDP 远程办公客户端重复数据删除
- 关于 MSDP 性能
- MSDP 部署最佳做法
- 置备存储
- 重复数据删除的授权
- 配置重复数据删除
- 配置重复数据删除多线程代理行为
- 配置 MSDP 指纹缓存行为
- 在存储服务器上配置 MSDP 指纹缓存种子设定
- 关于使用 KMS 服务的 MSDP 加密
- 为介质服务器重复数据删除池配置存储服务器
- 配置用于重复数据删除的磁盘池
- 配置介质服务器重复数据删除池存储单元
- 关于同一域内的 MSDP 优化复制
- 在同一 NetBackup 域内配置 MSDP 优化复制
- 配置以不同 NetBackup 域为目标的 MSDP 复制
- 创建存储生命周期策略
- “弹性网络”属性
- 编辑 MSDP pd.conf 文件
- 关于保护 MSDP 目录库
- 配置 MSDP 目录库备份
- 使用 NetBackup CloudCatalyst 配置云的重复数据删除
- 使用 NetBackup CloudCatalyst 将经过重复数据删除的数据上载到云
- 配置用于云的重复数据删除的 CloudCatalyst 存储服务器
- 监视重复数据删除活动
- 管理重复数据删除
- 恢复 MSDP
- 替换 MSDP 主机
- 卸载 MSDP
- 重复数据删除体系结构
- 故障排除
- 关于统一日志记录
- 关于旧式日志记录
- 对 MSDP 安装问题进行故障排除
- 对 MSDP 配置问题进行故障排除
- 对 MSDP 操作问题进行故障排除
- CloudCatalyst 问题故障排除
- 附录 A. 迁移到 MSDP 存储
关于 NetBackup 客户端上的可变长度重复数据删除
目前,NetBackup Deduplication 遵循固定长度重复数据删除方法,即:将数据流分成若干固定长度的段 (128 KB),然后进行处理用于重复数据删除。固定长度重复数据删除的优点在于这种方法十分快速,它占用的计算资源更少。固定长度重复数据删除可有效处理大多数类型的数据流。但在某些情况下,固定长度重复数据删除可能会导致重复数据删除率较低。
如果在转变模式中修改了数据,也就是说,如果将一些数据插入文件的中间,在备份数据时,通过可变长度重复数据删除可提高重复数据删除率。可变长度重复数据删除可以减少备份存储,提高备份性能,并降低用于数据保护的总体成本。
注意:
对于当前 MSDP 智能重复数据删除算法和附属流转化器的重复数据删除率不佳的数据类型,请使用可变长度重复数据删除。启用可变长度重复数据删除可以提高重复数据删除率,但要注意 CPU 性能可能会受到影响。
在可变长度重复数据删除中,每个段的大小可变,且大小边界可配置。NetBackup 客户端会检查数据并对可变长度数据段应用安全哈希算法 (SHA-2)。将为每个数据段分配一个唯一的 ID,并且 NetBackup 会评估备份中是否存在具有相同 ID 的数据段。如果已存在该数据段,不会再次存储段数据。
警告:
如果对备份策略启用压缩,则可变长度重复数据删除不起作用,即使在对其进行配置后也如此。
下表介绍了可变长度重复数据删除对数据备份的影响:
表:可变长度重复数据删除的影响
对重复数据删除率的影响 |
如果在转变模式中修改数据文件(即,在二进制级别插入、删除或修改数据),则可变长度重复数据删除非常有益。再次备份此类已修改的数据时,可变长度重复数据删除的重复数据删除率将提高。因此,第二个或后续备份的重复数据删除率更高。 |
对 CPU 的影响 |
与固定长度重复数据删除相比,可变长度重复数据删除消耗的资源可能更多,但是可以提高重复数据删除率。可变长度重复数据删除需要更多 CPU 周期来计算段边界,并且备份时间可能超过固定长度重复数据删除方法。 |
对数据还原的影响 |
可变长度重复数据删除不影响数据还原进程。 |
默认情况下,NetBackup 客户端上禁用可变长度重复数据删除。通过在 pd.conf
文件中添加参数,可以启用可变长度重复数据删除。要对所有 NetBackup 客户端或策略启用相同的设置,必须在 pd.conf
文件中指定所有客户端或策略。
在重复数据删除负载平衡方案中,必须将介质服务器升级到 NetBackup 8.1.1 或更高版本并修改所有介质服务器上的 pd.conf
文件。如果备份作业为负载平衡池选择旧介质服务器(版本低于 NetBackup 8.1.1),则使用固定长度重复数据删除替代可变长度重复数据删除。在负载平衡方案中,避免配置使用不同 NetBackup 版本的介质服务器。通过可变长度重复数据删除生成的数据段与通过固定长度重复数据删除生成的数据段不同。因此,对使用不同 NetBackup 版本的介质服务器进行负载平衡会降低重复数据删除率。