DD Boost 概述
EMC 备份恢复产品DD Boost。顾名思义,是Data Domain 上的一个特性,可以用在Avamar、NetWorker 等备份设备上。那么DD Boost 究竟又有何作用呢?本系列文章将为你详细解释。本章为第一篇,将带领大家初步了解下DD Boost 的概念。
DDBoost 是EMC 的一种私有协议,能够提供比CIFS 或NFS 协议更高效的数据传输。备份软件可通过DDBoost 来标准化集中管理Data Domain 系统。
DD Boost 支持的备份软件
· EMC Avamar(EMC 针对VMware 虚拟备份软件,包括纯软件和一体机产品形态)
· EMC NetWorker
· Oracle Recovery Manager (RMAN)
· Quest vRangerPro(Quest 公司的数据备份软件,被Dell 收购;物理机备份软件为NetVault,虚拟为vRanger/vReplicater)
· Symantec Backup Exec
· Symantec NetBackup
其中,EMCAvamar 和EMC NetWorker 客户端软件自带有DDboost 插件,而其余第三方备份软件要使用DD Boost 功能的话,需要额外安装DD boost 插件。要启用DD Boost 功能,必须要先输入DD Boost 序列号。
需要为DD Boost 开启以下TCP 端口:
TCP 2049 (NFS)
TCP2051 (replication)
TCP 111(NFS portmapper)
启用了DD Boost 的备份客户端会将数据存储到一个叫做Data Domain 上的一个称为storage unit 的存储空间上。storage unit 需要事前在Data Domain 上手动创建。
DD Boost 主要提供以下功能
·DistributedSegment Processing (DSP) 分布式段处理
·ManagedFile Replication 受管理的文件复制
·AdvancedLoad Balancing and Link Failover 高级负载均衡和链路故障转移
·VirtualSynthetics 虚拟合成
后续将DD Boost 的功能分四节来进行详细描述。
分布式段处理(DSP)功能
DD Boost 是Data Domian 系统的软件选项,由两部分组成:DDBoost 插件和DD Boost 组件,前者安装在备份服务器或客户端上运行,而后者在Data Domian 上运行,两组件间通信采用以太网或FC 网络。DSP 可让应用程序主机承担一部分本应全部由Data Domain 系统承担的重复数据删除工作,而Data Domian 集中精力确定内容唯一的部分并将新数据写入磁盘。DSP功能默认开启,也可以关闭它。
Data Domain 系统重删步骤
1. 对要备份的数据进行分段
2. 给数据段打上指印(哈希)
3. 过滤掉之前已经存储过的含有相同指印的数据段
4. 对唯一的要存储的数据进行压缩
5. 记录对已经存储过的数据段的引用并将新数据写入磁盘
启用DSP 功能以后,备份主机将承担步骤1、步骤2 和步骤4 的任务,而Data Domain 系统只负责处理步骤3 和步骤5 的任务。
启用DSP 以后,备份主机会将备份数据分割成4 到12KB 不等的数据段,并给每个数据段打上指印。然后将数据段指印发送给Data Domain 进行过滤。Data Domain 系统会将收到的数据段指印与系统已有的指印进行比对,如果有相同的就将数据段指印丢弃,反之则说明是新的数据段指印,然后通知主机对数据段进行压缩并发送给Data Domain 系统。Data Domain
系统会记录对已经存储过的数据段的引用并将新数据写入磁盘。
DSP 的主要优势
由于压缩在备份客户端上完成,要传输的数据更少,从而节省带宽。
由于备份主机分担处理一部分重复数据删除任务,因而提高了备份主机的CPU 利用率并降低了Data Domain 系统的CPU 利用率。需要注意的是,启用DSP 功能会增加备份主机的CPU 利用率。所以,如果备份主机的CPU利用率已经较高,则不应当启用DSP 功能。
受管理的数据远程复制
DDBoost 可使备份应用程序管理配置了DD Boost 的两台或多台Data Domain 系统之间的文件复制。DD Boost 可简化Data Domain 复制操作并追踪本地和远程备份,数据恢复也随之得到简化。DD Boost 可以识别由Data Domian Replicator生成的任何远程拷贝,也可以实现本地和远程副本采用不同的保留策略,通过DD Boost 可以控制哪些数据可以从本地复制到一个或多个远程Data Domain 中,备份应用程序可以识别本地和任何远端副本的备份目录。
远程复制过程
以NetWorker 备份软件为例来说明受管理的文件复制是如何起作用的:
1. NetWorker 存储节点(备份服务器)发起备份任务并将数据发送给本地DataDomain 系统,备份开始。
2. 本地Data Domain 系统通知NetWorker 存储节点备份已完成。
3. 备份相关信息在NetWorker 媒体数据库中得到记录。
4. NetWorker 存储节点通过克隆任务(数据复制)对远程Data Domain 系统发起复制任务。
5. 备份数据从本地Data Domain 系统复制到远程Data Domain 系统。
6. 远程Data Domain 系统通知本地Data Domain 系统复制已完成,本地Data Domain 系统再通知NetWorker 存储节点复制已完成。
7. 克隆相关信息在NetWorker 媒体数据库中得到记录。
由于NetWorker 媒体数据库包含远程Data Domain 系统上复制数据的相关信息,因此我们可以直接从远程DataDomain 系统恢复数据。同时我们还可以选择是否启用Data Domain 复制的两个选项:
Lowbandwidth optimization:
此选项可使复制在WAN 带宽不足的条件下,通过额外的压缩机制实现如数据复制的目的。此选项默认不开启,要启用该功能,需要在源Data Domain 系统和目标Data Domain 系统上都启用此选项。关于Low bandwidth optimization 选项的详细介绍,请参考DataDomain 复制的低带宽优化(Low Bandwidth Optimization)选项介绍这篇文章。
Encryptionof managed file replication data:
此选项可提供对受管理的文件复制在数据复制过程中的加密功能。此选项默认不开启,要启用该功能,需要在DataDomain 系统和目标Data Domain 系统上都启用此选项。
高级负载均衡和链路故障转移
我们可以给DDBoost 创建应用层接口组,将Data Domain 的多个IP 地址接口组合成一个私有网络接口组。这样做链路聚合的目的是:
将接口组中接受的数据流量平均分配给接口中的每个接口,达到负载平衡提高性能的目的。
当接口组中的某个接口故障时,不影响数据的传输。
虽然接口组中包含多个接口,但是只有其中一个接口在备份软件中注册。DD Boost 与Data Domain 系统通过这个在备份软件中注册的接口进行协商来获得接口传输数据。
如果一个接口发生故障,该接口负责正在负责的数据传输任务会由接口组中的另一个接口继续承担。但是值得注意的是,故障转移之后,链路的吞吐量会降级到链路聚合之前的水平。举例来说,假如四条1GB 的链路做聚合,如果其中一条链路故障,数据传输不会中断,另一条链路会继续承担故障链路的数据传输任务。分布式段处理(Distributed Segment Processing )(DSP)功能不受接口组的影响。
此外,为了防止性能变化差异太大,不要将1GB 链路和10GB 链路放入同一个接口组中。
虚拟合成功能
Synthetic full backup
NetWorker8.0 引入了Synthetic full backup 的新备份模式。Synthetic fullbackup是一种将最近一次full backup 与之后所有增量备份合成的备份模式。Synthetic full backup 只会涉及到NetWorker 备份服务器和Data Domain 之间的数据交换。 但是很遗憾,该模式对Data Domain 系统的支持并不完善,因为我们仍然需要读取full backup 以及之后所有的增量备份并将这些数据进行还原(将数据还原到重复数据删除之前的状态)来构建一个新的full backup,然后再重新将这个新的full backup 存入Data Domain。在此存入过程中,Data Domain 会再次用到内联重复数据删除机制对这个新的full backup 进行重复数据删除。很明显这样的效率并不高。
Virtual Synthetics
在NetWorker 8.1 中和NetBackup,DD Boost 引入了一个新功能:Virtual Synthetics,专门用于完善对于DD boost 备份客户端的Synthetic full backup。Virtual Synthetics 不用对full backup 以及之后所有的增量备份进行数据还原,而是通过添加指针的方式来完成。这样,Synthetic full backup 的备份速度可以得到显著提高。DataDomain 系统采用元数据来合成完整备份无需通过网络移动数据,通过虚拟合成备份,Data Domain 可以基于以前的完整备份和增量备份来合成完整备份,从DD Boost OS 5.4 版本开始,Virtual Synthetics 选项默认开启。
DD Boost 与Oracle RMAN 的高级集成
DD Boost 生态环境
DD Boost 可以和很多系统集成提供更灵活的备份方案,但DD Boost 本身就具有很好的备份功能,它可以由业务管理员根据某一业务(Oracle/GreePlum 等)设置自己的备份策略,而无需备份管理员来规划备份策略。另外,DD Boost 也支持和备份软件集成,通过备份软件统一调度和协调工作。
DD Boost 是业内第一款可全面控制Oracle 备份和灾难恢复的解决方案,能够帮助DBA 信心满满地自行管理本地或DR 站点恢复。借助适用于RMAN 的DD Boost,Oracle 数据库管理员(DBA) 可管理其备份、操作恢复和灾难恢复流程,而不必依赖备份管理员。此外,配合RMAN(Oracle Recovery Manager )DDBoost 加快了备份性能,利用现有资源可以执行更多备份并简化了管理。
DD Boost 部署方式
只需在Oracle 服务器上安装DD Boost 插件,然后在Oracle 介质管理层(MML) API(也称为简单磁带备份API)和DD Boost 之间安装DD Boost 插件接口即可。
分布重复数据消除流程
在未使用DD Boost 之前,Oracle RecoveryManager 会将所有数据(无论是唯一数据还是冗余数据)发送到Data Domain 系统进行重复数据消除处理,如下面的图所示。
使用DDBoost 时,Oracle 服务器仅将唯一的数据段发送到Data Domain 系统。大幅提高了性能。
|