副本数据管理CDM是指这样一类产品,它从主存储(生产存储)通过快照技术获取有应用一致性保证的数据,在二级存储(非生产存储)上创建活动的“黄金副本”(golden image),可通过“黄金副本”按需提供多个数据以原始磁盘格式组织的虚拟化副本,直接挂载出来给到诸如备份/恢复、容灾、开发/测试等场景使用。支持异构生产存储是CDM产品必备的基础功能,不同的CDM产品具有差异化的数据管理能力。
Gartner对CDM的定义
Gartner给出的定义是:从生产环境通过快照技术获取有应用一致性保证的数据,在非生产存储上生成“黄金副本(golden image)”,这个“黄金副本 ”数据格式是原始的磁盘格式,可再虚拟化成多个副本直接挂载给服务器,分别用于备份恢复、容灾或者开发测试。
部分存储厂商声称他们的存储阵列可以提供CDM功能。虽然许多存储阵列可以在同一存储系统或平台内创建节省空间的虚拟副本(快照或克隆),但是通常缺乏丰富的数据服务,如应用数据一致性备份,基于策略的自动化,容灾和提供给应用程序开发人员的自动化工具等,不能发挥副本数据的更大价值。而且,存储阵列原生的虚拟副本功能往往局限于该厂商提供的存储系统内部,不支持第三方存储阵列,因此限制了降低副本数据存储成本的能力。缺乏丰富的数据服务和缺乏异构的存储系统支持是导致这些阵列产品不符合Gartner CDM产品定义的原因。
还有部分备份软件厂商声称他们的产品支持CDM。虽然统一的备份/容灾是CDM的关键应用场景,备份软件提供比存储克隆更丰富的数据服务,但传统备份软件通常依赖基于存储的快照功能或基于主机的Near-CDP技术来生成更多、粒度更细的恢复时间点(RPO),远超定时备份。定时备份(通常是基于代理的),基于快照的备份或近乎实时的数据复制通常是单独获取生产数据的独立流程和工作负载。这些单独的进程生成的副本通常不能交叉通过重复数据删除和压缩技术处理以提高存储利用率。传统的备份软件也以专有的备份格式存储数据副本,而不是以原生磁盘格式以支持副本数据即时访问能力。由于上述原因,许多备份软件产品不符合Gartner的CDM定义。
AnyBackup CDM 7.0将自己在备份容灾领域积累的经验和自研的副本数据存储系统有效的结合,能保证应用数据的一致性,实现基于策略的自动化、容灾和提供给应用程序开发人员的自动化工具,并且支持异构的存储,实现真正意义上的CDM。
AnyBackup CDM系统架构基于Gartner定义设计
副本数据管理系统架构图如下图所示:
业务逻辑层
数据保护:将用户生产业务系统的数据通过原生格式数据捕获技术,按照特定的SLA策略,通过数据访问接口,存储到ESSS存储系统中。
SLA框架:提供基于SLA(服务等级协议)策略驱动的副本数据管理架构。
副本管理:提供副本数据管理功能,包括虚拟副本的创建、挂载、克隆、数据恢复、清理等操作。
数据复制:将存储在ESSS中的副本数据按照SLA策略在不同特性、不同地域的存储池之间实现数据转移。
数据访问层
ESSS按照标准的数据访问协议对外开放的数据访问接口,当前支持iSCSI、FC、NFS。
ESSS:基于软件定义的存储系统,通过存储虚拟化技术,把底层的物理存储资源池化,形成契合副本数据管理业务需求的存储池(如性能优化的快照池,存储效率优化的重删池等),而不关心存储资源类型和提供方式。对外提供存储卷管理、快照、克隆等功能。
物理存储层
ESSS的底层存储资源,AnyBackup CDM 7.0副本数据实际的存储位置。广泛支持DAS(包括SSD,HDD)、SAN(包括IP-SAN,FC-SAN)、对象存储等。
使用原生接口保障数据一致性
AnyBackup CDM 7.0利用应用原生备份接口获取具有一致性保障的应用数据,如针对Oracle,利用Oracle RMAN来保障备份数据库数据的一致性;针对VMware虚拟化,利用VMware Snapshot技术来保障备份虚拟机数据的一致性;对于Windows平台的应用及虚拟化,如SQL Server、Exchange、Hyper-V,利用VSS来保证应用数据的一致性
即时挂载技术提供急速的恢复速度
AnyBackup CDM 7通过存储虚拟化技术和快照技术对副本数据进行管理。首先将磁盘进行虚拟化,通过池化的方式将所有磁盘存储资源进行管理,形成契合副本数据管理业务需求的存储池(当前支持的存储池类型有快照池和重删池),然后动态从存储池中分配出一个个虚拟卷,提供给副本数据管理任务使用。同时,结合无限快照技术,满足副本数据历史时间点保留及使用的需求。
即时挂载本质上将指定副本数据历史点时间快照的快照通过iSCSI或FC数据访问协议提供给主机访问,该过程中不涉及到原始数据的移动,亦不会改变指定副本数据历史时间点点快照,因此,一份副本数据(基于时间点的快照)可以通过生成多份虚拟数据,同时挂载给多个不同的主机使用,以满足快速恢复、开发/测试、分析查询等不同的业务需求。
虚克隆技术解决多副本使用的场景
虚克隆是AnyBackup CDM 7.0提供有别于即时挂载的副本数据访问方式。虚克隆基于指定时间点的备份数据集(快照时间点)生成克隆卷,通过指定的SAN协议(如iSCSI-SAN或FC-SAN)映射LUN到目标主机,在目标主机上可直接访问备份数据集。虚克隆操作会生成一份全新的备份数据副本,并且与原时间点备份数据集完全独立。主要用于企业内部要求基于独立的副本搭建开发测试环境的场景。

数据脱敏保障了数据安全
AnyBackup CDM 7.0提供的副本数据管理接口,结合企业内部的脚本或第三方数据脱敏工具,对副本数据进行处理,以屏蔽敏感数据。通过这些控制措施,客户不仅可以加速以数据主导的流程,加强信息治理,同时保护数据免遭泄露和盗取。