服务器 频道

选型宝典:如何挑选重复数据删除产品

    【IT168 专稿】"重复数据删除"技术之所以受到越来越多的关注,其实原因很简单:可以消除传统备份技术衍生出的重复存储数据问题,进而为企业节省成本,而这些技术特色又恰巧符合了现今IT行业大力提倡的节能环保理念。今天我们不过多的讨论有关此技术的成因、技术实现步骤,而把重点放在企业应该如何应用这一技术上,并且该如何选择支持这类技术的存储设备。

    一、设备选型前的规划

    首先需要注意的是,重复数据删除技术是一项在应用之前必须做好规划的技术。重复数据删除设备都有其支持的数据压缩对象,以及擅长的备份策略说明,因此在设备选型要先考虑一些问题:你应该在哪个存储层上实施重复数据删除、应该针对哪种类型的数据、应该压缩哪种类型的数据等,以此来确定对相应设备的选择。

    比如昆腾的重复数据删除产品DXi3500/DXi5500系列,就比较适合数据中心存储环境,想通过重复数据删除技术来将现有存储容量扩大,而且想消除通过网络执行远程备份时,一再传送重复数据而造成的带宽浪费的应用,产品示意如图1所示。

    图1 昆腾重复数据删除产品

    DXi3500/DXi5500系列产品通过光纤通道或iSCSI连接,作为NAS挂载点或虚拟磁带库与备份软件相连,并且可以通过其集成的软件层来完成监测、报警和诊断等辅助任务。此款产品比较大的亮点就是:无论作为标准NAS备份目标,还是常见的VTL接口,DXi系列设备都兼容所有主流备份应用产品,而无需用户改变当前备份方法或架构。

    二、关于重复数据删除比率

    其次,在选择支持此技术的存储设备时,还要注意对"重复数据删除比率"参数值的理性认识。几乎所有重复数据删除产品厂商都会强调自己可以达到多高的重复数据删除比率,有些甚至将此比率标到了500:1。但事实上,重复数据删除比率完全取决于数据的类型和备份策略,跟技术本身的关联并不大。因此,比较不同产品之间的重复数据删除比率其实是没有意义的,更不能借此来判别产品的优劣。

    比如SEPATON的DeltaStor重复数据删除设备S2100-ES2(如图2所示),它的重复数据删除比率为25:1,看似不高但其支持的数据类型及备份策略是比较丰富的。它能够通过删除主路径外的重复数据,维持高达每小时17.2TB的备份及恢复性能;并且它配套的DeltaStor 软件所能处理的备份集合大小没有限制,一台设备的容量可扩展至50PB,这是它的亮点之一。此设备另一亮点就是具有较好的扩展性,它可以把一个3TB的备份保留时间从一周延长到6个月。

    图2 S2100-ES2设备
 

    三、对重复数据删除处理方式的选择

    重复数据删除技术依据数据处理方式的不同,分为备份与重复数据删除同时执行的在线处理,以及备份完成后执行重复数据删除的后处理两种。有人说在线处理方式好,可以提高效率;而有人说后处理方式好,可以不用担心性能和可靠性的问题。其实,这两种处理方式都可以兼有,关键是你所选择的设备如何来平衡本地处理和远程处理的性能。

    比如飞康FDS重复数据删除管理器系列(如图3所示),就同时提供远程复制与主机式备份两种进阶功能。但它却是一系列产品的整合,包括内含硬盘的储存服务器、应用服务器+磁盘阵列或单纯的网关器等。当你要实施远程复制时,由于数据在送上网前,已先由备份服务器的主机式备份功能进行了处理,因此消除了备份服务器到存储系统间的传输瓶颈,使得整个在线处理过程变得可靠和安全。

    图3 飞康FDS产品

    四、对产品成本的考虑

    有很多成本方面的问题要注意。例如:产品的某些特性(不管它是备份应用能力,还是硬件设备中的"添加"特性)有没有附加费用?需要升级到更高的版本或机型吗?即使重复数据删除能力是产品(硬件或软件)中的标准配置,部署它是否存在其他隐含的费用?(例如,需要额外的网络、服务器或存储资源等。)

    比如,戴尔公司的DL2000磁带产品(如图4所示),它使用的是CommVault Simpana 8软件,可针对正在备份或归档的数据提供次文件级的重复数据删除。DL2000是一个目标端,数据在这里被重复数据删除,然后被存储在与其相连的磁盘阵列或磁带设备上。因此选择这类以软件方式支持重复数据删除技术的产品,在成本上当然有优势。

    图4 DL2000磁带产品

    基于软件的重复数据删除的部署成本要明显低于专用硬件,但是,基于软件的重复数据删除在安装中更容易中断运行,维护也更加困难。所以在考虑部署成本而选择这类产品时,不可忽略它的运行稳定性。比如EMC公司的Avamar软件产品就一般预置在EMC硬件内,它也可以作为EMC NetWorker备份的可选插件以便提供重复数据删除功能。Avamar软件虽然采用的是中央管理模式来检查整个网络中的数据,但实际上,在数据送到备份存储平台之前,在每个服务器上都进行了重复删除处理。它既可以节省备份目标所需的存储空间,也可以减轻网络阻塞。

    五、小结

    虽然有专家宣称,至少在包括备份、归档在内的数据保护领域,重复数据删除的时代已经到来。但企业在考虑部署此类存储结构时,还是应该更多的了解自己的备份环境和需求,评估厂商和他们的产品,检查其他用户对他们的评价。最重要的是,在几个备份周期上利用自己的数据测试他们的产品。避免在对技术本身了解不够、欠缺全盘考虑的情况下便贸然部署重复数据删除方案,否则结果会不如预期,甚至付出比省下的磁盘还要高的成本,因小失大、得不偿失。

0
相关文章