数据复制是一种实现数据分布的方法,就是指把一个系统中的数据通过网络分布到另外一个或者多个地理位置不同的系统中,以适应可伸缩组织的需要、减轻主服务器的工作负荷和提高数据的使用效率。数据复制的过程类似于报纸杂志的出版过程,即把信息从信息源迅速传送到信息接收处。对于用户而言,选择合适的数据复制架构就成了提高复制销率的的关键。
目前数据复制的主要分为三种:基于存储阵列(Storage-Based);基于交换机(SAN-Based);基于主机(Host-Based)。下面我们就来说说目前的三种数据复制架构。
一.基于存储阵列(Storage-Based)
磁盘阵列是把多个磁盘组成一个阵列,当作单一磁盘使用,它将数据以分段(striping)的方式存储在不同的硬盘中,存取数据时,阵列中的相关磁盘一起动作,大幅减低数据的存取时间,同时有更佳的空间利用率。磁盘阵列所利用的不同的技术,称为RAID level,不同的level针对不同的系统及应用,以解决数据安全的问题。
一般高性能的磁盘阵列都是以硬件的形式来达成,进一步的把磁盘快取控制及磁盘阵列结合在一个控制器(RAID controler)或控制卡上,针对不同的用户解决人们对磁盘输出入系统的四大要求:
(1)增加存取速度
(2)容错(fault tolerance),即安全性
(3)有效的利用磁盘空间
(4)尽量的平衡cpu,内存及磁盘的性能差异,提高电脑的整体工作性能。
目前业界有两种基本的基于磁盘系统得远程拷贝形式:
同步PPRC远程拷贝:同步远程拷贝能够在远地点提供最新程度的数据当前值,但应用程序会因等待写I/O操作的完成而被延迟。
异步PPRC远程拷贝:异步远程拷贝对应用程序性能的影响最小,但远程磁盘系统在数据最新性方面与本地系统相比会有一个延迟。
下面分别对两种方案中IBM在线存储产品的实施方法加以简要介绍
同步PPRC数据级灾难备份方案:IBM的PPRC提供了实现灾难备份的反感基础。PPRC全称PeertoPeerRemoteCopy,是以存储为基础的、实时的、与应用无关的数据远程镜像功能。PPRC实现较为简单,是无数据丢失且具有完全恢复功能的灾难恢复解决方案。
异步PPRC数据级灾难备份方案:为了提高PPRC数据备份方案的效率,可以考虑结合IBM公司的FlashCopy功能软件采用异步方式实现PPRC数据备份。在异步工作方式下,PPRC能够在远端更新未完成的情况下,只要本地更新成功就可以向主机返回“写成功”信号。好处是:可以在主备机房之间数据链路带宽成为瓶颈时,采用异步方式可以不影响主机房生产系统的性能。坏处是:1. 数据将有可能丢失;2. 当异步同步不能最终成功完成的情况下,数据的一致性无法得到保证。
二.基于交换机(SAN-Based) SAN存储指的是通过一个单独的网络(通常是高速光纤网络)把存储设备和挂在TCP/IP局域网上的服务器群相连。当有海量数据的存取要求时,数据可以通过存储区域网在相关服务器和后台存储设备之间高速传输。简单的说,SAN就是一个用于存储的全新的网络。SAN以光纤通道(FC)为基础,实现了存储设备的共享;突破现有的距离限制和容量限制;服务器通过存储网络直接同存储设备交换数据,释放了宝贵的LAN资源。 SAN存储具有6大功能特点: 在基于SAN的数据复制解决方案中,我想介绍下Brocade的Tapestry DMM。它以博科的智能SAN网络应用平台AP7420为硬件平台加上核心软件组成。DMM复制数据的最小单位是数据卷,对于存储阵列来讲是一个LUN,它可以将一台存储阵列上的LUN复制到SAN网络中任何一台存储阵列上去。由于DMM不工作在主机层面上,因此它做数据复制对主机透明,即不需要主机控制也不消耗主机资源,从而将主机从数据复制的负荷中解放出来,无论是主机上的文件系统还是数据库裸设备,其操作方式完全相同。 由于DMM的硬件平台是智能SAN的网络应用平台AP7420,因此AP7420对多协议的支持进一步增强了DMM的功能,使DMM不仅可以在SAN网络内部做数据复制,而且可以通过AP7420对FCRS(光纤通道路由服务)的支持进行不同SAN网络之间的数据复制,并且通过使用FCIP协议,未来更可以实现跨广域网的数据复制和远程数据复制。 三.基于主机(Host-Based) 基于主机的数据复制容灾方式工作在主机的卷管理器这一层,通过磁盘卷的镜像或复制,实现数据的容灾。这种方式也不需要在两边采用同样的存储设备,具有极大的灵活性,但复制功能会多少占用一些主机的CPU资源,对主机的性能有一定的影响。因此,这种方法的可扩充性较差,实际运行的性能不是很好。基于主机的方法也有可能影响到系统的稳定性和安全性,因为有可能导致不经意间越权访问到受保护的数据。 OpenView存储镜像(Storage Mirroring,SM)是基于主机的软件,通过局域网和广域网进行远程数据复制。SM软件的运行环境是Windows2000/NT操作系统。利用SM,远程办事处可以复制到中央存储中心,或异步IP网络复制,以及一对多和多对一的方式。SM具有自动切换步骤,能实现基于文件/字节层次的数据复制、时间调度复制等,实现高效率。它支持微软集群,并配置了带宽使用计划工具和带宽分配管理,使用户可以轻松管理文件复制所占用的贷款比例,保证应用的进行。SM可以对任何应用写到磁盘的数据进行复制,能够实现多个拷贝,用户可以使用任何IP网络,能够充分降低运作成本。HP OpenView SM面向的应用包括文件、打印服务、电子邮件服务以及Web服务等。 |
三种构架的比较总结
基于主机复制技术
基于主机实现,需要主机的CPU资源,同时由于TCP/IP的传输效率低于FC通道的效率,所以对系统的性能影响较大。同时该模式只支持特定的操作系统,所以当客户有其他的应用系统,还需要另外的解决方案。这样,管理比较复杂,在软件上还需要巨大的投资。基于主机实现的复制,不能满足项目技术要求中的“在某一时刻作一个数据的备份”要求。另外若通过原有的TCP/IP网络实现,可能会产生严重丢包的情况,并且性能较差。
但基于主机的复制,常常被应用于规模较小的存储环境内。它的成本较低,即使将软件许可费、硬件设备、服务费用一并算上,价格也只有高端的基于存储器的复制系统的几分之一。所以它的客户群多数是一些初期存储用户或手头预算不充足的小规模型企业,并且也多用于一个部门内部的使用。
基于磁盘复制技术
这种技术对于主机的操作系统是完全透明的,对于将来增加新的操作平台,可不用增加任何复制软件的投资,即可完成实现复制。这样管理比较简单,最大程度保护了用户的投资,达到充分利用资源的目的。基于存储的复制一般都是采ATM或光纤通道做为远端的链路连接,不经可以做到异步复制,更可以做到同步复制,使两端数据可做到实时同步的目的,保证了数据的一致性。
但由于基于存储是由存储硬件厂商提供的,在兼容性方面有局限性。用户要使用同一厂商的devices,给用户造成的选择面太小,成本容易提高,并且对线路带宽的要求通常也较高。对于那些预算还算充足,存储环境不是很复杂的中小型企业来说,选择基于存储的技术还是适合的。
基于交换机复制技术
SAN-Based作为一个较新的技术,在企业级的应用上,不管是销售商或者是在设计架构的时候都比较流行采用的一种。随着各家厂商都在竭力推出SAN存储的优秀产品,包括光纤通道(FC)技术的日益成熟,现在已经渐渐步入了4Gb/s的时代,再加上可以在不同平台上进行replication等等,好处之多注定了SAN存储的前途光明。尽管它的价格一直是有目共睹的偏高,但想想他数据复制的高性能,高可靠性,如果对数据传输速率要求高并且预算不算少的话还是主推基于SAN存储。