服务器 频道

IBM的三种异地容灾方案(图)

    【IT168 专稿】在前一篇中我们介绍数据容灾的重要性和相关技术,从中了解到了数据容灾与我们常见的数据备份是两个不完全等同的概念。在数据容灾中最常采用,也是最有效的方案是异地容灾。这种容灾方案最有保障,因为它是把数据备份保存在另一地方,甚至另一个国家,这样数据就会更安全。试想一下在伊拉克这样连成战争不断的国家,即使把数据保存在了本国其它地方也是不安全的,所以有许多数据存储厂商提出了全球容灾的方案。从本篇起要向大家介绍几个典型的数据存储厂商的异地容灾方案,本篇所介绍的是全球最为著名的数据存储厂商——IBM的几种异地容灾方案。

    针对不同的用户需求,IBM公司的异地容灾方案产品线非常丰富,各种数据备份技术和应用方案层出不穷,处于全球领先地位。它的这些容灾方案不可能全在本文中介绍清楚,所以只选三个常见的方案类型向大家介绍。

    一、数据级灾备——PPRC

    IBM的PPRC(Peer to Peer Remote Copy,点对占点远程复制)复制技术是基于ESS企业级数据存储服务器,通过ESCON(Enterprise Systems Connection,企业管理系统连接,是一种光纤通道)通道建立配对的逻辑卷容灾技术。这是IBM的较高级别容灾方案,主要适用于大、中型和电信企业选用。它的网络结构(如图1所示)。

图1(点击看大图)

    在图中数据中心A和数据中心B可以是两相隔上百公里的网络系统,既可以单独把某个数据中心的数据备份到另一个远程数据中心中,也可以实现相互远程备份。

    在标准的实时备份方案中,服务器主机通过SANIBM企业存储服务器ESS相连接,两台ESS之间通过ESCON通道实现同步远程拷贝。受ESCON传输距离的限制,当主、备机房的距离超过2公里时,需要加光纤延伸器。光纤延伸器可以从多个不同的厂商购得,比如IBM 2029 Fibre Saver、INRANGE的9801等。在光纤延伸器的帮助下,PPRC数据备份可达到100公里以上。

    在这种容灾方案中,核心设备就是IBM的ESS的企业级存储服务器,目前最新的型号主要有IBM TotalStorage Enterprise Storage Server (ESS) Model 750/800这两种,(如图2所示)。

图2(点击看大图)

    ESS 800型企业级存储服务器支持IBM的多种Windows、UNIX、NetWare等服务器平台之间的存储共享,通过双RISC架构SMP处理器、大容量高速缓存和串行磁盘连接提供出众的性能;使用冗余的硬件、镜像映射的写高速缓存和RAID-5及RAID-10级别的磁盘阵列技术保护支持关键业务应用程序的高可用性。对通过ESCON、FICON、光纤通道、2GB光纤通道/FICON或Ultra SCSI连接的主机支持快速率的数据传输;通过Web浏览器、CLI(命令行界面)或者通过使用ESS API来提供高效、集中的操作管理;使拥有不同种类主机的企业不仅能升至55.9TB的物理磁盘容量,同时能保持最优性能。

    对于这种方案中可能用到的SAN交换机在前面已有了这方面的产品介绍,在此不再赘述。不过要注意的是,在IBM的这些容灾方案中都要求全套设备最好采用IBM自己的,所以在这种容灾方案中的SAN交换机也需要选择IBM自己的。在IBM中提供多种不同档次的SAN交换机产品,如F08/16/32、M12等机型,可以全面满足各类企业需求。

    PPRC容灾方案能够自动将源卷上的数据同步到目标卷,实现以存储为基础的、实时的、与应用无关的数据远程镜像功能,可根据需要选择同步或异步方式。PPRC实现较为简单,纯粹基于硬件,是无数据丢失且具有完全恢复功能的灾难恢复解决方案,需要两个中心均配置IBM的ESS存储服务器。

    在同步方式下,PPRC将确保如果备份卷不能被更新,那么即使源卷更新成功,整个写操作也会返回失败——彻底保证源卷和目的卷的数据一致。同步方式可以保证数据完全不丢失和很好一致性保证。数据的一致性非常重要,特别是对于系统和数据库中的数据,不一致的数据无法保证数据的安全,严重时还可能造成数据库无法启动。但要注意,采用同步复制方式对系统性能有较大影响,特别是当两个数据中心服务器不够强壮时。

    在异步工作方式下,PPRC能够在远端更新未完成的情况下,通过本地更新成功向主机返回“写成功”信号。其好处是: 在主备机房之间数据链路带宽成为瓶颈时,采用异步方式对数据中心主机房生产系统性能的影响不大。缺点是采取这种方式的数据将有可能丢失。所以当采用异步方式时,IBM建议先采用IBM ESS的快速拷贝功能“FlashCopy”,备份需同步的数据,再进行数据同步。

    PPRC在初始连接时需要建立逻辑卷连接,之后PPRC会自动同步该逻辑卷。利用此项功能,可以进行ESS之间的数据迁移(PPRC的同步实现机制如图3所示)。

图3(点击看大图)

    图中各步解释如下:
    应用程序将数据写入ESS服务器磁盘;
    生产系统中的磁盘数据传输到远程备份磁盘;
    备份磁盘复制生产系统数据;
    将写完操作信息返给生产磁盘,生产系统应用继续执行。

    二、应用级灾备——HAGEO

    IBM的HAGEO(High Availability Geography)的缩写,是IBM AIX平台最优秀的实时灾难备份软件。我们知道,前面介绍的PPRC方案主要是通过硬件来实现的,而此处的HAGEO方案则主要是通过软件实现的,相对来说比较经济,但对硬件的配置也比较苛刻。

    这种备份方案理论上对备份中心距离没有限制,利用IP网络,不需要专用光纤;对应用程序、数据库类型和存储设备类型都是透明的,即在HAGEO下应用程序不需修改。但性能较以上介绍的PPRC方案差些,适用于中型企业选用。

    HAGEO可以为客户的数据和应用提供同步实时镜像,其中增强型同步(MWC)模式可以提供数据的原始性和一致性,同时HAGEO也提供异步模式。HAGEO和应用程序紧密结合,不仅仅实现数据的实时镜像,同时也可以实现应用的自动接管,大大减少了灾难发生时手工操作。HAGEO可以做到零数据丢失,灾难恢复时间一般在半个小时左右(指应用恢复)。

    目前最为主流的HAGEO异地容灾方案是基于RS/6000平台的,在这种HAGEO环境中,每个交易或任务完成之前,系统都会通过远程网络,先完成生产系统和备份系统的数据更新,保障数据实时一致性。并且像HACMP双机备份一样,提供故障检测和自动实时恢复功能。HACMP是IBM RS/6000平台上的高可用软件,它解决了本地多个服务器之间的互相备份问题。HAGEO将HACMP的功能在地理位置上作了延伸,将HACMP的优势扩展到广域网上,从而提供了一个很好的远程备份解决方案。

    IBM HAGEO容灾方案的基本设想是:生产环境是两台RS/6000服务器(如图4所示),组成一个本地的双机热备环境。当本地的一台服务器发生故障时,应用会自动切换到本地另外一台服务器上。在备份地点,由一台RS/6000服务器作为备份服务器。当生产环境中的两台服务器都不能工作时,备份地点的服务器自动启动应用,恢复正常的生产环境,(如图5所示)。 

图4(点击看大图)

图5(点击看大图)

    连接两地的网络带宽应大于2MB,以确保两地备份服务器数据同步,具体所采用的网络连接方式可以多样,如专线方式的DDN、T3、互联网宽带接入等。如果应用对I/O的写请求很多,应提高网络带宽,以保证系统的整体性能不受影响。客户端如何访问服务器也是在做方案时需要考虑的一个重要因素。注意,HAGEO方案只能负责到(服务器)系统这一层,在灾难发生后,客户端如何访问备份中心,这一点需要在网络整体设计时加以考虑。

    三、NAS容灾方案

    虽然NAS方案大家都觉得不如SAN,但它的廉价特性(它是采用传统的IP技术),在目前来说SAN还是无法比拟的,特别是对于中小型企业。针对全国性机构数据集中实时数据复制与灾害备援需求,IBM采用NAS,LTO技术及NSI Software Double-Take 数据同步方案,为全国性机构地市级节点以及省级中心节点提供基于NAS存储平台的数据同步解决方案,以最经济的方式达到备援的目的,并保证系统的高可用性。

    该方案对于全国性机构地市级节点的数据通过现有的网络连接,占用最少的网络资源,在第一时间将数据文件以增量的方式传送至省级中心节点。同时也可实现省级中心节点向地市级节点的数据发送。并且在每个地市级节点还可以实现两台NAS存储设备之间的数据实时同步以及系统的灾难备援。并且在磁盘介质备份的基础上,可进一步实现磁盘到磁带的数据备份,以充分满足数据的安全与可用性。其中一种利用公网进行省级与市级数据中心数据通信的网络结构(如图6所示)。

图6(点击看大图)

    1. 省级数据中心

    省级中心采用NAS300(如图7所示)系列或更高级的NAS500存储服务器,它上面的数据与各地市级NAS200系列(如图8所示)上数据通过Double Take软件即时或定时保持同步,为公司提供准确的营业数据。地市级中心数据可通过T3、DDN、WAN等连接方式向省级中心进行实时或定时数据同步,充分利用各种网络资源并最小化投资与运营成本。 

图7(点击看大图)

图8(点击看大图)

    基于 I/O 网络流量的多少,IBM NAS Gateway 300可以支持每单位1000个以上基于IP的客户机。要为每个用户提供足够的存储容量,最多可分配22TB的存储量。NAS300兼容IBM企业存储服务器(ESS)、FAStT200、FAStT500、FAStT700和其它供应商提供的设备。IBM NAS Gateway 300 预装了 Tivoli SANergy软件,该软件使用户能通过较高的吞吐量但较低的开销以文件、卷和字节级别访问SAN 中的存储设备。通过它而在IP客户机与SAN之间建立的高性能链接有助于利用两个网络中的现有投资。

    NAS 200的存储容量在109.2GB到3.52TB之间提供了一条不间断的容量升级路径,允许您“按增长支付”,保护您的投资。而且提供数据保护的多级RAID和高级软件,帮助您确保业务连续性,实现跨平台(Windows [CIFS]、UNIX [NFS]、HTTP、FTP、ApplTalk和NetWare)文件共享,有助于减少网络复杂性和维护费用,允许数据在整个企业内使用。

    省级中心存储数据的NAS存储服务器上安装DoubleTake软件,并同时把它指定为Target端与Source端,一方面完成地市级数据向省级中心同步的功能(Target),另一方面可以实现省级中心向地市级数据中心下发数据的需要(Source)。

    在省级中心NAS300存储设备上连接IBM LTO系列磁带设备以实现数据的双重备份与保护。建议客户在省级数据中心安装Double Take Console控制台软件,以管理本省及下属地市Double Take Source and Target的工作。

    2. 地市级数据中心

    地市级数据中心NAS服务器上数据通过Double Take 软件即时或定时与省级中心NAS服务器保持同步,在正常运行状态下业务数据NAS1与管理数据NAS2分开。但NAS1与NAS2可互为备援,当故障产生时,NAS1或NAS2可接替对方工作从而保证数据的高可用性。

    地市级中心数据可通过T3、DDN、WAN等连接方式向省级中心进行实时或定时数据同步,这样可以保障地市级的数据的安全性。各地市级存储数据的每台NAS200存储服务器为需要备份数据的服务器。在其上安装Double Take软件,并指定为Target端与Source端,一方面完成地市级数据向省级中心同步的功能(Source),另一方面可以实现地市级中心NAS1与NAS2之间的实时数据同步与相互备援(Target & Source)。 Double Take的管理工作由省级中心完成。

    该方案对应用透明,数据同步由存储系统独立完成,较高提升了系统的可用性与数据的一致性;在数据集中的基础上,TCO整体拥有成本极大降低;实现数据的集中,同步,高可用,备份与备援一体化方案。IBM NAS 产品与 NSI Double-Take 软件的多个模式共同使用,使得用户可以根据自己的环境灵活地选择适合的配置。

    四、编后语

    以上介绍了IBM针对不同企业用户需求推出的三种数据异地容灾方案,它们各有特点。PPRC方案有用的是纯硬件方案,具有最好的数据传输性能,而且适用于几乎所有的主流系统操作平台和IBM的硬件服务器平台,但一般只用于数据备份中心相距数据源公司100公里以内的企业选用。而且投资最大,不是一般企业可以随得起的。HAGEO方案则主要依赖软件,数据传输性能较差,而且是为IBM AIX UNIX服务器专门开发的,但相对来说投资比较低,适用于中型企业选用。对于NAS方案,由于采用的通常是采用公网传输(也可用专线),传输性能最差,但网络使用传统的IP技术,投资最经济,连接距离较广(可在全球范围内),适合于企业总与小型各分支机构之间的数据备份。

0
相关文章