【IT168 专稿】笔者将要要介绍的是一个真实的方案应用实例,它是华南某高校的IT信息中心的高可用存储方案。在这一方案中,选择了当前主流的SAN存储双机备份方案。我们先来了解这所高校的特点,以及存储要求。
一、高校特点和存储要求
自改革开放以来,我国教育事业也蓬勃发展。各大中院校积极开拓电子化教学方式,校园网络日益完善,电子化在现有教育基础中占有越来越重要的位置。教育形式多样化,各种电子教室、电子化图书馆、校园网络接入和IP校园网极大普及,绝大多数院校实现了每一学生宿舍、每位教师的连接。通过网络,对内普及网络授课,各种学习资料通过网上传播,学生通过网络进行学术讨论等;对外推行网上招生与教学,甚至Internet教学,极大地提高了学校的工作效率和教学质量。
教育电子化的各种方式的基础就是各种多媒体数据,它们在现有的IP校园网络上集中存储,共享与传输。为了能确保学校数据安全和提高数据存储的效率,这所高校希望组建专门的存储中心,对学校订的多媒体数据进行统一存储和管理。而高校网络的最大特点就是用户多,数据量大,应用多种多样。
下面是这所高校与网络有关的一些基本特点和对存储系统的基本要求:
(1)有近两万名学生和几千名教职员工,学校网络除了骨干的教学网外,还有学生宿舍区网和教职工生活区网两大块。总的来说是遍布了学校的每位教职工的家庭和每间学生宿舍,还有大大小小的机房、电子阅览室和图书馆,其网络节点近万个。希望组建的存储中心能为整个校园网用户,特别是骨干教学网提供高性能的数据访问、存储和管理。
(2)存储容量至少在1TB以上,并且具有较大的可扩展空间;
(3)关键设备要有一定冗余配置,以减少单点故障所带来的损失;
(4)可配置RAID 0/1/5等多种阵列模式;
(5)有完善的容错机制,确保存储系统的恒久运行。
(6)能与学校目前主流的多个系统,如Windows、Linux、Solaris系统兼容,支持IA硬件体系结构;
(7)低成本、高性能。
基于这所高校的这些特点,结合这所高校存储系统所需承受的网络负荷实际,最终无奈地选择了SAN方案。因为大家都知道,SAN方案相对NAS来说成本要高出20%左右,但对于这样一个庞大的网络系统,DAS和NAS都是无能为力的,至多是混合型的NAS&SAN,不过在此为了确保高性能,仍选择了单纯的SAN。至于成本方面,SAN方案中也有许多不同的产品可选,如果选择得当,其成本也可得到较大地控制,同时仍可提供SAN的高性能。当然这不是说选择一些二流,甚至杂牌厂商的产品,相反最终选定了全球著名的存储解决方案厂商——IBM。因为在IBM公司中有许多非常性价比非常高的SAN存储方案可选,而且IBM公司的产品质量和性能,甚至服务都是全球有目共睹的,值得信赖。
经过与IBM供应商有关专家的一起分析和评估后,最终决定选择IBM的中低档FAStT200存储方案,SAN交换机选用16口的F16,它具有2Gbps的端口带宽,主要考虑到今后的扩展。为了容错,采取了双机热备份方案,所用服务器是IBM的x系列x255服务器,这是一款最高可配置4个Intel Xeon处理器的工作组服务器,性价比非常高。在双机备份软件方面,采用了目前最为著名的ROSE HA(高可用)软件。
二、ROSE HA方案简介
ROSE HA支持多达6种容错备援模式:双机相互备援(Mutual Backup)、主从式备援(Master/Slave)、双机热备份(Hot Standby)、双网卡,单网段、双网卡、双网段和多主机备援系统。本本中我们选择的是双机热备份模式。当现行工作的主机出现故障时,热备份主机在最短的时间内接替原主机工作继续工作,而不用重新安装系统和任何软件。网络结构如下图所示。
![]() |
| 网络结构图(点击看大图) |
在该高校中采用了x255服务器,F16 SAN交换机,磁盘存储系统为FastT200,组成一个小型SAN光纤网络,各设备均安装有光纤接口并通过光纤线缆或由铜缆通过MIA转接至HUB上。两台业x255服务器和一台FastT200磁盘存储系统构建双机HA模式,即两台服务器通过FC(光纤连线)、Ethernet(以太网)和RS232(串口)进行三方侦测,并可通过FC和Ethernet两种切换的方式进行接管。
通过以上案,可通过TCP/IP网络(Ethernet、PPP、FDDI或ATM)、串行通讯口(RS232)、磁盘阵列(Disk Array)及网络专线(Dedicated Net)互相传递信息,并判断其它主机是否正常运作。备援主机间可仅使用单一路径通讯以节省资源,也可以同时透过多条路径通讯以避免因通讯路径异常而误判。通过ROSE HA软件可侦测网络界面是否畅通,如果网络界面中断则可选择自动改由其它网络界面连接或由其它主机接管;可侦测数据库引擎或其它应用程序(如Firewall),如果数据库引擎意外停止可选择自动重新启动或由其它主机接管;同时还可侦测磁盘或光盘等周边储存介质是否正常,如果周边储存装置停止或断线可由其它主机接管。
可以看出,在这一方案中,ROSE HA在管理方面起着非常重要的作用。虽然Windows 2000 Server和Windows Server 2003系统中也具有双机备份所需的群集功能,但总体来说远不如此处的ROSE HA专业。
1. ROSE HA的基本功能
信息系统的可用性通常在两种情况下会受到影响,一种是系统当机、错误操作和管理引起的异常失败,另一种是由于系统维护和升级,需要安装新的硬件或软件而正常关机。高可靠性软件必须为这两种情况提供不间断的系统服务。ROSE HA高可用性系统的功能主要包括以下几个方面:
软件故障监测与排除
备份和数据保护
管理站能够监视各站点的运行情况,能随时或定时报告系统运行状况,故障能及时报告和告警,并有必要的控制手段
实现错误隔离以及主、备份服务器间的服务切换
2. ROSE HA高可用性系统的构造
在这个系统中,硬件上可采用多网冗余、双高性能服务器系统、磁盘阵列(RAID 0、1、3、5)等种方式来实现冗余高可靠。
在服务器配置方面,包括两种类型的服务器,即运行服务器和备份服务器。运行服务器是指正常情况下提供服务的主机;而备份服务器是当运行服务器提供的服务已不可用时,自动接替运行服务器的工作而不用重新起动系统,而当系统服务器恢复正常后,按照使用者的设定以自动或手动方式将服务切换到运行服务上运行。备份服务器除了在运行服务器出现故障时作为接替运行服务器的服务之用,还可以执行其他应用程序。因此,一台性能配备充分的主机可同时作为某一服务的运行服务器和另一服务的备份服务器使用,即两台运行服务器互为备份。一台主机上面可以运行多个服务,也可作为多个服务的备份服务器。
在网络连接方面,ROSE HA软件系统支持TCP/IP协议,可以在Ethernet、FastEthernet、FDDI和ATM网上运行。而且两台服务器之间还通过私用网传送心跳(HeartBeat)信号,使两台服务器能够相互了解对方的运行情况,这就是ROSE HA系统所称的“私用网”。私用网也可通过RS-232网互连。
另外还有一个公用网,用来提供服务,客户端通过此网路与服务器通信。当两台服务器互为备份时,对于不同的服务,可以用不同的公用网连接到两台服务器。
在这样一个双机备份方案中,当然少不了存储设备。存储设备也有两类,即“自用存储设备”和“共用存储设备”。“自用存储设备”是每台服务器上自已的存储设备,用于存放操作系统软件和其他一些不需要被另一台服务器访问的软件和数据。而“共用存储设备”上的信息可以被两台服务器分别访问,用于存放提供服务所必需的软件和数据。因此,有必要采用硬盘阵列(Disk Array)作为共用存放设备,以保证数据的可靠性和可恢复性,避免和减少由于磁盘故障或错误所造成的损失。
ROSE HA系统除了支持以上的硬件配置外,还支持大多数主流网络操作系统,如新版5.0 ROSE HA除了支持原来的Solaris、SCO UnixWare 和Linux系统外,还开始对Windows 2000 Server提供支持,本高校就选用了相对廉价、通用性较好的Windows系统版本。但要求两台服务器上所安装的操作系统完全一样,包括版本。在数据库软件支持方面也得到了全面支持,其中就包括Oracle、Sybase、Informix等数据库软件。
3. ROSE HA工作原理
系统起动后,ROSE HA首先启动HA MANAGER管理程序,根据高可用性系统的配置结构初始化,然后启动必要的服务和代理程序来监控和管理系统服务。HA代理程序用来监控、监测、诊断和管理硬件软件服务。
代理程序检测到该服务处理于活动状态,HA MANAGER就会认为该服务处于活动状态,HA MANAGER会定时通知后备服务器上的HA MANAGER,使每项服务处于正常。当代理程序检测到某个服务发生故障时,它就通知HA MANAGER管理程序。HA软件首先会重新启动该服务多次(可由用户设定),如果启动不能成功,该服务会由HA转移到后备服务器上。
HA周期性地检测系统硬件的状态,如果硬件发生故障,HA会把与该硬件相关的服务转移到后备服务器上。某项服务发生转移时,HA首先在运行服务器上停止该服务,之后,由备份服务器上的HA在备份服务器上启动该服务。由于停止和启动该服务都需要一定的时间,所以当服务被切换(转移)时,该 服务会有一个短暂的中断,在切换完成后,该服务自动恢复正常运行。
考虑到一些数据库系统(如Oracle、Sybase、Informix等)以及其他一些应用软件(如Domino Server、WWW Server等),ROSE HA在HA管理模块(HA Manager)的基础上,提供了一系列的Agent软件模块。Agent为一个软件监视模块,监控数据库服务或其他应用服务的运行。当运行服务器发生故障时,由Agnet检测到之后,Agent向HA主控软件请求,进行相应的处理动作。
三、选型产品介绍
在以上方案中,该高校全部选用了IBM公司的产品,服务器为其采用IA架构的x系列x255服务器,SAN交换机采用的是工作组级的F16,而磁盘存储系统为部门级的FastT200。下面分别介绍这几款产品。
1. x255服务器
IBM xSeries 255是高性能的4路基于Intel Xeon处理器的服务器,设计用于满足不断增长的商业环境以运行关键商务应用程序。它支持高达360GB 的内部磁盘数据存储容量和多磁带备份功能,使系统扩展和数据备份更加容易。
![]() |
| IBM xSeries 255(点击看大图) |
xSeries 255 服务器可进行灵活地扩展,支持高达12GB的优异可靠ChipkillTM 内存、集成Ultra 160磁盘控制器;集成双通道Ultra 160 SCSI RAID 控制器(可升级至Ultra 320)。另外,最多可扩展到16个托架(包括12个薄型的热插拔驱动器);7个PCI 插槽中有6个是Active PCI-X(热插拔)插槽,轻松扩展系统。xSeries 255 服务器灵活的机械设计特性,可以简单安装或扩展-可以配置为机柜安装或塔型服务器。提供740W电源(2x370W热插拔,冗余),最大支持4个370W电源;9个热插拔变速风扇;支持硬盘,处理器,稳压模块,风扇,电源,内存预测故障分析技术和IBM的光通路诊断技术,全面确保系统的稳定运行。
在这个存储备份方案中,要求x255服务器安装IBM FAStT主机适配器,用于与FastT200磁盘阵列连接。
2. IBM FAStT200
IBM FAStT200是专门为HA高可用及SAN体系而设计的技术存储平台,相对于以往的传统产品具有突出的优势,非常适合中、小型地市分公司数据存储的需要。
![]() |
| IBM FAStT200(点击看大图) |
IBM FAStT200存储服务器为基于Intel的服务器提供了灵活、可承受的存储。FAStT200专为需要外部存储解决方案的组织和部门的服务器而设计,可提供单/双RAID磁盘阵列控制器方案。单控制器模式提供了经济的解决方案;而本文所介绍的高校选择了FAStT200高可用性双活动控制器模式,以确保完全的冗余配置。当存储需求增长时,只需添加IBM FAStT EXP500扩展部件即可方便地扩展存储容量。
FAStT200具有全面的光纤通道主机接口,其中包括光纤通道仲裁环(FC-AL)、光纤通道可交换结构和光纤通道点对点连接接口。驱动器接口为光纤通道仲裁环(FC-AL),进一步确保了磁盘阵列中的磁盘读写性能。FAStT200 HA模式能以双控制器冗余的方式进行双光纤通道主机连接,使用FAStT200存储、光纤交换机F16和EDI HA软件即可方便实现双节点集群。如果把FASt200连接到光纤通道交换机,您能把数据传输到几公里以外的地方。
FAStT200能够把多达10个的光纤通道硬盘驱动器安装到一个3U(EIA部件)空间,支持18、36和73 GB 10000 RPM驱动器和18 GB 15000 RPM驱动器。连接2个FAStT EXP500扩展部件(包含多达20个驱动器)能增加存储容量超过2 TB。
FAStT200可冗余、可热交换部件包括电源和风扇,确保高可用性。FAStT200 HA模式具有双活动RAID控制器,支持透明的故障恢复,进一步增加了可用性。利用多个RAID级别(0、1、3、5和10),FAStT200有帮助于保护有价值的数据并保持商业关键应用程序的启动和运行。
3. F16 SAN交换机
IBM TotalStorage SAN交换机F16提供16端口、2Gbps的中型和企业级存储解决方案,这些解决方案设计为具有公共的体系结构和集成的企业SAN管理能力。IBM SAN交换机得到众多的IBM开放式服务器和存储设备的支持。与Brocade Silkworm 系列交换机的兼容性可支持它与众多的其它厂商的服务器和存储设备的互操作性。
| IBM TotalStorage SAN交换机F16(点击看大图) |
IBM SAN交换机提供将SAN光纤网升至数千设备规模所需的性能、可伸缩性、高可用性和可管理性。F16基于新一代交换机技术,能够与IBM TotalStorage SAN交换机S08和S16型完全互操作。可对可扩展的解决方案进行配置,以满足小到小型工作组,大到超大综合企业存储区域网环境的高性能和可靠性要求。客户可以选择最初在部门和数据中心级别部署独立的SAN光纤网,然后当他们的经验和需求发展并有所变化时,再将这些独立的光纤网互连成大型企业级SAN 。
F16 型交换机支持多台 IBM TotalStorage SAN 交换机 F16、 S16 和 S08 型交换机之间的互连,另外还支持 IBM 和兼容交换机(Brocade SilkWorm 2400、2800 和 3800)之间的互连,这样,可户就可以构建可扩展的核心到边缘 SAN 光纤网络,来支持需要高性能、高可扩展性和高容错能力的电子商务应用以及企业存储管理应用,如存储整合、数据保护、容灾和数据共享。
IBM TotalStorage SAN 交换机使用的是通用端口,当它们与网络端口(F_port)、网络环路端口(FL_port)或扩展端口(E_port)相连时,能够自动判断端口类型。所提供的网络服务包括自身自动发现新设备和基于网络最短路径优先(FSPF)进行动态路径选择,在SAN网络中选择最有效的路由。并且,还可以混合配置短波和长波端口。对于F16型交换机,标准配置是机架安装,但也提供台式安装选项。另外,可以利用热插拔散热风扇和光模块来提高交换机的可用性,附加的电源提供冗余电源和双电源线。
本文所介绍的方案具有典型代表性,各高校可参考。
