服务器 频道

美国stratus公司:容错服务器的简单理解

  【IT168 资讯】美国stratus容错公司出品的容错服务器是一种可以实现零时间停机的服务器,在一些关键性领域里应用非常广泛,例如:电信、机场、银行、冶金行业、安全、医院的HIS系统、电视台、公安、电力行业、大的零售业,等一切要求高可用性的行业,

  这类用户以前在没有办法的情况下选用的是高可用性集群,英文原文为High Availability Cluster, 简称双机HA Cluster,是指以减少服务中断(宕机)时间为目的的服务器集群技术,简称双机,这种方式实现起来非常复杂,后期维护成本也很高,对技术人员的依赖也非常严重,而且因为cluster不能实现0时间停机(消除单点故障的集群可用性是99.99%),所以他的设计目标是减少停机时间而不是避免停机时间,而容错服务器设计上就是避免停机,高可用性的时间是99.9998%,如果2个方案价格相当,您选择减少停机还是选择避免停机的服务器呢?

  容错的优势

  容错服务器的几点优势简单说说!(主要是和双机的区别说一下)

  1:国际著名检测组织IDC公布:容错服务器的高可用性是99.9998%,而消除单点故障的集群是99.99%,IBM的大型机为99.995%

  2:设计上容错的目标是避免停机,而集群是减少停机(当我们有避免停机的方案,我们为什么还要选择减少停机的方案呢?)

  3:容错能有效的保护动态数据不丢失,而双机只能保证写入硬盘的数据;

  4:容错能支持热插拔任意的硬件,包括主板,CPU等关键性硬件,

  5:布置非常简单,只需要装单套系统,数据库也只需要一套,免去双机软件和研发代码的麻烦,从而大大的减少工程师的工作量,也大大的减少了软件成本.

  6:速度比同配置的双机要快20%以上.

  7:后期维护成本几乎为零,而双机的话需要工程师的支持,或许由于系统补丁的升级需要额外的研发双机代码来保证系统的切换成功;

  8:容错是没有切换时间的,而双机由于硬件宕机后会发生停顿的情况,还有就是双机切换工作是有可能不成功的.

  9.容错的windows系统因为有容错揪错芯片,所以容错的windows系统比传统的windows系统稳定,也许您用很多年都不需要重起windows,因为它永远和刚开机一样快,容错因此承诺容错的windows比IBM的AIX还稳定.因为您用上了容错就不知道什么叫停机.

  上面说了很多与双机对比的优势,下面我们通过案例来实际了解容错到底有多好:

  典型比较案例

  下面是刚做好的系统由人工触发故障,集中观察切换时间和数据丢失的情况.

测试环境:硬件:
Two Compaq ML530 PC server, includes one CPU (P III XEON 933Mhz), 512MB memory, one hard disk , two network card, CDRom driver, one fiber channel card (connect to storage switch) ;
One 12port fiber channel switch;
One Compaq RA4100 fiber channel storage , include 3 hard disks .
One heart beat cable (cross network cable), three fiber cables, two network cables, 6 port Hub.
One ftServer 3200 server, includes one CPU (P III 800Mhz), 1GB memory, 4 hard disks(config as mirror)
软件:
Windows 2000 advance server version;SQL2000 Enterprise version.
One SQL script running on a notebook client under DOS.
比较项目
ftServer 3200
ML530 Cluster
切换时间(秒)
0
58
丢失数据行
0
5

 

 

 

 

 

 

 

  由上述结果可见在ftServer上没有任何的切换时间以及数据的丢失,而在集群系统中则产生了58秒的切换时间和5行的丢失数据。需要强调的是,测试用的SQL脚本是非常简单的,仅有4行语句。在实际环境当中所运行的程序远比此脚本复杂得多,所以万一发生故障时所需的切换时间远不止58秒,丢失的数据也远远大于5行。在关键部门的应用当中,这是致命的和不可接受的。

  4410和6210可以安装VMware ESX,然后在这个虚拟机上面安装多个操作系统,使不同的应用互相不影响,而多个系统同样达到0时间停机的目的. 从而使使用方成本减少到最低.

    本文转自:http://blog.sina.com.cn/s/blog_5bab206d0100dxaa.html

0
相关文章