【IT168 服务器频道】之前谈到过Windows Server 2008的七个应用场景,其中很重要的一个就是高可用性,也许有人会说,在Windows Server 2003中也有关于高可用的特性,比如群集、网络负载均衡、灾难恢复等。既然作为Server 2008一个重要的应用场景,高可用性的改进和变化自然也是很大的,到底会有怎样的变化呢?
首先我们要明确,什么是可用性,可用性包括可靠性、故障和恢复。一个系统的可靠性,故障发生时间间隔和故障恢复速度,共同决定了这个系统的可用性。那么我们通常都如何来衡量一个系统的可用性呢?最常用的方法就是使用数字"9",通常我们会以几个"9"来说明系统的可用性,让我们看看下面这张表吧:

通过这张表,我们不难发现,要做到3个"9"级别的系统可用性,每年只允许我们有8.77个小时的停机时间。当然,可用性是只能用"9",而不可能用"8"或者"7"来衡量的。一个系统的高可用性,需要很多方面共同实现,如硬件、网络、操作系统、应用层面都需要有相应的高可用解决方案,在操作系统层面上,微软的Windows Server已经为我们提供了很好的高可用解决方案:Cluster(群集,一种并行或分布式的系统,由全面互连的计算机集合组成,可以作为一个统一的计算机资源使用)。
相信很多人都已经了解了Windows Server的群集,我就不再详细解释什么是群集,如何实现群集了,主要想谈一谈Windows Server 2008中群集的变化。首先,最明显、最直观的就是名称的变化,群集在Windows NT4时代就已经有了,那是叫做Microsoft Cluster Services(MSCS),到了Windows 2000时代,改叫做Server Clustering,而在Windows Server 2008中,群集有了个更为形象的名称,Failover Clustering(WSFC),我觉得名字起的很形象,Fail-服务器故障了,Over-转移到其它机器上,正好叫做Failover。当然,名称的改进是不会对企业用户有很大实际意义的,那就让我来看看它在技术上的改进吧。
在这里我还是想讨论一下高可用性方案对企业用户的价值,我们经常说,或者经常会听到各个厂商说,高可用方案能够降低TCO,可很多企业都对这个有所质疑,本来一台服务器能完成的工作,现在需要购买额外的服务器,明明硬件成本、维护成本甚至人员成本都增加了,怎么还能降低TCO呢?那就让我们回想去年发生的一件事情吧,那是2007年的10月底的一天,时值2008年奥运会门票第二阶段发售之日,记得当时的售票策略是先到先得,于是乎,在发售门票开始时,便有成千上万乃至上百万的用户蜂拥到奥运门票销售网站,霎时间网站就因为并发连接过大而无法响应了。在那之后的一天时间里,服务器也没能恢复正常工作,以至于后来不得不改变了门票的分配方式。我想这件事情大家可能都了解,也许是售票系统的软件设计问题,也许是硬件性能的问题,总之这套售票系统既不可靠,还发生了故障,而且没能恢复,可用性的三大方面一项也没满足,自然谈不上高可用啦。那么我们想一想,没有高可用带来的损失吧,要知道奥运可是当前我们伟大祖国的大事,而且也是全世界瞩目的大事,在如此之大的事情上出现了这么重大的失误,我想这件事造成的损失很难用几千、几万的钱来衡量了,如果当初高可用方案做得很好,当然也就没有损失了,甚至可能带来很高的信誉。由此可见,高可用性方案决不是只会给企业增加成本的,而是真正的降低了企业面临的风险,降低了TCO。
既然看到了高可用性的价值所在,让我们来看看Windows Server 2008故障转移群集还带给了我们哪些惊喜吧。(未完待续)
来源:http://space.zdnet.com.cn/html/71/289371-29045.html
作者:林麟