【IT168 报道】通过上一篇文章(参见: “稳定杀手”歼灭战),我们明白了NF280是如何通过独特的散热技术消灭“稳定杀手”——过热的。然而,影响服务器稳定的因素并不只有散热不畅一个,一旦关键部件如硬盘、电源、内存等出现问题,引发的数据损失往往无法弥补。作为一款具有“国际品质”的服务器,NF280在设计的时候,充分考虑了这些问题,采用了多种专有设计,对关键部件进行冗余,为关键部件提供了一批具有强大作战能力的“预备役”部队,充分保证了服务器的稳定运行和数据的安全。下面,就让我们一一认识这些“预备役”部队的成员。
点将硬件冗余——电源、风扇、网卡
使用过电脑的人都会有这样的经历,一不小心把电源碰掉,重新启动以后没有来得及保存的数据资料会消失殆尽,再也无从寻找。服务器也同样存在这个情况,要充分保证数据安全,就必须解决电源突然停止工作带来的问题。考虑到这种情况,NF280采用了1+1冗余电源设计,当一个电源因故障停止工作的时候,另一个电源可以自动完成切换,保证服务器持续运行。同时,电源采用了热插拔技术,管理员可以在不停机的情况下,更换出现故障的电源。
NF280在风扇和网卡两个关键部位也采用了硬件冗余。风扇是保证散热的重要组件,NF280在硬盘和CPU之间的位置安装了两排热插拔风扇(如下图所示),如果部分风扇出现故障,其他风扇的运行并不受到影响。
网卡保证了服务器与其他设备之间的数据互联,网卡一旦出现问题,服务器就成了 “信息孤岛”,失去了其所应用的意义。NF280采用了双千兆网卡,两个网卡之间可以实现相互冗余和负载均衡,充分保证了服务器稳定高速的数据传输。
![]() |
| 浪潮英信NF280冗余风扇 |
较高级别的内存保障——内存镜像和内存热备
有数据显示,在所有的因为硬件故障导致的宕机事件中,内存故障的概率最高,而且随着内存容量越来越大,出错可能性更高了,传统的ECC保护已无法满足高数据可靠性的需求。为了确保产品的“国际品质”,浪潮工程师在NF280上采用了业内领先的内存容错技术——内存热备和内存镜像技术(两种技术原理不同,用户可以根据自己的需求进行选择)。
采用内存热备时,做热备份的内存在正常情况下是不使用的,每个内存通道中有一个DIMM通道不被使用,预留为热备内存。芯片组中设置有内存校验错误次数的阈值,即每单位时间发生错误的次数——“容错阈值”,当工作内存的故障次数达到“容错阈值”,系统将主内存数据写入热备内存,当系统检测到两个内存数据一致后,热备内存就代替主内存工作,故障内存被禁用,这样就完成了热备内存接替故障内存工作的任务,有效避免了系统由于内存故障而导致数据丢失或系统当机。当然,做热备的内存容量应大于等于所在通道的最大内存条的容量,以满足内存数据迁移的最大容量需求。
![]() |
| 内存热备示意图 |
使用内存镜像技术时,内存数据有两个拷贝——主内存和镜像内存,两者容量相同。系统工作时会向两个内存中同时写入数据,因此内存数据有两套完整的备份。由于为通道间交叉镜像的方式,每个通道有一套完整的内存数据拷贝。一旦主内存出现故障,镜像内存将替代主内存工作,有效避免了由于内存故障而导致数据丢失。
![]() |
| 内存镜像技术示意图 |
硬盘中的冗余和容错技术——RAID
在计算机系统中,硬盘担任着数据存储的重要职能。但是硬盘中包含大量的高速运转机械装置,因而也是一个高故障的关键部件。保护数据安全的最好方法就是采用RAID技术。
NF280为用户提供多种可以选择的RAID方案,用户可以选择具有较高经济性的零通道RAID方案,也可以采用效率更高的单通道和双通道RAID方案。此外,NF280还支持多种RAID级别:RAID 0、RAID 1、RAID 5、RAID 0+1等,其中尤其值得一提的是浪潮独有的增强型RAID 1技术。
增强型RAID 1以镜像的方式将数据以条带方式分布存储于各硬盘上。换句话说,它结合了RAID-0和RAID-1的优点,提供了2组互为条带级镜像的硬盘。同时,它采用的延展技术提高了吞吐量,并且能够同时从两组镜像的磁盘中读取数据,这样就大大降低了由于两次写操作所造成的吞吐延迟。和RAID 1相比,增强型RAID 1技术不但支持偶数块硬盘的镜像,也支持奇数块硬盘做镜像,大大提升了用户应用的灵活性,使用户的有效投资得到最大化利用。
在这两篇文章中,我们通过对NF280独特的散热系统和应用广泛的冗余技术的了解,明白了NF280凭借什么获得“稳定之王”的美誉。然而,具有高度的稳定性仅仅是NF280一方面的特质,作为一款具有“国际品质”的明星产品,它还具有良好的可管理性和可维护性。关于这一点,我们将在下一篇文章里为您详细讲述。
