服务器 频道

HP DL980 G7在8路服务器架起“立交桥”

  关键业务系统,稳定当先

  对于八路服务器这样的关键业务系统来说,高可靠、高可用等RAS特性同样是用户极为看重的考量因素。

  从至强7500开始,英特尔已经在芯片设计中加入了20多条RAS特性,通过错误检测与抑制、多层冗余、系统恢复、故障预测分析、电气隔离等技术,大大提高了x86服务器的数据完整性、系统可用性和可服务性。HP DL980 G7则在此基础上,通过HP PREMA架构进一步提高了大型x86服务器的可靠性,真正实现了“PC服务器的价格,小型机的性能与稳定性”。

关键业务系统,稳定当先

  在上述的HP PREMA架构中,虽然通过两个控制器也可以构建起高效的八路系统,但为了增加高可用性,DL980一共使用了4个XNC控制器,以实现链路的冗余。而且当某个节点控制器被过度使用时,它还提供动态路由功能,自动把流量分给空闲的链路,从而避免性能瓶颈,提高带宽使用率。这样一来,就象大家熟悉的集群系统或双机热备方案一样,增加了节点之间的负载均衡与容错,不同的是,HP PREMA架构把这些机制在芯片层面得以实现。我们知道,大多数无节点控制器的8路系统只有4个互连链路,HP PREMA架构则增加到了6个,提供了多出50%的互连链路,因此不仅能增加互连带宽,提高系统性能,而且显著减少了出现互连链路故障情况下的宕机时间。

  另外,HP PREMA 架构还整合了链路级的重试功能,可重新传输数据和备用线路 I/O,确认数据传输是否完整、数据完整性是否受损,并在链路出现故障时添加弹性路径。随着大服务器里使用的内存条数量增多,使得因为内存出错导致系统宕机的风险也随之增加。借助英特尔至强E7的支持,与使用单设备数据纠正 (SDDC) 技术的至强7500系统相比,通过使用双设备数据纠正技术 (DDDC),DL980可以修复一个和两个DRAM设备内存硬件错误,这一特性预计能够将系统内存崩溃故障减少 10 倍,从而大大提高了系统的在线时间。另外,内存更换数量也提高了17倍,据统计,内存年度现场可替换单元维修率(DIMM annual field replaceable unit repair rate)从之前与电源、风扇相当的水平降低到了比电缆还要低的水准。

  其他增强的RAS特性还包括机器校验架构(MAC)、增强的MCA日志、增强的操作系统可用性、热插拔RAID、高级内存保护等,这一些系列技术的采用,使得DL980拥有了“自愈恢复能力”,能获得更长的应用程序正常运行时间(MTBF)。

0
相关文章