服务器 频道

从CPU、内存和I/O深度理解IA架构服务器

  RAS高级可靠性

  与Nehalem-EP相比,Nehalem-EX最大的创新之处在于高级可靠性方面,更恰当地说应该是RAS(Reliability,Availability和Serviceability,即可靠性,可用性和可维护性),如下图所示。

RAS高级可靠性

图 39 Nehalem-EX RAS

  特别是,所有主要的处理器功能都具有RAS特性,包括QPI RAS,I/O Hub(IOH) RAS,存储器RAS和插座RAS。

  纠错现在使用的是纠正机器检查中断(Corrected Machine Check Interrupts,CMCI)信号。

  另一个RAS技术是机器检查架构恢复(Machine Check Architecture-recovery,MCAr),它是CPU给操作系统报告硬件错误的一种机制,有了MCAr后,就可以从致命系统错误中恢复过来。

  部分功能需要操作系统额外支持,或需要硬件厂商实现和验证。

  这项技术目前仅在Nehalem-EX中含有。

5
相关文章