服务器 频道

与RISC争雄 Nehalem-EX催生八路X86市场

  【IT168 专稿如果说2010年X86服务器市场最大的看点是什么?无疑是四路以上的企业级服务器。在这个领域,我们会迎来一个堪称革命性的全新平台:英特尔八核Nehalem-EX(至强7500)。3月底,该平台就将正式发布,以取代2008年9月发布的六核至强7400系列(代号Dunnington)。

  3月3日,英特尔在北京举办了智能计算媒体鉴证会。英特尔(中国)有限公司服务器产品事业部产品经理顾凡谈到,Nehalem-EX最大的看点并不只是高达3倍的性能提升,而是在可靠性和可扩展性方面的增强,这些改进使得Nehalem-EX会催生一个全新的八路及八路以上X86服务器市场,并将在数据库、ERP等关键业务领域和大规模虚拟化整合领域冲击传统RISC阵营。

  据了解,以六核至强7400相比,虽然仍然使用45纳米工艺,但Nehalem-EX的架构发生了重大变革,包括:1)使用QPI总线,取代前端总线架构,最多拥有4条QPI Link;2)集成DDR3内存控制器,有4个内存通道接口,通过设置外置缓冲芯片,每处理器还可最多支持16条内存;3)拥有8个内核;4)采用超线程技术,每CPU可实现16个线程并行;5)23亿个晶体管,L3缓存由16MB提升到24MB。光看这些规格数据就让人咋舌,据称其数据库性能最高可以达到3倍。

  不过,在这次沟通会上,顾凡没有谈更多的性能测试数据,而是重点阐述了Nehalem-EX在可扩展性和RAS(可靠性、可用性和可服务性)特性方面的表现。由于这类高端服务器主要面向银行、电信等行业的ERP、数据库、大规模虚拟化整合等应用,并要吸引传统小型机用户,其可扩展性和可用性比性能更为关键。

  22项RAS特性 让X86系统更可靠

  确实如此,对于那些想从小型机转向X86开放平台的用户来说,性能往往不是问题,考虑更多的是X86服务器能否达到小机那样的稳定性和安全性。

  对此,顾凡谈到,至强7500整个平台中的RAS功能将有20多条。这些特性技术集中解决三个方面的问题:一是数据保护,可以诊断哪些数据出错,利用一些CRC、ECC校验来纠正错误,如果不能纠正,可以把这些坏的数据进行隔离,以保证不影响其他数据,避免系统的重启和宕机。二是高可用设计,包括QPI Link之间的互备和热切换,内存和CPU的热切换、故障预警机制等等,以保证系统的高可用。三是降低系统计划内的宕机时间,包括系统分区管理技术、CPU和内存的热添加和热删除等。具体如下表所示:

至强7500的22项RAS功能
数据保护技术
Parity checking and ECC
Memory Themal Throttling
Memory demand & patrol scrubbing
Corrupt data containment
QPI viral mode
QPI rolling CRC
高可用技术
Intel SMI Lane Failover
Intel SMI Clock Fail Over
Intel SMI & QPI Packet Retry
QPI Clock Fail Over
QPI Self-Healing
SDDC plus random bit error recovery
Memory Mirroring
Memory DIMM and Rank Spaning
Dynamic CPU and memory migration
MCA-recovery with OS support
减少计划宕机时间
Static system partitioning
MCA error logging(CMCI) with OS predictive failure analysis
Physical Memory Board Hot Add/remove
Dynamic/OS Memory On-lining(capacity change)
Physical CPU Board Hot Add/remove
OS CPU on-lining(capacity change)

  顾凡认为,至强7500已经拥有X86系统里较高级别的RAS特性,而且与小型机、大型机相比,差距也已经不大。

  在操作系统和虚拟化方面,目前Novell、Redhat、微软和VMware都已经做好准备,为至强7500中的高级RAS特性提供支持,以保证可以将这些功能提供给上层的应用软件使用。比如,今天,很多用户还只是在服务器上做一些前端应用的虚拟化整合,但在至强7500平台上,由于更高的RAS特性,可以做更高端、更核心的应用整合。

  可扩展性:至强7500催生八路市场

  2007年,8路以上的IA架构服务器还只有IBM、NEC和Unisys在提供,而到了今年,这一阵营将扩大到近十个,除了上述三家,还包括SGI、惠普、富士通、浪潮、布尔、Sun等。

  顾凡谈到,得益于至强7500中的4个QPI接口,今天服务器厂商可以非常容易地通过QPI构建出一套八路系统出来,有些厂商还可以通过自身的节点控制器技术最多扩展到32路。预计至强7500发布时全球会有8个OEM厂商推出15款八路和八路以上的系统。

  不过,他也表示,在构建八路以上服务器系统时,至强7500仍然给服务器厂商提供了较大的创新空间,各厂商可以根据自身能力和市场策略来选择。主要体现在两个方面:一是在架构创新方面,可以直接使用QPI来连接构建一个成本适中的八路系统,也有的厂商使用自己的节点控制器,用到的协议和最终效率都会不同。二是虽然至强7500提供了二三十个RAS功能,但并不是所有厂商都需要或者有能力去实现这些功能,比如硬件分区、CPU热添加/热删除、内存板的热添加/热删除,不同厂商会有各自的考虑。

  实际上,就在3月3日同一天,IBM公司就在北京举行了其新一代企业级X架构eX5的发布,正是为配合Nehalem-EX设计的。据称为这一代架构,IBM先后投入了8亿美元,产生了MAX5内存扩展技术、eXFlash固态存储技术、FlexNode节点组合设计、I/O虚拟化技术等一系列创新,可以将双路、四路、八路服务器的内存容量提高一倍。其他厂商在企业级X86服务器方面如何动作,我们拭目以待。

  可扩展性:内存如何跟上处理器步伐

  在扩展性方面,还值得一提的是,今天处理器的发展已经够快,但在很多应用中,内存往往显得不足,成为瓶颈。在内存方面,区别于至强5500,Nehalem-EX中内存控制器的带宽会更高,连接数也更多。一颗Nehalem-EX处理器可以支持16根DIMM条(四路系统共有64个DIMM),并且在内存控制器和内存之间设置了一个芯片,起到缓冲的作用。其实就相当于把过去FB-DIMM内存上的缓冲芯片集中起来放到一个桥接芯片中,达到一种平衡,既要节省一部分能耗,又要保证过去FB-DIMM带来的好处,提高内存容量,保证内存工作主频和带宽不降低。顾凡表示,这种技术只用在了至强7500和安腾平台上,在至强5500、至强5600中没有。

  此外,Nehalem-EX不仅有支持四路以上的至强7500,也会有支持双路系统的至强6500,打破了过去单路、双路、四路的简单划分。对此,也是考虑到了部分应用对于大容量内存扩展的需求。

  比如,有一些高性能计算用户只需要两颗处理器,但需要极大的内存带宽和I/O带宽,过去的双路服务器提供不了这么大的内存,无奈之举是买台配两颗CPU的四路服务器,但由于四路服务器售价高出许多,从而造成了投资浪费。为此,英特尔在新一代的Nehalem-EX中,提供了至强6500的双路平台,可以满足这些内存密集型用户的需要。

  实际上,不光是英特尔,一些OEM厂商也已经注意到了这一点,特别是随着虚拟化、数据交易等应用的发展,对大内存的需求越来越多。比如,思科在去年推出的UCS刀片服务器中,就通过内存扩展技术将一台双路至强5500刀片的可用内存插槽做到了48个之多,从而可以支持多一倍的虚拟机(参见:突破虚拟化瓶颈 思科UCS刀片服务器)。今年IBM在其针对Nehalem-EX的eX5架构中,也使用了类似的名为MAX5的内存扩展技术,可以将一台双路的x3690 X5的内存插槽数做到最多64个(参见:重新定义x86服务器 IBM eX5架构揭秘 )。

  与RISC争雄 八路至强服务器蓄势待发

  过去,由于八路服务器的设计和制造困难,售价往往比普通四路服务器高出几倍,技术也只掌握在IBM等少数几个厂商手中,从而限制了八路系统的需求。而随着至强7500的到来,由于无须第三方厂商的节点控制器技术,通过QPI连接就可以轻松构建八路,预计未来八路与四路的售价比例的格局会被打破。

  因此,相信会有一部分四路服务器用户选择升级到八路系统,但英特尔不满足于此,更关键的是要借此从RISC厂商手中抢一部分用户。实际上,RISC阵营也在反击X86的挑战。如IBM的小型机部门已经感受到了X86的冲击,在今年的POWER7发布会上,IBM就大量使用了POWER7与Nehalem双路平台的对比测试数据。对此,顾凡表示,过去十年,整个RISC系统的出货量都在降低,而X86系统一直处于主动进攻的位置,而且目前全球服务器装机量95%以上都是X86,拥有广泛的软件生态系统,这种生命力是非X86系统所无法比拟的。

  不过,这个问题似乎没有正确答案,就象IBM同时拥有POWER小型机业务和System x X86服务器业务一样,英特尔今天也有至强和安腾两条线,都会面临“内部竞争”这样的尴尬。随着Nehalem-EX往高端走,市场上会有越来越多的X86服务器进入关键应用领域,那与英特尔的非X86平台安腾(Tukwila)系列如何区隔呢?

  顾凡表示,在性能、可靠性和扩展性方面,至强7500和安腾都具备在关键业务计算领域内的能力,两者的关键不同在于客户对操作系统和可用应用软件的选择,甚至包含对OEM厂商的选择。用户可以从这三个方面来选择安腾或者至强7500,比如要用HP-UX或者一些大机操作系统的用户,当然选安腾,而对于Windows和LINUX应用则推荐至强7500。

0
相关文章