【IT168 专稿】在以前我们的几篇报道中,我们分别就目前HPC产业的整体发展,HPC面临的主要问题以及这些问题背后所透露的原因症结做了反思和梳理。通过这些分析我们发现IT巨头英特尔在推动高性能计算上有着值得称道的表现,其SSG部门为用户排忧解难还是最新的至强5500处理器给HPC带来优异的计算性能都证实着TOP 500排名所证不虚——500台超级计算机中有402台选择了英特尔至强系列处理器。
那么,为何这么多超级计算机会采用英特尔至强系列处理器呢?面向高性能计算的服务器又应该符合哪些标准?让我们先从高性能计算的主要特点和应用进行简单的分析:
高性能计算环境中的应用需求分析
首先因为是要面对计算密集型的HPC应用,因此其对各节点处理器的计算性能、以及整体节点的计算密度要求很高——所以一般高性能计算机都是以刀片服务器为节点组成的大规模集群。这就又带来了网络互联方面的问题,也就是各机柜之间、各计算节点、乃至各个CPU之间的I/O带宽需要足够大。此外,由于集群部署的整体稳定性要求(其可靠性要求介乎商业应用和互联网应用之间),高性能计算机各节点的散热、整体布局以及应用类似Loadmanager等集群部署工具实现高密度部署。
此外,比较重要的一点是计算节点的功耗问题,在当前经济环境下,很多对高性能计算有业务需求的用户都希望能缩减这方面的投入,而机房的硬性电费成本却很难压缩。因此,考虑到高性能计算对于性能的高要求(包括I/O瓶颈、计算性能、稳定性等)和功耗的节约需求,我们认为基于至强5500处理器的服务器是面向高性能计算的不二之选。原因如下:
英特尔至强5500处理器对高性能计算的价值
英特尔今年3月底最新推出的至强5500处理器,就通过导入最新Nehalem微架构,融入内置多通道内存控制器、睿频加速、超线程、串行高速QPI总线、45纳米制造工艺、智能节能等领先技术,成功达到了这一目标——与上一代至强5400处理器相比,它不但在功耗基本持平的情况下获得了最高达2倍以上的性能提升,而且它的性能输出和电能消耗状态还可以智能地根据应用负载的变化即时在十多级“档位”上切换,或是在运行那些不支持多线程、需要依靠时钟频率提升来提高运行效率的软件时智能地关闭部分内核,将它们消耗的电能转给还在工作的内核,从而在不超出总散热设计功耗(TDP)的情况下提升它们的时钟频率。而这些特性都意味着它可以大大提升HPC系统的性能、计算密度和能效,并能随时随地根据应用负载的变化来节省用电。

这张图显示的是Top500超级计算机中处理器类型的分布情况,在占绝大多数份额的英特尔处理器中,大部分仍然是上一代产品(E54xx系列),但是采用了Nehalem架构的X55xx与E55xx系列也已被多数系统采用(95套系统)
在今年11月最新发布的2009下半年TOP500榜单中,采用了至强5500处理器的超级计算机达到了95套之多,相比6月份的33套,快速增长62套,而英特尔处理器也凭此一举以402套超级计算机的整体份额排行老大(80.4%)。从国内来看,10月底发布的中国HPC TOP100榜单上业内知名的“天河一号”,也采用了这款处理器,而国内排名前十的高性能计算机中有7款采用了至强5500处理器(包括天河一号在内)。不得不说,至强5500除了平衡的设计(计算密集型和内存密集型通吃),其睿频、功耗控制等方面的特性也吸引了现今绝大多数高性能计算的部署者。
由于高性能计算强调高密度与高可靠性,因此在单位面积内尽可能的提升计算密度和保证稳定性就是采购者所面临的问题,通常大家都会将目光投向刀片服务器和1U机架服务器,下面我们主要就目前市场上主打高性能计算的几款产品做个分析。
面向高性能计算的服务器精品导购
1、IBM HS22刀片领军网游高性能计算
提到IBM的高性能计算产品,就不得不提到HS22这款刀片服务器。在今年最新的中国TOP 100排行榜上,前十名中有六台机器清一色使用的都是这款刀片服务器。他们也都是网络游戏运营商,因为网络游戏对高性能计算的需求而组建了超级计算机——不约而同选用IBM HS22的原因又是什么呢?

简单来说,HS22与上一代刀片HS21比较起来,其处理器更新换代为最新的至强5500系列,计算性能相对HS21有2倍以上的提升(得益于直连架构和集成的内存控制器)。另一方面,笔者认为HS22刀片拥有多达4组10Gb以太网和总共8个I/O端口才是其优势所在。其8个万兆交换所带来的负载均衡极大的满足了高性能计算的延迟问题。这也是众多网络游戏公司选择它的原因之一。另一方面HS22凭借至强5500出色的功耗控制,在效能比上优势明显,对运营成本很敏感的网游公司自然也会考虑这方面因素。
2、轻巧而强大Dell R410专为高性能计算而生
戴尔的产品一直以来都有其独到之处,Dell R410凭借至强5500处理器的超强性能和戴尔本身对系统带宽的良好把控——DDR3内存的采用以及可选的多种网络接入方式,使得R410相比上一代产品性能提升了80%。另一方面,预装的戴尔管理控制台(DMC)和戴尔生命周期管理器可以帮助管理者简化原先繁琐的管理流程。

戴尔大中华区公共事业部解决方案总监王珊女士表示,客户在构建高性能计算基础架构时的需求除了性能外,主要集中在以下几个方面:简易性、成本和可扩展性。戴尔将最简单的1U机架服务器做成高性能计算节点,一方面就是从管理和维护的简易性去考虑,另一方面是从成本来考虑的——相比刀片要便宜很多。而相比刀片服务器的高密度环境来说,R410拥有者更灵活的扩展空间,单位功耗上也要比刀片低得多。
3、HP DL360 G6强调容错与冗余备份
如果说至强5500是为高性能计算而生,那么HP DL360 G6就是为至强5500而设计的一款集高密度计算、基本容错和HP Insight Control于一体的1U机架服务器。惠普用18根内存插槽配合双路至强5500处理器,最多可以打造一个144GB寄存式内存的强大计算环境。网络方面惠普采用了带TCP/IP卸载引擎的双端口多功能千兆网卡,与其智能阵列配合,使得DL360 G6在硬盘I/O和网络I/O上都不会出现瓶颈。

在做科学计算或复杂的工程运算时,用户难以承受系统在运算过程中出错——那意味着前功尽弃。HP DL360 G6以冗余风扇+冗余电源的双冗余备份设计以及智能阵列RAID控制器的便携式电池允许将高速缓存写入另一台服务器中做冗余备份,大大降低了在高性能计算中因为一个节点宕机造成的损失。
4、五大优势 曙光I610r-G可担大任
I610r-G相比上一代产品主要在处理器、芯片组和内存方面有所升级,因而上市之初就被认为是未来云计算、高性能计算的节点组成部分。其五大优势主要是:“高性能”、“高可靠性”、“高可扩展性”、“高可管理性”以及“高性价比”。

高性能自然毋庸置疑,双路至强5500保证了1U机架内的计算密度,而12根内存槽也保证了最大96GB的海量内存配置。高可靠性方面,I610r-G主要是拥有BIOS保护恢复、网卡自动切换、电源自检报警等功能,使得系统从底层BIOS到上层网络任何一方面出现问题,都可以及时转移工作负载,不会影响使用。扩展性和管理性方面,I610r-G可以扩展1个颁告的PCI-E x16的扩展卡和一个全高的PCI-E x8的扩展卡,并且由于集成了曙光智能硬件监控系统,其内部电流、风扇转速等都可以得到监控和调整,方便了管理员在高性能计算集群中对某一节点的单独调整。
5、挖掘联想深腾7000背后的节点
今年国内的TOP 100排行榜上,联想深腾7000超级计算机,以145.2万亿次的计算速度排名第三。但是由于联想的策略和深腾7000在中科院超算中心的应用较机密。我们并不能在联想官方网站上看到有关深腾7000节点的有关信息。不过我们知道,深腾7000的主要计算节点是深腾B714R刀片服务器,7U高度的刀片机箱内部可以插14片双路计算刀片,也就是一个42U的标准机柜内,最多可以装84个计算刀片,接近672个计算核心。

据联想展示的资料表示,深腾B714R刀片服务器可以支持双路至强5500处理器,而深腾7000超级计算机中的节点则只采用了至强5400处理器——当时还未推出至强5500。除了对最新处理器的支持外,深腾B714R拥有转换效率达93%的高效电源,且所有模块全部支持热插拔,关键部件,如网络模块、电源模块也配备了冗余。
6、浪潮天梭TS30000 以实力说明问题
浪潮的天梭TS30000一经推出就先后 6次打破SPECjAppServer应用性能测试、SPECpower节能测试、TPC-E数据库性能测试等全球权威测试纪录。这也是在早先使用至强5400处理器时的情况,现在的TS30000已经可以支持最新的至强5500处理器,其高速QPI互联完全消除了北桥和处理器之间的带宽瓶颈,浪潮认为其系统带宽至少提高了50%以上。

另一方面,TS30000去年通过了OVM测试,其整个测试是对包含数据库、操作系统、服务器、存储产品在内的综合平台进行测试,强调了系统性、严酷性和高仿真性,而浪潮TS30000划分了8个虚拟机顺利通过了这些测试,等同于是经受住了8次Oracle VC的测试考验(详见:浪潮天梭新测试数据库也能虚拟化)。
结语
除了以上所提六款不同厂商面向高性能计算推出的服务器产品以外,还有一些“非主流”产品值得一提。如曙光推出的PHPC个人高性能计算机,宝德推出的双子星/四子星高密度机架服务器,也有惠普推出的Tesla个人图形工作站。而另一方面,类似“天河一号”的GPU+CPU混合架构也正在高性能计算领域兴起,如浪潮倚天系列服务器,近期就得到了中科院北京基因组研究所的青睐,预计其单机性能可以达到4万亿次/秒。总的来说,创新和定制化是目前高性能计算的发展方向,而用户的实际应用需求才是真正驱使高性能计算进步的原动力。