服务器 频道

超算机效率飙升 仍与百亿亿次相去甚远

  【IT168 资讯】严格来说,目前的科技成果不能帮助超级计算机行业在新的十年之内实现百亿亿次性能目标;但愈发强大的GPU与x86协处理器让超算设备更具能源效率,至少就最新Green500榜单来看是如此。

  Green500榜单每年发布两到三次,通常紧随年度超算性能五百强之后。最新一份性能五百强榜单于之前的德国国际超级计算大会正式公布,其中囊括了各类超级计算机在Linpack Fortran矩阵数学基准测试中跑出的连续性能。

  Green500榜单由弗吉尼亚理工大学的冯武春与Kirk Cameron共同整理,以性能五百强数据为依据、但同时添加了由全球高性能计算实验室所提交的研究结果。Green500榜单的关注重点在于超级计算设备在运行Linpack测量时的能源利用效率。

  IBM的Power架构纯CPU BlueGene/Q大规模并行超级计算机多年来一直位居Green500榜单前列,但随着CPU-GPU混合方案的不断兴盛以及至强-至强Phi设备的崛起,“蓝色基因”的传统优势已经消失殆尽。随着能源利用效率的不断提高,榜单上的好名次被这些后起之秀逐步瓜分。在最近的这份2013年6月榜单上,由Eurotech创建的两台CPU-GPU设备明显压倒其它BlueGene/Q设备。去年11月的榜单上,由克雷与Appro创建的至强-至强Phi混合型设备也宣告胜出--但当时的优势并不明显。

  此次评选出的能源利用率最高的超级计算机是来自意大利Cineca的“Eurora”设备,它并非单纯将英特尔至强CPU与英伟达Tesla K20 GPU相结合,而是使用了一款特制的英伟达Telsa K20X GPU,且配置一块专门的工作站级八核心至强E5-2687W处理器负责驱动两块K20X GPU.

  E5-2687W的性能不容小觑,作为一款设计功率为150瓦的处理器、其主频高达3.1GHz,强劲表现令人印象深刻。作为专为双插槽设备设计的计算方案,这块处理器在I/O及内存容量方面超过了目前的“Ivy Bridge”及“Haswell”单插槽至强E3-1200芯片。更重要的是,如果大家希望在能效方面做出妥协来进一步催动处理性能,那么双插槽设计完全可以容纳另一块E5-2687W芯片。

  颇具讽刺意味的是,这套单高热高速CPU加双高热高速离散GPU协处理器的组合竟然帮助Eurora获得了3209百万次浮点运算的出色每瓦性能。在单机架体系中,这台设备仅能提供110万亿次持续性能。别看处理能力不算拔尖,但这台设备却堪称中端高性能计算系统中的佼佼者。而且Eurotech肯定乐于为愿意掏钱的客户打造一台包括九机架、整体性能达3.1千万亿次的强劲计算机。

  来自瑞士Selex ES的设备与Eurora非常相似,基于同样来自Eurotech的Aurora Tigon服务器。它也采用工作站级至强处理器及特制Tesla K20X GPU协处理器,在Linpack测试中每瓦性能为3180百万次。

  Aurora Tigon服务器(Tigon一词由tiger与lion结合而成)属于自主研发的刀片服务器,能够容纳两块至强处理器与两块嵌入式K20X GPU.由于利用金属板设计替代传统散热片,水冷系统可与之直接契合以完成热量疏散。如果散热效率得到提高,用户可以进一步催动其运转速率、从而获得更强大的浮点运算能力。在本次Green500调查进行的Linpack测试当中,该设备只启用了一块至强处理器。

  本次位列第三名的是去年11月Green500榜单的冠军,身处美国田纳西州大学的“Beacon”混合设备。这是一台克雷/Appro设备,配备标准化至强E5处理器与至强Phi 5110P协处理器,每瓦性能为2450百万次。

  绰号“Sanam”的设备是榜单上的新面孔,它拥有两台至强E5处理器外加AMD FirePro S10000独立显卡,每瓦性能为2351百万次。

  紧随其后的则是一字排开的六台BlueGene/Q设备,它们以低配方案服务于多个高性能计算实验室,且每瓦性能皆为2299百万次。而来自美国能源部劳伦斯·利弗莫尔国家实验室的两台规模更大的设备“Vulcan”与“Sequoia”则以每瓦2177百万次的浮点运算成绩屈居同门兄弟之后。

  本次超算性能五百强冠军,由中国政府专为航空航天及物理研究打造的天河二号超级计算机拥有33.86千万亿次持续运算性能,采用至强与至强phi计算元素相结合的混合方案。但由于其每瓦性能只有1902百万次,因此只在Green500榜单中排得31位。

  Green500榜单中各位选手之间的能源利用率差距非常大,居于榜单200位左右的设备跟前几名相比甚至差出了一个数量级。在榜单末尾,设备的每瓦性能仅达到40到50百万次。这一尴尬的数字来自至强5600或者皓龙6100处理器加之速度缓慢的InfiniBand或者以太网互连机制的“弱弱组合”.

  企业用户大约是在五年前才开始创建属于自己的超级计算机,尽管从当时的角度看纯CPU设备的能源利用率还说得过去,但对于需要使用某些加速机制并重建代码的使用者来说、功率范畴已经成了一个无法回避的问题。而且到2020年,我们很可能仍然无法利用20到25兆瓦电力实现百亿亿次级别的运算性能。

  但必须看到,目前我们已经取得了一些进展,也收到了一定回报。

  如果大家将去年11月的冠军Beacon利用CPU及x86协处理器技术进行性能强化,那么整体设备功率将达到408兆瓦。但如果我们将Eurora设备的性能提升为1百亿亿次,则整体功耗为312兆瓦。没错,能源消耗降低了24%,但如果我们按照当前的发展速度推算,那么2020年的百亿亿次设备的功率仍将达到42兆瓦。

  能源利用率的发展脚步亟待加快。这可能意味着将互连机制整合到CPU与GPU当中、将主内存直接焊在芯片上以及使用更加智能的光纤网络。目前每人知道我们要怎样才能实现预期目标--事实上更重要的是,我们还不清楚真实世界中的软件是否有能力扩展到如此可怕的性能巨兽当中。

0
相关文章