【IT168 评论】在德国莱比锡举行的2013国际超级计算大会(ISC2013)上,世界超级计算机TOP500组织正式发布了第41届世界超级计算机500强排名。由解放军国防科技大学研制的天河二号超级计算机系统,以理论峰值计算速度每秒5.49亿亿次、Linpack计算速度每秒3.39亿亿次双精度浮点运算的优异性能位居榜首。这是继2010年11月天河一号首次夺冠之后,中国超级计算机再次夺冠,标志着中国超算计算机的水平再一次跃上了新的高峰。
根据世界超级计算机TOP500组织公布的资料显示,天河二号超级计算机位于国家超算中心广州中心,系统由170个机柜组成,包括125个计算机柜、8个服务机柜、13个通信机柜和24个存储机柜,占地面积720平方米,内存总容量1400万亿字节,存储总容量12400万亿字节,最大运行功耗17.8兆瓦。
从天河一号A到天河二号,中国超算3年实现两步走
本次负责研发天河二号的依然是国防科技大学,他们曾研发过天河一号、天河一号A等超级计算机,对于超级计算机的设计有着深刻的理解。在天河二号研发过程中,广大科研人员奋力攻关,突破了一系列核心关键技术。天河二号工程副总指挥李楠研究员提出了五大特点——:一是高性能,峰值速度和持续速度都创造了新的世界纪录。二是低能耗,能效比为每瓦特19亿次,达到了世界先进水平。三是应用广,主打科学工程计算,兼顾了云计算。四是易使用,创新发展了异构融合体系结构,提高了软件兼容性和易编程性。五是性价比高。
天河二号的成功不仅彰显了中国在超级计算机自主研发领域的实力,也向世界宣布中国已经成为国际顶尖的超级计算机强国。谈到天河二号的优势,世界TOP500组织专家、美国田纳西大学杰克·唐加拉教授说:“天河二号与美国的‘泰坦’大小相当,速度却是它的两倍,制造这样强大的系统需要很强的技术。”德国尤利希科学中心的塞巴斯第安·施密特教授说:“天河二号是世界最好的计算机之一,它有着非常出色的表现。”日本筑波大学参加过“京”系统研制的大介博库教授说:“这是一部非常紧凑的机器,具有巅峰的性能表现,它真的是技术上的很大进步”。
广州超级计算中心先导系统技术负责人卢泽新研究员说,天河二号具有强大的计算能力,以500人规模的全基因组信息关联性分析为例,华大基因利用原有计算机需1年时间,利用天河二号只需3个小时。在新车研发中,采用传统设计手段,一般要经过上百次的真实碰撞实验,历时两年多才能完成一款新车的结构设计,而利用天河二号对汽车碰撞模拟和空气动力学模拟结果,只需3到5次实车碰撞,两个月即可完成任务。
天河二号工程总指挥、总设计师廖湘科研究员说:一切源于瞄准国际前沿的自主创新,是自主创新推动了中国超算的跨越式发展。
天河二号配置揭秘,强大性能得益于自主研发
相比上一代的天河一号A,天河二号采用了全新的设计方式——天河1A系统采用Arch网卡与两块双插槽至强处理器,二者位于整体计算模块顶端,两块通过PCI-Express 2.0 x16与处理器对接的英伟达Tesla卡则位于模块底部;在天河二号方面,Arch互连体系与两个Ivy Bridge-EP节点似乎被安置在同一块电路板上。计算节点与至强Phi协处理器共同瓜分了机架空间——左侧空间归计算节点、右侧则容纳五块至强Phi协处理器,且二者都可以单独抽出。
除此之外,国防科技大学在天河二号的设计过程中还研发出一种名为“水平软百叶推拉结构”的先进设计方案。它通过计算节点一侧的电路板拥有分布均匀的连接装置、能够与另一侧经过调整的至强Phi 3000系列卡后端严密契合。只需解开锁扣,这些连接件就会打开、工作人员可以根据实际需要拉开某一半支架并实施设备维护,大大简化的操作,提高了运维效率。
与天河一号A的设计类似,天河二号也采用了自主开发的Sparc类集群。国防科技大学创建了自己的Sparc芯片衍生方案,也就是Galaxy FT-1500——该芯片拥有六核心、主频为1.8GHz,采用40纳米制程技术、功率约为65瓦,且能够提供1440亿次双精度浮点运算性能。Galaxy FT-1500是当前国内主频最高的自主高性能通用CPU。天河二号还在高速互连、新型层次式加速存储架构、容错设计与故障管理、综合化能效控制、高密度高精度结构工艺等方面取得了一系列创新和突破。天河二号设备在节点中采用了4096块此类处理器,其总体运算能力为590万亿次。
在网络的连接方式上,天河二号采用了Arch互连机制,也就是大家耳熟能详的TH Expresss-2。Arch互连机制的核心是一台高Radix路由器,正如英特尔的“Gemini”以及“Aries”互连一样;另外,Aries也同样采用以电线实现短途跳步、以光纤实现远途跳步的综合性方案,也是国防科技大学的专有协议。
坚持可持续发展,天河二号采用全新环保模式
在世界超级计算机TOP500组织公布的数据中,天河二号最大运行功耗17.8兆瓦,而美国的泰坦最大运行功耗为8.2兆瓦,考虑到两者在性能上存在2倍以上的差距,应此能耗比相当。但是在占地面积方面,天河二号相比泰坦降低了15%,也就是在单位密度方面的表现更为出色。
如果相比3年前我国最强大的天河一号A超级计算机,天河二号计算性能和计算密度均提升了10倍以上,能效比提升了2倍,二者占地面积相当,但天河二号执行相同计算任务的耗电量只有天河一号A的三分之一。
如果在低功耗模式下,天河二号的功率为17.4兆瓦,其全封闭水冷系统则能够应对24兆瓦工作模式的巨大发热——冷却过程产生的废水将被用于为广州市供暖。
正如国防科技大学计算机学院政委刘学民所说:“把五星红旗插上世界科技高峰,是‘天河人’始终追逐的超算梦。”如今,天河二号的再次问鼎TOP500冠军成就了几代中国超级计算机研究者的梦想,中国人再一次站到了超级计算机世界冠军的领奖台上。对此,中科院软件所并行软件与计算科学实验室常务副主任、计算机科学国家重点实验室研究员张云泉博士表示——天河二号荣膺TOP500榜首标志着中美在超级计算机排行榜平均性能的差距正在逐步缩小,甚至已经接近。