服务器 频道

HPC 2012大会:E级计算的挑战与思考

        【IT168 资讯】2012年10月29-31日,由中国计算机学会主办、中国软件行业协会数学软件分会协办、中国计算机学会高性能专业委员会、国家超级计算长沙中心、湖南大学共同承办的 “2012年全国高性能 计算学术年会”(HPC China 2012)在湖南省张家界阳光酒店召开。本次大会上将举办CCF学科前沿讲习班,还邀请了国际高性能计算咨询委员会的中国高性能计算研讨会(HPC Advisory Council)的加盟。此外,会议期间还将举办“大数据论坛”、“并行计算教育论坛”、“超级/云计算中心论坛”。

  并行计算是实现高性能计算的主要技术手段,E级计算是高性能计算领域的下一个目标,如今却面临访存、通信、可靠性、能耗等挑战。在今日上午举办的HPC 2012大会中,中国科学院院士、国防科技技术大学校长杨学军教授,为我们分享了关于《E级计算的挑战与思考》的话题。

高性能计算发展迅猛
中国科学院院士、国防科技技术大学校长杨学军教授

  高性能计算发展迅猛

  在2010年11月,由我国自主研制的“天河一号”超级计算机在全球TOP500排名中,以实测速度2.566千万亿次位居世界靠前,而在次年的6月,日本的超级计算机K-Computer以8.162千万亿次取得TOP500的第一名。可以看到,全球的高性能计算的发展非常之迅猛。

高性能计算发展迅猛
2010年“天河一号”超级计算机业内知名

  据悉,高性能计算机的计算速度每十年提高一千倍,所以,E级计算,已经成为了超级计算机领域的下一个发展目标,而大规模应用也表现出了对超高的E级计算能力的强烈需求(如下)。

  • 高能/核物理

  • 材料/化学

  • 生命科学

  • 航空宇宙计算

  • 飓风预测

${PageNumber}

  E级计算面临的挑战

  挑战一:访存墙问题

  • 访存墙问题仍然是提升计算速度的第一大难题。

  • 处理器的处理速度和访存速度之间的不匹配。

  • 处理器单个引脚的信号、传输速度与引脚数受限。

  • 多核处理器的出现只是提高了计算速度,不但没有缓解访存墙问题,反而使得其更加严重。

  • 科学问题:最优的存储结构是什么?访存的优化缺少定量的指导准则,目前的研究只能验证准则。

  挑战二:通信墙问题

  随着超级计算机规模的不断增加,互联网对计算性能的影响也越来越大。而E级计算对互联网提出了更高的要求。互联网已成为制约超级计算机发展的核心因素之一。

  挑战三:可靠性问题

  当系统性能由P级向E级扩展时,保存全局检查点的时间可能达到甚至超过系统的MTBF。

  挑战四:能耗墙问题

  ITRS估计高性能CUP的功耗将达到120-200W。

E级计算面临的挑战
并行计算的可扩展性

  此外,杨学军教授还指出,我们建立了并行计算的扩展性的度量模型,定量建模了访存、通信墙、可靠性、能耗等对E级计算的影响。通过定量分析,发现和研究了并行计算向更高性能发展面临的可扩展性“墙”。

0
相关文章