【IT168 资讯】2012年10月29-31日,由中国计算机学会主办、中国软件行业协会数学软件分会协办、中国计算机学会高性能专业委员会、国家超级计算长沙中心、湖南大学共同承办的 “2012年全国高性能 计算学术年会”(HPC China 2012)在湖南省张家界阳光酒店召开。本次大会上将举办CCF学科前沿讲习班,还邀请了国际高性能计算咨询委员会的中国高性能计算研讨会(HPC Advisory Council)的加盟。此外,会议期间还将举办“大数据论坛”、“并行计算教育论坛”、“超级/云计算中心论坛”。
并行计算是实现高性能计算的主要技术手段,E级计算是高性能计算领域的下一个目标,如今却面临访存、通信、可靠性、能耗等挑战。在今日上午举办的HPC 2012大会中,中国科学院院士、国防科技技术大学校长杨学军教授,为我们分享了关于《E级计算的挑战与思考》的话题。
高性能计算发展迅猛
在2010年11月,由我国自主研制的“天河一号”超级计算机在全球TOP500排名中,以实测速度2.566千万亿次位居世界靠前,而在次年的6月,日本的超级计算机K-Computer以8.162千万亿次取得TOP500的第一名。可以看到,全球的高性能计算的发展非常之迅猛。
据悉,高性能计算机的计算速度每十年提高一千倍,所以,E级计算,已经成为了超级计算机领域的下一个发展目标,而大规模应用也表现出了对超高的E级计算能力的强烈需求(如下)。
• 高能/核物理
• 材料/化学
• 生命科学
• 航空宇宙计算
• 飓风预测
${PageNumber}E级计算面临的挑战
挑战一:访存墙问题
• 访存墙问题仍然是提升计算速度的第一大难题。
• 处理器的处理速度和访存速度之间的不匹配。
• 处理器单个引脚的信号、传输速度与引脚数受限。
• 多核处理器的出现只是提高了计算速度,不但没有缓解访存墙问题,反而使得其更加严重。
• 科学问题:最优的存储结构是什么?访存的优化缺少定量的指导准则,目前的研究只能验证准则。
挑战二:通信墙问题
随着超级计算机规模的不断增加,互联网对计算性能的影响也越来越大。而E级计算对互联网提出了更高的要求。互联网已成为制约超级计算机发展的核心因素之一。
挑战三:可靠性问题
当系统性能由P级向E级扩展时,保存全局检查点的时间可能达到甚至超过系统的MTBF。
挑战四:能耗墙问题
ITRS估计高性能CUP的功耗将达到120-200W。
此外,杨学军教授还指出,我们建立了并行计算的扩展性的度量模型,定量建模了访存、通信墙、可靠性、能耗等对E级计算的影响。通过定量分析,发现和研究了并行计算向更高性能发展面临的可扩展性“墙”。