服务器 频道

祝明发:漫谈Exascale计算机面临的挑战

  【IT168 特别报道】10月27日-30日,北京,国家会议中心,高性能计算领域的一场大戏即将上演。今年的全国高性能计算学术年会(HPC China 2010)由中国计算机学会高性能计算专业委员会主办、中国软件行业协会数学软件分会协办、北京市科学技术研究院和北京市计算中心承办。作为网络媒体合作伙伴,IT168将对此次盛会进行专题报道【点击专题】。


▲联想公司研究员祝明发

  计算速度是高性能计算机的一个重要技术,而GTPE能否真正实现三级跳呢?在本次HPC China 2010大会上联想公司研究员祝明发阐述了目前亿亿万亿次计算正面临的严峻挑战。


  上图是GTPE三级跳的简单历史回顾,从图中可以看出从百万亿次到千万亿次,Moore定律是主要的推动力,但是从千万亿次再往上,就不一定遵循Moore定律了。祝明发表示千万亿次高性能计算机发展遇到阻碍最主要的原因还是因为新的计算机系统不能够满足高速发展的计算运算速度。虽然百万亿次的高端计算机技术还算成熟,但是进一步迈向千万亿次就遇到了很多壁垒。这期间也有很多企业机构在研究千万亿次超级算机,比如美国高效能计算机曾经的HPCS计划,据了解HPCS计划在面对高效性、可编程性、可移植性、鲁榜性上,也并没有完全恰当的应对。




      既然千万亿次计算机未能打好坚实的基础,那么在进军亿亿万亿次必然遇到更多的技术壁垒。比如报告幻灯片中提到的功耗问题,如何解决低功耗和高效能的问题一直盘绕在各项应用中。再次正确认识,扎扎实实解决千万亿次的挑战,然后再从体系结构的创新,从软硬件共同着手,寻找低功耗性能设计方案。均衡设计,综合权衡(平衡功耗、性能、价格等矛盾)。

         那么CPU的一味增长是否真的合理呢?在以上幻灯片中也提到Sandia Lab实验室在2008年做的一个分析:通用CPU核数超过16毫无意义。这个分析是不是也意味着高端计算机结构在面临性能需求上是不是已经到达一个饱和状态,现有的系统结构是否创新改良才是首要需要考虑的问题。在面对存储、功耗、通信等技术墙时,CPU爆炸似的增长已经不能应对了。究竟我们该如何应对亿亿万亿次高端计算机带来的挑战呢?

  祝明发在报告中为应对亿亿万亿次计算的技术挑战提出以下五点建议:(1)首先就是要有正确的认识,不能不会跑就想飞,应该扎扎实实先解决千万亿次计算机的挑战。(2)最重要的还是要进行全方位的技术创新,比如软硬件体系结构的优化设计,亿亿万次计算机系统结构和编程方法协同优化设计;(3)将算法、应用、工具、运行系统协同优化设计,比如可以寻找新原理器件彻底解决速度、容量、功耗之间的问题。(4)均衡设计,综合权衡,保证速度和存储均衡以及计算和通信均衡。在均衡标准上可以遵守Byte/Flops/秒,带宽GBs/Flops/秒。(5)相信自己,抓住机遇。

0
相关文章