服务器 频道

杨广文:如何发展我国高性能计算事业?

  【IT168 资讯】9月26日,2014高性能计算用户大会在京举行,近千位国内外高性能计算研究与应用专家和用户代表到会。大会提出“HPC PLUS”理念,认为高性能计算正在联结世界、改变生活,并展示了高性能计算在全球最大射电望远镜阵列SKA项目、政府间气候变化委员会IPCC-AR5、天河二号超大规模应用等科学工程中的最新进展,分享了深度学习、个体医疗以及脑科学等全球热点技术领域的高性能计算应用趋势。


▲清华大学地球系统科学研究中心教授杨广文教授

  以下是清华大学地球系统科学研究中心教授杨广文教授的演讲全文:

  谢谢大家,各位来宾大家好,我想我从这块看浪潮论坛办得越来越不好,设计去年在百城路,今年来到CBD,第三个刚才看了以后,我上边有高性能计算的对象,把高性能计算刨出去,现在高性能计算用在融合大数据的主线或者基础,大家越来越上课。上次我参加的会讲的内容是如何应用好高性能计算中心,今天想探讨什么问题,大家知道经常我们听到第二个问题,机器不好使,有人说系统软件不好使,还有的人说你们应用软件太差,我想这个说的都对,问题实际上引到了什么,我们高性能计算不是简简单单一个程序,而是一个高门槛的行业,我想通过我们地球系统模式与高性能计算技术,通过这个描述,想对计算机的研制者,计算机者的运行者,还有计算机的用户。

  首先看地球系统模式,就是把地球系统里边的专长看到一个整体去研究,用地球系统模式来说,实际上大家看有很多一些模块联系起来,我们高性能计算是起着一个积极作用,高性能计算实际上是一个多学科的交叉融合,也是这个问题,实际上是个高性能的软件,没有这个软件就没法去做,我们对这个东西做了不少功课,曾经有一个专家跟我说,在全中国会用耦合器的人不到8个,后来我想会用耦合器的人不到8个,那做的人民肯定没有。地球系统数值模拟,在气候变化里头,这两点用的比较少。加入到模式中的分量越来越多,时空分辨率模式高,另外对云的描述,特别现在高性能计算是很多结合的预报,还有超级集合,这个是比较多一点。实际上最终都落实到高性能计算里边,这样对高性能计算的研制,高性能计算的应用进行了需求。到底高性能计算有什么作用呢,刚才主持人说IPCC,IPCC包括了我们在中国的模式,我们模式特点,第一个自主程度不高,分辨率低。

  高性能计算在这个领域里头,大家看几块最大,一个是数据同化,第二个关于气候预测,还有IPCC的报告,你要往这个方面卖,主要是关注这三个大的方面,基本上这三块占了80%的运算能力。我们看看要做这个模式都是什么流程,有模式有算法,有编程序,执行就是计算结果,今天我们要看原来我是感觉只要你有算法,我们今天运气很好,后面发现不是那么回事儿,不是算法,即使是模型可能有问题,所以这个我觉得问题还是比较大的,他给了我们模式,我们算的好好的,他说我们算的不太对,就是这样做了以后,这只是一个最简单的流程,我们要做做一个好一点的,可视化或者数据分析工具,这些数据分析工具又来自于大量的数据,可能有多种来源,因此整个地球系统模式的开发是这样一个循环往复的过程,也就是一个人从二十几岁开始做,可能做到六十几岁都在做,可能最后还没做好,所以高性能计算为什么是一个长远的过程。

  通过这个地方有几点建议做的,2022年美国科学院促进气候模式发展国家战略报告提出三大点,第一个做公共软件支撑平台,第二个开展气候专用的高性能计算机的研发与新型模式的研发,并进行持续的战略性投资,第三个建立实时、全面、可运行的支持全球变化研究的全球数据共享平台平台。另外做模式,模式大家经常说我的模式最好,可能一个参数是最好的,实际上是不一样的,模式过程既需要在不同的模式,计算机把它耦合进来,另外还要进行优化等等,这是比较复杂的。耦合器就不说了,现在已经是取得国际的认可了。

  其他还有很多的,比如说可扩展、稳定、高精度的方法,特别现在很多人算法库的研发,海量多元数据集成与融合方法,还有体验算法特征的计算机系统结构,还有软件共享平台,数据共享平台,地球系统模式的不确定分析。

  最后我提一点建议,因为我们这个团队原来从高性能计算,从软件、工具、算法等等,有三点建议,重视人才培养、注重学科交叉,加强多方合作,我说这个是很重要的,特别是注重人才培养,昨天看电视,一看中国0比2输给泰国了,为什么输?因为踢球的人太少,高新技术人才也是一样,95%以上不知道高性能计算的成功,所以说要从娃娃做起,我们高新人才要从大学生做起。

  对计算机研制者的建议,一电一个充分考虑用户的需求,第二想办法帮助用户研发应用软件,第三加强系统软件的研发,第四重视存储系统,特别是文件系统,第四是重视系统的可靠性与稳定性,充分考虑多种结构机器的研制,积极做好后续的技术支持与服务,重视自主技术以解决国家重大需求。

  对于营运者的建议,实际上有几点要做的,第一要丰富的计算资源,资源要充足。第二个是稳定的系统运行,第三个是完善的管理运行制度,既有用户的管理,也有财务、其他的选择。另外优质的技术服务,关键问题要计算技术支持,第五个吸引大量的高水平用户,清华大学高水平的用户是比较多的。高性能计算特别关注给大家服务提供能力,最后一条我觉得将来是个趋势,别总买机器了,想办法租,租赁高性能计算五年一淘汰,三年一租赁,三年一租赁滚动去做。

  最后一个对计算应用者的建议,第一点放下甲方的架子虚心学习,现在不管是朋友也好,我们都是去我帮你做做,可是这样一看用户,我们现在没钱,实际上不应该用这种观念,所以说甲方要虚心。第二个调动多方的力量,包括计算机厂商,计算机软件、硬件,还有用户一块来做,第三个应用者要充分尊重考虑机器研究与软件开发人员的价值及利益,最后做的过程中要超前考虑新的技术,另外我们应用水平比较低,在产品化方面下工夫,你做一个好的,有一个就行了,我们说人多势众。另外特别刚才说了,重视数据,最后一点高性能计算应用专家不应该是一个人,而是一个团队,希望大家共同努力,把高性能计算做好,谢谢大家!

1
相关文章