4月25日,在2019 ASC世界大学生超级计算机竞赛(ASC19)总决赛中,中山大学代表队一举夺得引人瞩目的e Prize计算挑战奖,将地球系统模式CESM的全模式运算时间缩短至1.83小时。这也是中山大学第二次获得该项殊荣,ASC15总决赛中山大学针对SKA (平方公里射电望远镜阵列)的天文计算Gridding软件实现了600倍的加速效果,获得当年的e Prize计算挑战奖。
CESM:全球优异超算中的“杀手级”应用
地球系统模式CESM是当今国际上非常先进、应用最为广泛的气候模型,同时也是联合国政府间气候变化专门委员会(IPCC)撰写第五和第六次评估报告所使用的主要气候模型之一。CESM是一个完全耦合的气候模型,包括了大气、陆地、海洋、海冰、陆冰等几大模块,利用物理、化学、流体力学等方程式,外加由实际观测得到的气候场资料作为起始状态,最终在超级计算机上再现气候变化的过程。科学家们运用CESM来模拟海洋生态系统与温室气体的相互作用,臭氧、粉尘和其他大气化学物质对气候的影响,大气、海洋和地表的碳循环,以及温室气体对高层大气的影响等,还可以探索更广阔的应用空间。
CESM对计算资源的需求十分巨大,是神威·太湖之光、天河二号、泰坦等全球优异超级计算机中的“杀手级”应用。一方面,全球气候变化是一个长期过程,利用CESM进行气候变化模拟通常需要模式积分几百年甚至上千年,需要处理的数据量非常巨大;另一方面,CESM可以提供从数公里到数百公里跨度的不同精度模拟,依据不同的模拟场景和算例的分辨率,计算核心数量可从数百个扩展到数百万个。因此,如何更好的优化CESM运算进程,已成为计算地球科学领域一个重要研究课题。
中山大学成功提速CESM
ASC19组委会统一提供了2010年的全球大气历史数据,要求总决赛20强队伍在3000W功耗约束下自行设计构建超算系统,在限定时间内完成CAM4、CAM5两个大气模式的计算,以及在二氧化碳浓度翻倍的条件下CESM的全模式计算。经过实际测试,在ASC统一提供的8台浪潮AI超算服务器NF5280M5组成的集群中(功耗限制3000W),使用标准CESM模型运行该数据集需4小时完成计算。而参赛队伍出于其他赛题的考虑,大多选择异构超算系统设计,CPU计算资源普遍不足,因此必须对CESM气候模型进行优化,才能在限定的时间内完成赛题并确保运算精度。
中山大学代表队在决赛前对CESM进行了细致的分析,认为CESM大气分量模式的动力框架及物理过程的计算是影响程序程序性能的主要模块,程序整体受内存访问的影响极大,多个分量模式在计算中可实现进程复用。因此,中山大学代表队在决赛中设计出CESM的多线程运行方法,对进程通讯、内存访问以及向量化等进行大量优化,在7台浪潮AI超算服务器NF5280M5组成的超算系统中,成功将CESM全模式运算时间缩短至1.83小时,一举摘得本届大赛的e Prize计算挑战奖。
中山大学代表队指导老师丰光南表示:“很高兴看到ASC又一次将国际大科学工程中的核心HPC应用带到比赛中来,地球系统模式CESM是很多科学家在实际科研中会用到的一个前沿应用,这种赛题设计会让学生提前感受到真实的科研环境,激发他们对科学的兴趣和热情,同时也会推动应用的发展。”
作为CESM赛题的提供方,中国科学院大气物理研究所所长助理、LASG国家重点实验室副主任周天军表示:“CESM赛题一方面会让大学生们接触到目前国际上最前沿的气候变化科学工程,另一方面决赛中特别设置的二氧化碳浓度变化运算,也会让每个人切身感受到因碳排放量增加引发的全球变暖,将对人类生存环境带来哪些巨大影响,进而建立更好的环保意识。”
e Prize计算挑战奖不断激发创新思维
e Prize计算挑战奖是ASC竞赛独有的一个奖项,其命名中的“e”既是科学中最重要的自然常数,同时也代表着人类下一个超级计算机性能的挑战目标——百亿亿次(exascale)。ASC希望e Prize计算挑战奖能成为青年人才的戈登·贝尔奖(Gordon Bell Prize),鼓励人才勇于解决超算应用难题敢于挑战计算性能极限,激励青年人才利用超级计算机推动科学与工程领域实现应用突破。
历届“e Prize计算挑战奖”赛题涵盖石油勘探、宇宙天文、人工智能、地球海洋等领域,在激励大学生创新热情,促进大规模超算应用发展方面已取得了良好的效果。ASC16,华中科技大学代表队针对深度学习DNN智能语音识别应用,设计了非常出色的深度神经网络优化方案,对涉及英文、中文普通话、四川方言三个语种共约60万条语音数据实现了高准确度训练模型,并将计算性能最高提升108倍。ASC17,清华大学代表队在神威·太湖之光上成功将高分辨率海洋数值模拟模式MASNUM扩展到万核以上并将运行速度提升392倍。ASC18,上海科技大学在微软机器阅读理解赛题中,针对模型算法和训练性能提出了自己独特的创新及改进,8小时内完成大规模数据集的并行模型训练,并实现46.46的高预测精度,接近世界前沿先进水平。
未来,随着越来越多困扰人类的重大问题被选定为“e Prize计算挑战奖”试题,全球年轻的超算天才们将凭借自己的智慧,利用超算更好的造福人类。
ASC 世界大学生超级计算机竞赛(ASC Student Supercomputer Challenge)由中国发起组织,并得到亚洲及欧美相关专家和机构支持,旨在通过大赛平台推动各国及地区间超算青年人才交流和培养,提升超算应用水平和研发能力,发挥超算的科技驱动力,促进科技与产业创新。大赛迄今已连续举行8届,共吸引了全球超过7000名大学生参赛,是目前全球规模最大、参与人数最多的大学生超算赛事。ASC19由亚洲超算协会、浪潮集团和大连理工大学联合举办。