服务器 频道

ASC 2017:看6+X赛题如何挑战智慧极限

  【IT168 资讯】2017 ASC世界大学生超算竞赛(ASC17)于3月13日公布决赛队伍名单,清华大学、俄罗斯圣彼得堡国立大学、匈牙利米什科尔茨大学、香港浸会大学等20支队伍入围。总决赛将在4月24日-28日在国家超算无锡中心举办,20强队伍将现场比拼,挑战采用全中国芯的全球最快超级计算机“神威太湖之光”及人工智能前沿应用。

  本届ASC世界超算大赛共有全球230支队伍报名参加,经过为时两月的激烈预赛,除中山大学、上海交通大学等传统强队晋级外,还有德国埃尔朗根-纽伦堡大学、波兰华沙大学、中国海洋大学等7支队伍首次入围总决赛,竞赛格局呈现出强烈的新生势力快速进步趋势。这表明在高性能计算、大数据、人工智能快速融合的“大计算”时代,全球超算年轻人才数量和水平均得到快速提升。

ASC 2017:看6+X赛题如何挑战智慧极限

  决赛将要求各队在3000W功耗约束下利用组委会提供的浪潮超算节点等组件自行设计构建超级计算机,并运行人工智能交通预测PaddlePaddle、第三代基因测序组装Falcon、大规模分子模拟LAMMPS、基准测试HPL和HPCG等超算应用。今年的“e Prize计算挑战奖”赛题选定为在“神威太湖之光”上运行优化高分辨率海洋数值模拟MASNUM,该应用曾获得被誉为超算领域诺贝尔奖的“戈登贝尔奖”提名。

  人工智能交通预测PaddlePaddle:PaddlePaddle是百度开发的一个成熟的深度学习框架,根据用户兴趣定向的跨空间事件要素关联分析方法,借助人工智能的尖端力量,完成多元数据的关联分析与模式挖掘。它有着极大的易用性、高效性、灵活性和扩展性等特点,具备高质量GPU代码,在解决实际问题方面有着明显的优势。目前,PaddlePaddle已被部署到百度30多项主要产品和服务之中,如自动驾驶、百度外卖、智能数据中心、机器翻译、杀毒、黄反鉴别、过滤垃圾邮件和信息、CTR(检索匹配度)、OCR、人脸识别等。

  总决赛时最高功耗不得超过3000W,且必须在现场的测试平台上使用PaddlePaddle解决问题。百度将提供真实的交通数据,参赛队员利用真实交通数据、通过PaddlePaddle设计构建模型。参赛队可以自由选择模型来训练数据,最终训练效率最快、识别最准确的参赛队为该赛题第一。

  第三代基因测序组装Falcon:基因测序是指对人或其他物种的基因序列进行测定的技术。当前的测序技术按照发展的先后顺序有一代测序,二代测序(NGS),和三代测序。由于基因作为遗传物质,对于大多数人类疾病的发生起到了决定性的作用,因此通过基因测序的方式,了解病人的基因上发生的变化,才能采取精准而有疗效的治疗手段,因此基因测序可以认为是精准医疗的先决条件。

  Falcon软件是三代测序组装软件。具体来说,三代测序仪的测序结果是长度为几千个碱基长度的基因片段,一次测序会产生大量的基因片段(通常是几十万个)。组装软件通过研究这些片段之间的相关性,把这些片段连接起来,组装完整的基因组和染色体序列。Falcon就是一个典型的三代测序的组装软件。由于三代测序产生的数据量很大,通常是几百GB,因此带来的基因组装的计算量也非常大,超出了普通计算机的计算能力,因此需要超算来帮助完成。

  大规模分子模拟LAMMPS:总决赛必须在KNL平台上进行,该项优化可以不考虑3000w额定功耗。分子模拟是指在分子层面上使用计算机的方式,研究分子之间的相互作用的一种方式。分子模拟中,最常用的方法就是分子动力学模拟方法。分子动力学模拟是指通过计算机计算的方式研究分子的运动的一种研究方法。被广泛的应用在化学、材料、分子生物学等多个前沿学科领域。

  LAMMPS全称是“大规模原子分子并行模拟器”主要用于分子动力学相关的一些计算和模拟工作。LAMMPS可以支持包括气态,液态或者固态相形态下、各种系综下、百万级的原子分子体系,并提供支持多种势函数,且LAMMPS有良好的并行扩展性。LAMMPS是全球范围内使用最为广泛的分子动力学模拟软件之一。

  高分辨率海洋数值模拟MASNUM:海浪数值模式MASNUM是我国自主研发的第三代海浪数值模式。2016年在国际上首次开展了全球空间分辨率约2公里的海浪数值模式研究,并依托“神威·太湖之光”进行了全机测试。此次测试共使用1000多万个CPU核,计算效率超过35%。相关研究荣获被誉为“超算应用领域诺贝尔奖”的“戈登贝尔奖”提名。MASNUM模式可用于近海、大洋、近岸海洋工程及气候变化研究中。并行扩展较好,可以支持几千上万CPU 核运算。

  计算量最大的部分无相邻点的MPI通信,具有较好的MPI+OpenMP、GPU、众核(申威、MIC)应用前景。海浪是近海普遍存在的海洋波动现象,影响着近海船舶航行以及近岸码头、桥梁等建筑物安全。在海洋和大气之间的相互作用过程中发挥着重要的作用,对全球气候变化也有重要影响。

  海浪数值模式是预报海浪等海洋环境的核心工具,如同数码相机拍摄照片的像素一样,海浪数值模式分辨率越高,就会得到越精细、越准确的预报。通常来说,数值模式分辨率每提高1倍,计算量就增加10倍,因此需要超级计算机的大力配合。总决赛期间每个队伍可以最多使用64节点的神威·太湖之光。

  HPL:Linpack表示超算系统的每秒峰值计算性能,该测试是超算TOP500排名的重要依据,将主要考察参赛队对硬件平台的浮点计算性能优化能力。参赛队伍要取得,需要对超算系统体系结构、多级存储一致性、高速网络、算法优化等方面进行全方位的综合研究,在混合架构、单一架构等方案之间比较选择,并结合性能功耗比加以反复优化和测试。竞赛组委会特意指出鼓励各参赛队伍从算法及代码角度深入分析从底层算法上对HPL软件进行优化。

  HPCG称为高度共轭梯度基准测试,是国际最新的超算基准测试标准,要求超算系统的运算性能、内存容量、带宽以及互连性能之间取得平衡。与之前广泛使用的HPL基准测试相比,HPCG评测标准更加复杂,但由于HPCG更容易反映出有限元法和流体分析等超算实际应用的性能,被很多超算专家认为是更加符合超算应用发展的评测标准。

1
相关文章