服务器 频道

探秘“启明”“太乙” 走进南科大超算中心

  【IT168 现场报道】ASC20-21现场总决赛于5月8日-12日在南方科技大学举行。

  21支中国大陆参赛队设计和搭建超算集群、优化指定应用、参加英文答辩,角逐冠亚军、最高计算性能奖、e Prize计算挑战奖等诸项大奖。同期7支来自中国大陆之外的队伍通过在线比赛的方式参与总决赛比拼。

  在总决赛期间,笔者有幸参观了南方科技大学科学与工程计算中心,带大家去揭开两套高性能集群“启明”和“太乙”的神秘面纱。

  科学与工程计算中心(以下简称:计算中心)于2018年10月全校发文成立。首任计算中心主任由美国物理学会会士(APS Fellow),南科大力学与航空航天系讲席教授王连平担任;副主任由美国电子电气工程师协会会士(IEEE Fellow),南科大计算机科学与工程系讲席教授史玉回担任。

  计算中心是南科大四大公共科研平台之一,主要任务是大力发展和有效管理南方科技大学高性能计算和大数据分析设备,使学校超算集群达到国内大学领先水平,并逐步接近和达到国际一流;汇总学校在高性能计算研究方面取得的成果,鼓励教授们共同探讨超算和大数据分析等前沿学科,组织相关学术研讨会;收集分析和协调校内各单位在计算和大数据分析上的需求;为学校培训高性能计算后备人才。

  目前中心拥有两套高性能集群,集群分两期建设,一期集群(启明,Qi-Ming)包含230个双路刀片节点,7个大内存计算节点和6个GPU节点, Lustre并行文件存储系统,Mellanox EDR高速(100 Gbps IB)计算网络。启明系统峰值超过300万亿次(其中GPU系统峰值为44万亿次)。

  二期集群(太乙,Tai-Yi)包含815个双路刀片节点,2个大内存节点和4个GPU节点,GPFS并行文件存储系统,Intel Omni-Path高速(100 Gbps OPA)计算网络。太乙系统理论计算峰值超过2500万亿次,实测计算性能超过1687万亿次。在2018年11月的全球Top500中排名第127,最新一期(2020年11月)的排名为319。

  浪潮具备大型超算系统的构建和运营经验,并提出高性能高可靠的软硬件一体化解决方案,在此基础上为用户按需定制专业应用软件,重视用户的应用需求。

  据介绍,南方科技大学科学与工程计算中心还拥有超算俱乐部。科大超算俱乐部,由学生超算团队,不断壮大发展而来,不断取得突破,为校争取了众多荣誉。在ASC19世界大学生超级计算机竞赛总决赛上,南科大学生超算团队就获得了大赛一等奖、应用创新奖及最佳人气奖三个奖项。

  南科大计划将超算俱乐部建设成高性能计算人才培养,催化科研进程的重要阵地,通过校企合作,南科大希望能够为学生提供丰富的实习就业机会,成为高性能计算人才的摇篮。

  明天(5月12日)下午,ASC20-21总决赛闭幕式暨颁奖仪式将隆重举行,这些辛苦了四天的参赛队员们,将迎来属于他们的高光时刻。那么,明天又会给我们带来哪些精彩的故事呢?让我们拭目以待!IT168将对本次大赛进行全程报道,了解大赛更多信息,请持续关注:http://zt.itpub.net/topic/ASC2021/

0
相关文章