服务器 频道

清华大学高性能计算机测试与选型经验谈

  【IT168 专稿】在高性能计算领域,清华大学有着很高的声誉,因为清华大学不仅有着国内高校里计算规模最大的高性能计算系统之一,而且培养了大批并行计算人才,在高性能计算软件方面有着许多研究成果,同时还承载着国家863计划高性能计算机评测中心。

  日前,IT168服务器频道记者采访了清华大学计算机系副主任、863计划高性能计算机评测中心副主任陈文光教授。在访谈中,陈文光教授介绍了清华大学在HPC领域所扮演的四种角色和工作内容,并重点介绍了清华大学在HPC测试和选型方面的成就和心得。


▲清华大学计算机系副主任、863高性能计算机评测中心副主任陈文光教授

  清华大学在高性能计算领域的四种角色

  大家知道,清华大学在高性能计算领域承担着多种角色,既是高性能计算系统的用户单位,又是优异的HPC系统评测机构,当然,也是高性能计算的教育机构和研究机构。那么,在陈文光眼中,这四种角色是如何定位与平衡的呢?

  作为教育机构,清华大学是全国顶尖工程师的摇篮,为了帮助非计算机专业的学生使用HPC来做研究与创新,清华大学多年来给理工科专业学生开设了《并行计算》课程,教会物理、生物、地球科学、大气科学的学生写并行应用程序,从而为以后在工作岗位上使用HPC打下基础。

  “在科研方面,我们主要把自己定位于一个高性能计算系统软件的研究单位。”陈文光谈到,虽然早在上世纪90年代初期,清华就做过集群架构并行计算机硬件系统的研发,但到了2000年后,随着系统规模越来越大,高校已经没有办法承担如此大规模的工程任务,所以开始把研究方向集中到HPC所需要的系统软件等关键的前瞻性技术上面,以帮助用户和产业界解决棘手的问题,如高可用机制、并行程序调试、性能分析等。

  不过,此行笔者最关心的并不是HPC科研,而是清华大学作为用户和国家863计划高性能计算机评测中心,所积累的HPC测试与选型经验。

  “作为用户,清华大学本身对高性能计算有着很强的需求,我们已经拥有国内高校中规模第二大的高性能计算机,仅次于国防科大。”陈文光告诉记者,清华大学新添置的百万亿次HPC主要用来承担全球气候变化预测研究方面的项目,今年清华大学的这套HPC在中国向全球气候变化委员会(IPCC)提交跟踪研究报告时就会发挥重要作用。其次,这套机器也会用于生物学、计算化学、材料学等,如生物方面的扫描电镜应用,对一个蛋白质从不同的角度拍多张二维照片,然后恢复成三维的蛋白质结构。

  而863高性能计算机评测中心自2004年在清华大学挂牌成立以来,已有7年之久,“我们先后帮助国内30多台中大规模高性能计算机进行了测试,发现了很多软硬件问题,如驱动不匹配、网卡故障、内存故障等等。”陈文光谈到,在这些测试过程中,中心逐步确立了“以应用为导向”的评测思想,并形成了“自底向上、逐层建模”、“全过程评测”等一系列成熟、先进的评测方法体系。

0
相关文章