服务器 频道

部署至强平台刀片 南京大学HPC案例解析

Click Here

  【IT168 专稿】2009年国内高性能计算排行榜Top100上,来自南京大学的高性能计算系统以34万亿次的Linpack成绩排名第七(国际Top500排名203)。中秋节前夕,记者来到南京大学高性能计算中心采访了负责此项目的周庆林老师,并参观了该高性能计算中心机房。

全面部署HS22刀片 揭秘南京大学HPC中心
▲南京大学高性能计算中心 周庆林老师

  据了解,这套HPC系统采用基于至强5500的IBM HS22刀片服务器打造,于去年第二季度开始建设,今年7月份完成全部调试工作正式投入对南京大学各科学院系的高性能计算服务。

  1、南京大学高性能计算中心的建设背景

  据周庆林老师介绍,南京大学从事高性能计算方面的建设始于1980年天文系的应用需求。随着科学技术以及教育需求的提升,各个院系也相继开始购买服务器解决自己的计算需求。但是各个院系由于成本、人力等原因自己建设科研教学用高性能计算节点过于浪费,且不符合资源利用最大化的需求。因此,在985工程二期的项目中,南京大学拨出了专门款项购置和更新全校所需的共享大型计算设备,力求为全校理科院系提供更强大的计算能力。

  南京大学高性能计算中心也因此孕育而生。在论证中南京大学的专家组一致认为,作为一个高性能计算中心,需要为科研计算提供两类设备:一类为共享内存型SMP或CCNUMA架构小型机;另一类为x86架构机架或刀片服务器,提供通用计算。

全面部署HS22刀片 揭秘南京大学HPC中心

  但是到了2005年左右,x86架构高性能计算集群开始升温,大大动摇了传统共享内存模式的小型机地位。因此,南京大学打算做小规模的小型机,另一部分做x86集群——但是有两个问题:第一是机房选址问题,第二是到底选择什么样的x86服务器。

  周庆林老师表示,当时再机房选址时主要考虑了两个方面的问题:1、机房的承重问题,由于每个机架塞满服务器之后有数吨重,建设在高楼层需要对楼层进行加固,因此最终选择了建设在一楼。2、机房的制冷和走线问题,南京大学当时选择了物理系1层做数据中心机房,但是问题在于电力配给不够,考虑到增容需要对楼宇进行改造,因此最后选择在天文系的楼宇建设机房。

  机房选址的问题解决之后,究竟选择机架服务器还是刀片服务器做高性能计算中心的计算节点呢?周庆林老师表示,当时专家组也经过了一些讨论,并结合学校有些院系的使用经验,最终选择了刀片服务器。据周老师介绍,刀片服务器至今已经经过了几代的发展,日趋成熟。而机架服务器相对来说存在布线、管理较复杂的问题。

  南京大学高性能计算中心从选用基于至强平台的刀片服务器至今,没有出现过任何计算节点的问题,稳定性方面不弱于原来的小型机机架(甚至更好)。散热方面,目前高端刀片机箱由于计算密度高,计算资源集中,因此只要做好冷热通道就能很好的解决散热效率,满足系统需求(第三节有机房的具体介绍,会着重介绍散热)。

0
相关文章