服务器 频道

吉大魏晓辉教授分享HPC平台搭建经验

  【IT168 资讯】 英特尔今日发布了基于32nm的至强5600系列服务器处理器。该系列处理器主要用于双路服务器及工作站系统,相比上一代产品性能提升高达60%。在发布会现场,吉林大学计算机科学与技术学院的副院长魏晓辉教授讲述了自己试用至强5600系列处理器搭建高性能计算平台的感受,下面是分享全文:

  吉林大学是国家“985”、“211”重点建设的一所综合性大学,学校的学科分类非常齐全。学校很多学科在科研过程中都对高性能计算有着非常强烈的需求,理论化学、超应用材料、电子、物理、汽车、力学、生物信息等等。另外国家启动了“千人计划”,希望从国外引进高层次的学术人才。吉林大学几乎是没有例外的,每一位“千人计划”引进来的人都要求工作条件中具备高性能计算。目前学校的状况计算资源严重不足,不是没有,但是没有一个相当规模的学校的超计算中心,是每个学院或者国家实验室有自己小规模的中心,但是计算资源不够。比如说超应用材料国家重点实验室,它的老师需要到上海租用额外的资源,长春和上海比较远,沟通有一些不方便,从服务商来说有的时候达到不了用户的要求。电子学院的老师有时候说,自己买PC机,用低速的网络自己搭建一个比较粗糙的机群进行科研。材料学院、地学、汽车学院等等都需要这些资源,但是目前没有平台。

  高性能计算平台已经成为学校学科发展的迫切需求,从计算科学到现在,与以前的理论科学和实验科学相比已经成为科学上的一个“金三角”,缺一不可。高性能计算平台也是科研必备条件,如果没有这样的平台对学校以后学科发展是一个严重的制约。

  基于上述原因,学校决定成立这样一个高性能中心,这个中心也有下面几件好处,一是,把钱集中起来使用购买设备可以买到更便宜的设备,提高投资效率。二是,分散的中心负载不平衡,有的学院很忙,有的学院资源很清闲,我们把资源集中起来可以很好实现资源共享。三是,高性能中心的平台实际上后续服务和技术支持要求比较高,并不是说每个学院都有这样的技术能力,由学校进行这样的建设可以提供更好的技术支持和保障。这样的平台使各个学科在一起进行科研,特别是和计算机学科一起进行讨论可以促进学科交叉。四是,也可以对校外的一些企业、政府等等提供一些服务,促进区域经济的发展。这些优势条件决定我们今年要建这样一个项目,我们从学校985基金中抽了1300万元,中心是依托于计算机学院,大体上是1100万元用于购买计算资源,200万元进行机房建设。

  计算资源主体是刀片式的集群服务器,刀片节点就是采用英特尔新推出的5650的CPU,网络采用INFINIBAND高速连接,存储采用高速的光纤磁盘存储。在进行建设的时候,各个中心排名也好都是看计算能力,计算节点是其中非常重要的环节,我们在选型的过程中也是慎重考虑,2009年英特尔公司5500系列表现优于同业,我们建设的时候是5600系列呼之欲出的时候,5600系列和5500系列相比我们想性能到底提高多少,其实是制程工艺上有了改进,同样面积的芯片上可以集成更多的计算核。

  但是体系结构没有变化,内存的访问能力并没有太大的提升,相对来说我们也是有点顾虑,看一看六核之上跑计算,在同样的内存带宽上到底有没有内存瓶颈的问题。我们在测试的时候选取了一个测试二氧化硅的晶体结构的程序,正常玻璃不导电,掺入杂质晶体结构会变化,变成导电的性能,这个计算能力就是计算晶体结构的性质。我们要求所有给我们参加竞标的厂商都必须提供样机进行测试,图上5550的指标是由吉林大学技术人员和供应商的技术人员共同完成的,5600因为我们没有拿到产品,是委托英特尔公司拿同样的workload进行测试。在内存访问密集型作业,最保守的情况下,5600系列的性能表现还是比较优异的,提高将近20%的性能,这是性能和功耗的比例。所以我们觉得5600系列花同样的钱买到更多的计算性能时没有增加功耗,表中5500和5600的功耗都是95瓦。

  经过对比我们做了一个选择,还是要选择5600。基于几点考虑:1、花钱买东西,花同样的钱买更好的计算能力肯定划算。2、中心建完之后很多的成本是来自电费,我们买了更多计算能力的同时没有带来更多的运营成本的增加,这也是划算的事情。3、新的产品、新的芯片,没有用户做过测试,但是由于它是体系结构没有变化,是一个平滑过度,相对来说这个技术风险比较低,也是我们可以承担的。4、刚才英特尔公司做演示的时候,管脚5500和5600系列一样,供应商主板不需要变化,供货周期没有影响,对我们学校来说建设周期时间也没有太大的风险。基于以上的考虑采用了5600系列产品。

  以上是我们的感受和想法,谢谢大家。

 

0
相关文章