服务器 频道

天河一号最牛!高性能计算TOP100五看点

  【IT168 评论】10月28日,在全国高性能计算学术年会(HPC China 2010)上,中国软件行业协会数学软件分会、国家863高性能计算机评测中心、中国计算机学会高性能计算专业委员会联合发布了《2010年中国高性能计算机性能TOP100排行榜》。【2010年TOP100排行榜下载】【HPC China 2010专题报道】【2009年TOP100】【2008年TOP100】【2007年TOP100】【参与微博互动

  经过分析该榜单,IT168服务器频道认为至少有以下五个新的关注点:

  一、天河一号TOP100再夺魁,有望冲击TOP500冠军

  在2010年5月底的国际TOP500排行榜上,曙光星云(Nebulae)系统凭借1.271PFlop/s的Linpack性能获得了第二名的位置【专题】,这是中国超级计算机界在国际舞台上有史以来取得的成绩优异。时隔半年,本以为在今年的国内TOP100排行榜上,曙光星云会稳拿冠军,没想到半年杀出了个程咬金,由国防科大生产的天河一号继2009年之后再度夺魁。【详见:Top100爆冷门 天河一号力压星云再夺魁

  在过去一年里,天河一号进行了大升级,目前的配置是14336颗英特尔六核至强X5670 2.93GHz CPU和7168颗Nvidia Tesla M2050 GPU和2048颗自主研发的八核飞腾FT-1000 CPU。处理内核数突破20万颗,是去年24576颗的8.25倍。其实,天河一号不仅仅是升级,而是几乎更新了整个结构,上一代采用的是英特尔四核CPU+ATI GPU,通过Infiniband互连,而新一代则是英特尔六核CPU+NVIDIA GPU+自主八核飞腾CPU,通过专有网络互连。

一、天河一号再夺魁,有望冲TOP500冠军
▲现场展出的新一代天河一号超级计算机系统 

一、天河一号再夺魁,有望冲TOP500冠军
▲自主设计的FT-1000 CPU

  天河一号的峰值计算性能达到了4.7Pflops,即每秒4.7千万亿次,是上一代的3.9倍,Linpack值达到2.507Pflops,达到上一代的4.4倍。与排名第二的曙光“星云”相比,天河一号的峰值性能是其1.57倍,Linpack性能是1.97倍。另外,通过采用双精度性能更高的GPU后,天河一号的系统效率,即Linpack值与理论峰值的比率,也由原来的47%提高了现在的53.3%。

  而且,值得一提的是,天河一号的Linpack性能比目前TOP500第一名的Cray机器还要高,是后者的1.425倍。因此,天河一号还非常有希望在11月中旬将要公布的新一期TOP500中取得冠军地位,结果如何,让我们拭目以待。

  TOP10系统如下表所示:

一、天河一号再夺魁,有望冲TOP500冠军
▲点击看大图

  二、10万核以上的超大规模计算系统出现,应用堪忧

  在今年的TOP100排行榜上,出现了两台拥有10万个处理内核以上的超级计算机系统,这些内核包括普通的CPU核和GPU核。其中,天河一号的计算内核数更是超过了20万颗,达到202752颗。TOP10系统采用的处理器核数如下表所示:

排名
安装地点
厂商型号
处理器核数
1
国家超级计算天津中心
国防科大天河一号A
202752
2
曙光公司
曙光星云
120640
3
Mole-8.5 Cluster
33120
4
上海超级计算中心
魔方/曙光5000A
30720
5
联想深腾7000
12160
6
成都超级计算中心(二期)
曙光星云
5720
7
中国科学院计算技术研究所
曙光生物专用机
4160
8
工程公司
IBM xSeries x3650M2 Cluster
8960
9
中国电信
HP Cluster Platform 3000 BL460c G6
7848
10
网络公司
IBM BladeCenter HS22 Cluster
7168

  这种超大系统的出现对技术和应用两方面都提出了很多挑战,包括计算效率、功耗、管理、I/O、占地面积、应用软件等等,尤其是应用软件可能会成为很大的瓶颈。据上海超算统计,2009年其使用16核以下的作业占到了60%,17-160核的作业占39%,160核以上仅仅占到1%。这也意味着很多大机器被各类超算中心买去之后,实际上都会拆分成若干块分给不同单位或部门去使用,因此并没在起到大机器应有的作用。

二、10万核以上的超大规模计算系统出现

  要解决这个问题,一方面,我们需要开发出可以使用到千核以上的应用,以充分发挥大机器应有的作用;另一方面,其实也可以考虑将“HPC与云计算”更好结合,让高性能计算资源池化和自动化,让更多中小企业来使用。

  三、GPU加速流行,其中5套进了TOP10

  GPU加速已经成为做大系统的“绝招”。在最新的榜单上,采用CPU+GPU混合架构的高性能计算机就达到了7套之多(如下表所示),而且都是2010年新安装的,其中有6套是英特尔CPU与NVIDIA GPU的搭配,另一套是英特尔CPU与AIT GPU的搭配。而且值得关注的是,在TOP10中,就有5套采用了CPU+GPU的结构。

三、GPU加速开始流行,5套进了TOP10
▲点击看大图

  英特尔与NVIDIA这对老冤家明争暗斗,没想到在用户这里却成了好搭档。从大多数系统所使用的GPU来看,基于Fermi架构的NVidia Tesla C2050受到了一致的青睐。这也似乎意味着NIVIDA在经过几年艰辛推广之后,终于迎来了春天。

  不过值得注意的是,GPU系统也并非完美无缺,除了软件编程和移植比较难之外,计算系统效率低也是此次TOP100反映的一个现实。这7套GPU系统的计算效率都比较低,最低的只有18.3%,最高的也不过54%,而一般CPU集群的效率最高可突破90%,比如排名第20位的安装在南京大学的IBM BladeCenter HS22刀片集群的效率就达到92%。

  四、厂商集中化趋势非常明显,曙光和IBM占三分之二

  从最新一期的TOP100来看,厂商的集中化趋势非常明显,表现在:一是有一些厂商退出了排行榜,比如SGI、银河风云、蚬壳星盈等;二是份额越来越多的掌握在少数两三家厂商手中,仅曙光和IBM两家的份额之和就超过了62%,几乎在重演2007年的市场格局。

四、厂商集中化趋势非常明显

  另外从发展趋势来看,笔者统计了2007年-2010年的数据,发现曙光和IBM都在不断扩大各自在HPC领域里的优势地位,尤其是IBM已经连续四年稳步增长,曙光今年的增长幅度也尤其高,相反,HP的份额却在不断减少,一增一减形成了非常鲜明的对比。

四、厂商集中化趋势非常明显

  显然,厂商的过度集中化,对于整个产业的健康发展并非好事,因为一方面市场需要竞争,从而可为用户提供更高性价比的产品和服务,另一方面,产业也需要创新,特别是在云计算、物联网的时代,需要有众多的、有不同专业优势的大小厂商一起参与创新。

  五、高性能计算在物联网的应用值得关注

  石油勘探、科学计算、互联网、工业、电信、教育仍然是我国高性能计算的主力军。不过,随着许多新兴行业的发展,也对大型超级计算机产生了新的需求,比如生物信息、视频计算、动漫渲染、电子商务等。【盘点TOP100 中国各行业里的最牛计算机

五、高性能计算在物联网的应用值得关注

  今年尤其值得关注的是HPC在物联网领域里的应用——无锡物联网云计算中心的曙光5000排在第80位。物联网的发展会产生大量的数据需要计算处理,对超级计算机有着强烈的需求,虽然目前物理网还处于起步阶段,但相信随着物联网的发展,会有越来越多的HPC系统出现。

  《2010年中国高性能计算机性能TOP100排行榜》请到这里下载

  要了解更多内容,请查阅IT168专题报道。针对此次大会,今年还引入了微博互动方式,大家可以参加HPC China 2010大讨论,有三种参加方式:

      1.直接登陆新浪微博,在所要发布的微博开头写#hpcchina2010#,再加上要说的话,点发布即可。

      2.输入hpc.it168.com,打开HPC China 2010专题页面,点击微博互动区的“参与讨论”按钮。

      3.手机用户可以直接发送短信参与,在短信开头写#hpcchina2010#,再加上你要说的话,发送至移动用户:1069 009 009;联通用户:1066 8888 66;电信用户:1066 8888 66。

0
相关文章