服务器 频道

高性能计算机TOP100排行榜折射六大现象

  【IT168 专稿】近日,中国软件行业协会数学软件分会、国家863高性能计算机评测中心、中国计算机学会高性能计算专业委员会三家机构联合发布了《2009年高性能计算机TOP100排行榜》。分析该排行榜,IT168服务器频道总结出以下六个值得关注的方面:

  一、首台千万亿次超级计算机问世,应用能否跟上?

  即将落户国家超算天津中心的千万亿次超级计算机“天河一号”取代去年落户上海超算的百万亿次超级计算机“曙光5000A”,成为了今年中国高性能计算机TOP100排行榜的“状元郎”。首台千万亿次机的问世再次印证了中国人做大机器的实力,然而,另一个问题也摆在人们的面前:用它来做什么。

  根据官方的说法,这套系统将于2010年底之前部署在国家超算天津中心,应用于石油勘探数据处理、生物医药研究、航空航天装备研制、资源勘测和卫星遥感数据处理、金融工程数据分析、气象预报、气候预测、海洋环境数值模拟、短临地震预报、新材料开发和设计、土木工程设计、基础科学理论计算等方面。

  然而,一个无法回避的事实是,用这么大规模的系统来跑当前的应用,似乎有“杀鸡用牛刀”的嫌疑。“大机器,小应用”已经成为困扰包括上海超算在内的诸多前辈的重要课题。如该中心拥有目前国内实际运行中最大规模的超级计算机——计算峰值性能高达230万亿次的“魔方”曙光5000A超级计算机,在全球TOP500排行榜中名列15位,总共拥有的CPU内核数达到3万个,而实际上,应用却远远没有跟上,使用16核以下的作业占到了60%,17-160核的作业占39%,160核以上仅仅占到1%。

  正所谓“前车之鉴,后事之师”,今天,我们需要的不只是规模更大的计算机,更迫切需要能够使用到这些大规模计算资源的应用软件。

  二、机群计算机体系结构大一统,GPU通用计算备受关注

  据统计,有96套系统采用了标准化、廉价、易扩展的机群结构,比去年又多了4套,在前10名里,9台是4核机群,8台是刀片系统,计算机体系结构创新更加严峻。不过,值得一提的是,“天河一号”的诞生,首次出现了CPU+GPGPU混合加速的千万亿次机器,点燃了我国高性能计算机体系结构创新的一点星火。

  目前国际上已经开始在芯片、节点和系统不同层面探索和研制多核异构系统,如Nvidia的Tesla GPGPU系统,英特尔和AMD开始研发的多核/众核异构芯片,IBM把POWER PC、CELL和Opteron等三种处理器融合一起的RoadRunner千万亿次机,以及一些厂商在研制的基于FPGA加速计算的节点级异构系统等等。

  值得一提的是,曙光公司将于2010年推出采用龙芯处理器的千万亿次超级计算机曙光6000,预计会落户于深圳的华南超算中心。与天河一号类似,曙光6000也将采用异构计算的结构,不同的是,天河一号用的是“英特尔CPU+ATI GPU”,而曙光6000将使用“普通CPU+国产龙芯处理器”,非常值得国人期待。

  三、单核处理器即将退出舞台,多核计算普及急需并行软件人才

  在最新的排行榜上,已经有77%的系统都使用了四核处理器,单核、双核即将退出舞台。根据英特尔的资料,今年3月底发布的至强5500性能居然是5年前单核至强的9倍!象Pentium4 Xeon 3.2GHz这样的单核产品目前只出现在排行榜的最后几名,如果不是因为单套系统的使用量大(近7000颗),相信早已被淘汰出局。或许到明年,这个排行榜将全是多核CPU的天下。

     多核处理器的普及带来的是对并行软件和并行计算人才的大量需求,而实际上,今天真正懂并行编程的人才很少,我们很多软件都只能用到16核以下的规模,如上海超算使用16核以下的作业就占到了60%,能用到32核以上的软件已是凤毛麟角。

  四、厂商集中化现象明显,曙光、IBM、HP、英特尔成主要玩家

  从制造商的分布来看,虽然曙光、浪潮、联想、神威、宝德、国防科大、北京计算中心、IBM、HP、Dell、SUN、SGI等14家制造单位都有机器上榜,但76%的系统都来自曙光、IBM、HP三家,厂商集中度非常高,而且曙光更是以27套的成绩首次成为入选系统数量最多的厂商,HP和IBM今年正好此消彼涨,前者从去年的33套减少为23套,后者从18套增加到26套。不过,仔细看一下榜单,不难看出,IBM主要得益于其6000块刀片入驻网易的几个大系统。

  不管系统厂商怎么争,最大赢家都是在后面提供处理器芯片的英特尔。随着系统越建越大,用到的CPU数也自然越来越多,毕竟这个行当对计算机性能的需求是永无止境的。今年,一共有77套系统使用了英特尔的芯片,与其在全球TOP500高性能计算机排行榜中的份额基本相当——TOP500中有399套使用了英特尔芯片。

  作为用得第二多的处理器芯片,AMD皓龙的份额也达到了21%。另外值得一提的是,榜单上只有北京气象局和国家气象局的两套系统在使用IBM的Power芯片,一个是Power4+,另一个是Power5,还看不到Power6的身影,要知道,明年Power7可就要出世了。这跟IBM芯片在TOP500中55套的辉煌战绩相比,就显得太不相称了。据业内人士透露,这是因为TOP500中很多系统都是IBM著名的“蓝色基因”,而这类产品起价就高达1000万元人民币,且不零卖,在中国目前还找不到合适的用户。

  五、高性能计算技术更新周期太快,系统投资回报备受考验

  一套超级计算机的使用寿命有多少年?5年左右!因为这个领域的系统增长速度实在太快了,甚至比摩尔定律还要快。这也意味着5年一过,原先价值不菲的宝贝疙瘩会大大贬值。根据国外TOP500的统计,对任何一套系统来说,从第一名落到第500名要经历6-8年的时间,而再落到跟笔记本电脑一般水平,只要经过8-10年的时间。

  看看国内的TOP100,今年入门系统的性能门槛大幅提升,达到6.8万亿次每秒,是2008年的2倍,这在5年前可以排到第2位,仅次于当年业内知名的8万亿次曙光4000A。当年辉煌一时的巨星如今已是光环尽失,落到了第83位。当然,排名不是最重要的,重要的是背后的价值。2004年曙光4000A的总投资近1亿元,而今天同样10万亿次的计算能力只要百来十万元。而且,更要命的是,那么大一套系统每天满负荷运转一天的电费就高达1万元!再过几年,可能一台普通PC的性能都比它强。

  技术更新周期短,这意味着大部分普通高性能计算机用户会面临一个非常残酷的现实问题:如果在这5年里机器的使用率不高,时常处于空闲状态,如果你不想办设法让它跑起来,让它去算科研课题,让它去模拟仿真,让它去做它该做的事,你就很可能收不回投资。这也是我们为什么担心那些百万亿次计算机、千万亿次计算机“大材小用”的原因所在!

  六、全国超算中心出现集中投资热潮,互联网行业渐成新力量

  与去年一样,今年TOP100的系统仍然主要分布在能源、游戏、科学计算、大气气象、工业、政府部门、教育、电信、生物信息、地震、电子商务、动漫渲染、金融保险和视频计算等14个领域。但我们也看到,石油勘探行业的系统更新速度明显放缓,份额从去年的35%大幅下降到了20%,相反,2009年新安装的机器大部分集中在科学计算和互联网领域。

  前者除了来自高校、生命科学研究的动力之外,更得益于各地不断兴起的超算中心投资热潮,如国家超算天津中心、成都超级计算中心、甘肃省超算中心、中科院超算(青岛、深圳、兰州、昆明)分中心、北京市计算中心等今年都新添了一批机器;后者则来自于6000块IBM HS22刀片服务器在网易魔兽游戏运营平台里的应用,加上之前的网络视频(酷6网配备了2400个核的浪潮天梭系统)、电子商务(1套拥有16190 个CPU核的IBM x3450机群)应用,互联网服务机群也渐成新力量。

  值得注意的是,传统科学计算和互联网服务对HPC的要求是不一样的,科学计算要求保证计算结果一定要正确,响应时间是次要因素,而互联网服务面向广泛用户,看重的是响应时间,然后考虑结果的正确性。

0
相关文章