【IT168 专稿】6月18日,最新的第31届全球超级计算机TOP500排行榜在第23届国际超级计算大会(International Supercomputing Conference,ISC’08)上发布。此次ISC会议在德国德累斯顿市(Dresden)举行。由IBM公司制造、安装于美国能源部Los Alamos 国家实验室 (LANL) 的Roadrunner系统,以1.026 petaflop/s(千万亿次浮点运算每秒)的成绩成为首台打破petaflop/s Linpack门槛的超级计算机,从而宣告高性能计算领域进入了每秒千万亿次时代。
本届主要特点
全新的第一名系统 Roadrunner 打破了petaflop/s的门槛,它也是TOP500中能效最高的系统之一;
美国能源部有4套系统占据了前5位;
在所有系统中,75%使用了英特尔的处理器,在所有基于四核处理器的系统中,90%使用了英特尔的处理器;
有56%的系统使用了四核处理器,这些芯片的使用大大促进了系统性能的增长;
在工业领域,系统性能最高的是排名第十位的一家法国石油企业:Total Exploration Production;
IBM在总体市场份额上依然领先于HP;
TOP500排行榜首次对多款计算系统的能效比进行了排序。
TOP10基本情况
由IBM公司制造、安装于美国能源部Los Alamos 国家实验室 (LANL) 的Roadrunner系统,以1.026 petaflop/s的成绩成为首台打破petaflop/s Linpack门槛的超级计算机。Roadrunner基于IBM QS22刀片服务器,采用了Sony PlayStation 3中使用的高版本处理器。这些节点通过商用InfiniBand 相互连接。
在TOP10中,有6套是全新的系统,还有另外三套系统也进行了性能升级。
第1、2、3、5名的系统都是安装在美国能源部的实验室当中,而且TOP5系统均是安装在美国。
第2名是美国能源部的IBM蓝色基因/L系统,安装在能源部 Lawrence Livermore 国家实验室 (LLNL) ,Linpack性能为478.2 Tflop/s。
第3名是一套全新版本的同一类型的IBM BlueGene/P 系统,安装在能源部Argonne国家实验室 ,性能为450.3 Tflop/s。
第4名系统安装在得州大学高级计算中心(Texas Advanced Computing Center (TACC) ),由Sun公司使用Sun Blade x6420服务器构建而成,性能为326 Tflop/s。这是SUN公司的系统首次进入TOP10。
第5名系统是一套Cray XT4,安装在能源部Oak Ridge国家实验室,这套系统近期升级到了四核处理器平台,性能为205 Tflop/s。
第6名系统安装在德国于利希研究中心(Forschungszentrum Jülich ,FZJ),是一套IBM BlueGene/P,性能为180 Tflop/s。
第7名系统安装在一个新的计算中心——位于美国里奥兰珠市的新墨西哥州计算应用中心(New Mexico Computing Applications Center,NMCAC),由 SGI公司Altix ICE 8200构建而成,性能为133.2 Tflop/s。
自2007年11月份以来,印度第二次进入TOP10。其超级计算机系统排在第8位。计算研究实验室(The Computational Research Laboratories)是印度塔塔集团(Tata Sons Ltd)下属的一个机构,位于印度Pune市。它采用了HP的集群平台3000 BL460c系统。他们把这套系统和自己研制出来的创新的路由技术整合在了一起,运算速度达到132.8 Tflop/s。
排在第9位的系统是一套全新的IBM BlueGene/P,安装在法国“Institut du Développement et des Ressources en Informatique Scientifique” (IDRIS) ,性能为112.5 Tflop/s.
TOP10中的最后一套系统也是一套SGI Altix ICE 8200,它是工业应用领域中最大的系统,安装在Total Exploration Production公司,其性能为106.1 Tflop/s。

性能变化
基于四核处理器的系统已经快速占据了TOP500的半壁江山,目前有283套系统使用了四核芯片。另外有203套系统使用了双核处理器,只有11套系统仍然使用单核处理器。还有三套系统使用了9核心的IBM高端Sony PlayStation 3处理器。由于Linpack benchmark 能够充分利用多核处理器,使得TOP500的总体性能实现了大幅提升。
TOP500入门级系统的性能门槛提高到了9.0 Tflop/s ,6个月前是5.9 Tflop/s 。
榜单上最后一名系统在6个月前可以排在第200位。这是TOP500项目启动16年来最大的淘汰率。
TOP500的总体综合性能已经达到11.7 Pflop/s, 6个月前是6.97 Pflop/s,一年前是4.92 Pflop/s。
TOP100的门槛从6个月前的12.97 Tflop/s 提高到了18.8 Tflop/s。
TOP500的系统平均并行化水平达到每系统4,850 核心,6个月前是3,290 核心。
技术变化

总共有375套系统 (75%) 正在使用Intel处理器,6个月前是354套系统,70.8%,这是英特尔芯片在TOP500历史上所取得的最大份额。
IBM Power处理器重新超过AMD Opteron处理器,是使用量第二多的处理器,有68套系统 (13.6 %), 6个月前是61套 (12.2%) 。另外有56套系统(11 %) 使用了AMD Opteron处理器,6个月 前是78套系统 (15.6 %)。
多核处理器已经成为主流的芯片架构。特别值得一提的是英特尔四核Harpertown、Clovertown处理器,在6个月里其系统数量从102套增加到了253套。
其他绝大部分系统也都使用了双核处理器。
有400套系统标称为集群(cluster),是TOP500中使用最广泛的体系架构,份额高达80%。
由于拥有非常广泛的工商业用户基础,千兆以太网仍然是使用得最多的内部互连技术 (285套系统), 其次是InfiniBand 技术,拥有120套系统。
制造商格局

在TOP500的不同性能水平段,IBM和HP仍然是提供系统数量最多的厂商。
IBM拥有210套系统 (42%),超过HP的183套 (36.6%)。6个月前,IBM拥有232套 (46.4% ),而HP是166套 (33.2%)。
在性能方面,IBM也保持了领导地位,其系统性能占到了TOP500总性能的48%(6个月前是45%),HP是22.4%,比6个月前的23.9%有所减少。
Dell, SGI 和Cray 的系统数量份额分别占有 5.4 %, 4.4%和3.2%。
在性能方面,份额超过5%的厂商有:Cray (6.6%), SGI (5.9%)和Dell (5.5 p%), 每家都得益于有系统入选了TOP100。
在商业和工业领域的287套系统中,IBM (118) 和 HP (163) 总共提供了281套,可以说是近乎垄断了这个细分市场。
地理分布
美国显然是HPC最大应用国,有 257套系统。欧洲的份额(184套,6月前是 149套)仍然在增长,再次超过了亚洲的份额 (48 套,少于半年前的 58 套)。
在亚洲,日本拥有22套 (半年前是 20套),中国大陆有12套 (半年前是10套),印度有6套 (半年前是9套), 中国台湾有3套 (半年前是11套)。
在欧洲,英国排在第一位,拥有 53套系统(6个月前是48套);德国有所进步,但仍排在第二位,有 46套(半年前是31套)。
能效比情况
此次TOP500首次引入了能效比的指标,即每瓦电量所产生的计算能力。英特尔Harpertown处理器的系统取得了相当的进步,功耗效率在221 Mflops/瓦到240 Mflops/瓦之间,但弱于排名榜首的IBM的Roadrunne系统。
附录
全球TOP 500超级计算机排行榜诞生于1993年,其主要目的是为了以此为基础来对高性能计算领域里的发展趋势进行跟踪、监测。该排行榜对全球范围内性能最强劲的500套计算机系统进行排名,每年发布两次。决定计算机系统排名的最重要指标是Linpack测试性能。此外,该排行榜也提供了其他各种信息,如系统的规格、应用领域等等。目前,TOP500排行榜已经连续发布了31次,相关信息数据都可以在www.top500.org网站上找到。
第31次全球超级计算机TOP500排行榜榜单
http://www.top500.org/list/2008/06/100
TOP500分析统计图表查询
http://www.top500.org/stats
TOP500 见证全球超级计算机十五年
http://server.it168.com/server/2008-06-17/200806171523783.shtml
重要参数说明
FLOPS(floating-point operations per second)指计算机每秒执行的浮点运算次数;
1 Megaflop/s指每秒执行100万次浮点运算,即10的6次方FLOPS;
1 Gigaflop/s指每秒执行10亿次浮点运算,即10的9次方FLOPS;
1 Teraflop/s指每秒执行1万亿次浮点运算,即10的12次方FLOPS
1 Petaflop/s指每秒执行1000万亿次浮点运算,即10的15次方FLOPS。
1 Exaflop/s即每秒执行100万万亿次浮点运算,10的18次方FOPS。