【IT168 资讯】每年更新2次排行的全球前500大超级计算机又有新纪录出现。新状元是Cray Research为Oak Ridge国家实验室打造的Jaguar超级计算机:搭配六核AMD Opteron处理器,击败了原本由IBM用PowerXCell 8i处理器打造的Roadrunner超级计算机。 [2009年11月最新TOP500 HPC排行榜]
此一击败意义非凡。虽然x86处理器早已在近年来的500大超级计算机中成为“重要角色”,500套系统中有相当多套都是用x86处理器构成,但一直以来尚未拿过榜首,而2009年11月这个目标总算达成。
目标达成的结果表示,专有架构或未能在商业市场上获得普遍成功的处理器,想倚赖政府或研究机构的预算来支撑发展,已逐渐不可行。看整个500大系统,不是使用AMD Opteron就是Intel Xeon,其余几乎都成了“稀有动物”。
在稀有动物中,仍属活跃的当是IBM POWER/PowerPC架构,主要有:
POWER5/5+/6(主要用于IBM服务器)、PowerPC 970(俗称PowerPC G5,然在Apple停用PowerPC后已少有用途)、PowerPC 440/450(蓝色基因,BlueGene,IBM针对高效计算而开发的处理器)和PowerXCell 8i(改自游乐器处理器Cell)。
除了IBM PowerPC/POWER外,其他都仅2、3个。例如有2个使用富士通(Fujitsu)的SPARC64 VII处理器;或美国惠普科技(HP)、法国布尔计算机(Bull SA)及美国视算科技(SGI)有用Itanium 2安腾处理器,以及1套使用的GRAPE-DR处理器,跟昔日榜首(NEC地球仿真器)所用的SX-9向量处理器。
在操作系统上,Linux可谓是大赢家,只是不同发行版的差别而已,如Red Hat、Novell/SuSE,或者是CNL(Cray Node Linux)、CentOS等。
另外,只有IBM用AIX,以及只有富士通是用Open Solaris(搭配SPARC64 VII处理器)。有趣的是,高性能计算(High Performance Computing;HPC)版的Windows 2008也爬到73、74名。
计算架构上,不是使用MPP(Massive Parallel Processing)就是使用集群(Cluster),没其他种选择。
而最值得讨论的部分,莫过于连接架构,即超级计算机各机柜间的连接网络,此方面呈现三足鼎立局面,即Infiniband(IBA,Infiniband Architecture)、专属架构、Gigabit Ethernet(GbE,包含1Gbps与10Gbps)等三者为最大宗采用,500套系统中至少400套以上实行这三种架构。
除这三者外,实行其他专有连接技术的系统尚有:
Cray实行自有的XT3、XT4连接。SGI实行自有的NUMAlink连接。(比较特别的是,有1套是将NUMAlink与Infiniband混用)。IBM实行自有的SP Swich(SP为Scalable Powerparallel)。Myrinet、Quadrics(在高性能计算领域也常见的专有高速网络)。
其他意义
上述为Top 500的技术讨论,而在技术之外,许多人也期望自Top 500中观察出其他意义,例如超级系统的拥有者是哪个企业或机构?用途为何?是研究用、学术用或商用?哪些国家入榜及哪些国家落榜,例如过去是美国、日本两国争抢效能榜首,而今“日下、美上”态势已经明显,另台湾此次已退出Top 500,无一进榜。
Top 500中,多数系统为美国所有,然欧洲、大陆、俄罗斯等亦不容小觑,例如第五名的系统即是大陆国防科学技术大学(NUDT)自行打造,第四名的系统为德国所有,但却是由IBM打造。
未来推测
最后,各位可以发现,超级计算机的技术多样性正在减少,处理器多数为x86(Opteron或Xeon),操作系统多为Linux,连接架构也将会愈来愈多实行GbE,如此超级计算机的比较将逐渐无意义。所以,笔者推估未来将列入更多的相关比较,如造价、占地、功耗等,使比较更具丰富性,使其具备更多、更高意义性。
另外,FPGA(现场可程序化逻辑门阵列)与GPU(图形处理器)等芯片在高效计算上也具有可观的加速性,现在许多超级计算机已开始实行,但目前的基准测试(Benchmark)尚无法测度FPGA、GPU所带来的加速效果,而必须以应用程序来进行测试,但并非每套超级计算机都为同一种应用。所以,未来基准测试软件能否测度CPU外的计算加速性芯片所带来的效能效益,也成为一大重点。
再者,现有性能评估法也仅以标量(Scalar)为主,不考虑向量(Vector)性能,但偏偏NEC的地球仿真器是原生的向量计算系统,若以向量为前提进行较量,NEC依然会是榜首,其他则会是PowerPC 970(芯片内具备硬件向量计算单元)的系统。
如此,笔者推测未来也可能会另设向量别的性能比较,好与现有标量别的比较分开,但不可能一律改采向量性能来评估,一方面并非所有科学计算都需要向量,另一方面若改采全面向量评估,则现有多数超级计算机的性能成绩都将很难看,冲击极大,因此另列比较,是比较可行的。
若有余裕,往后单精度浮点数与双精度浮点数也可能分开比较,分开计列,这些都将是未来Top 500超级计算机可以持续精进或扩展延伸的可能路线。