异构计算模式的落地
过去十年间,利用x86 架构处理器具备经济性优势的机群成为高性能计算系统的主流机型,全球高性能计算服务器市场的规模从2000 年初的50 亿美元倍增至2010 年的95 亿美元。主导模式已经变为通过部署包含更多标准x86 处理器内核更大规模的机群来达到更高的峰值性能。
但是从设计角度讲,x86 处理器根本无法良好地处理所有的高性能计算应用,并且散热和功耗在数年前就已经制约了x86 单线程的性能。人们日益认识到,虽然x86 处理器路线图展现了巨大的进步潜力,但是单纯依赖x86处理器的模式无法有效地应对这十年中与实现百亿亿次级计算相关的挑战。
近年来,另一种可应对这些挑战的“异构计算”替代模式在市场上占尽先机。这种新兴模式 通过加速器 (主要是 GPGPU,因此也可称之为图形处理器) 增加了x86中央处理器的效能,这样每种处理器就能专注于自己擅长的工作。图形处理器尤其擅长于处理海量代码和代码片段,体现出来了巨大的数据或线程级并行性。这就使得图形处理器继承了矢量处理器的衣钵,不仅具有更大的规模经济性,同时还更具竞争优势。IDC 研究表明全球个人电脑市场仅对于独立显卡的需求规模就在2010 年达到了大约40 亿美元。
异构计算模式在整个高性能计算市场有着良好的表现。IDC针对高性能计算处理器的2008 年全球研究表明,9% 的高性能计算机构正在已部署的系统内使用除了中央处理器之外的某种形式的加速器技术。IDC 在2010 年实施了一次相同的研究,发现情况已经显著不同。加速器技术已经有了很大的发展。此时,28% 的高性能计算机构已使用了加速器技术,该数据相比于两年前增加了两倍,几乎所有的加速器都是图形处理器。虽然图形处理器仅占异构系统处理器总量的5%,但是其数量仍在不断增加。
异构计算正在对高端高性能计算市场造成最大程度的冲击。图形处理器于 2008 年首次出现在全球超级计算机机构的 500 强榜单中。截至2011年 6月,该榜单上排名前十的系统中有三个已经部署了图形处理器。2011年10 月,美国能源部的Oak Ridge 国家实验室宣布打算将业内知名的美国超级计算机升级为后继系统 (“Titan”), 新系统将部署18000 多颗x86 中央处理器和同样数量的图形处理器,从而实现两至三百亿亿次的峰值性能。此后,德州高级计算中心宣布了建造异构超级计算机 “Stampede”的计划,该计算机在最初阶段将集成峰值性能为两千万亿次的 x86 中央处理器和峰值性能为八千万亿次的MIC 加速器处理器,从而实现一百亿亿次的峰值性能。
这些和其他领先高性能计算机构开始采用异构计算技术意味着图形处理器已经脱离了实验阶段,日益能够胜任一些面向生产的关键任务。国内超级计算情况同样如此。
由国防科技大学研发的天河1号超级计算系统TH-1A于2010年8月研制成功,峰值性能4700万亿次,Linpack实测性能2566万亿次,而其采用的便是CPU+GPU的异构计算模式,并一举拿下2010年11月TOP500强第一的位置。