世界优异GPU高性能计算应用案例图解
如果说过去高性能计算仅用在政府以及学术研究领域的话,那么如今工业计算需求的井喷式发展则让高性能计算迎来了黄金时期。黄仁勋表示,相比科学研究和政府乃至军工的超级计算机,工业界需求的系统更在意能效比——节约时间,节约金钱,节约成本。
▲目前Top500前五名的超级计算系统中,第一、第三和第四套系统采用了Nvidia的GPU+CPU混合计算架构(绿色),而另两套系统采用了纯CPU计算(蓝色)。可以看出,采用了纯CPU计算的系统能效比远低于混合架构系统(红色)
黄仁勋表示,目前排在世界前5名的超算系统中,有四个采用了CPU+GPU的异构混合计算模式——其中最著名的就是位居榜首的中国“天河一号A”(计算能力2507万亿次/秒)。据介绍,“天河一号”配备了14336颗至强X5670处理器(32nm工艺,六核12线程,2.93GHz主频),而GPU方面则采用了7168块基于Nvidia “Fermi”架构的Tesla M2050计算卡(主频1.15GHz,双精度浮点性能515Gflops、单精度浮点性能1.03Tflops)。(更多天河一号相关信息请点击这里)
▲“天河一号”的GPU计算节点,Nvidia “Fermi”核心Tesla M2050系列计算卡,拥有448个流处理器核心(CUDA核心),主频1.15GHz,专用ECC存储器是DDR5规格的3Gb缓存,缓存频率高达1.55GHz,这使得GPU内数据存储速率达到了148Gb/s。由于散热和功耗等因素,一个GPU计算节点中只放置了两块M2050计算卡。
黄仁勋表示,目前超级计算系统的CPU+GPU趋势已经毋庸置疑,而在民用x86计算领域,CPU也有和GPU相融合的态势——Nvidia在Fermi架构中加入了众多原本只属于CPU的特性(如L1,L2缓存等)。而英特尔新一代Sandy-Bridge处理器架构中也融合了GPU部分用以实现简单的显卡功能(从能效角度考虑,这样的产品更适合移动互联和入门级台式机)。
此外,黄仁勋还举了一些其他用户使用GPU做高性能计算的例子:如 宝洁公司将高性能计算应用在了各种产品的设计和研发当中——如用HPC设计品客薯片的弧度,使其完美的“飞行”在生产线当中;还有其他诸如咖啡杯、洗发水等产品的设计也都在大量应用超级计算机。