服务器 频道

Nvidia GPU蜕变:从图形处理到超级计算

  【IT168 专稿】6月7日下午,由中国软件行业协会主办的“2010年中国高效能计算应用高峰论坛”在北京举行,来自中国软件行业协会数学软件分会、中国科学院过程工程研究所、北京大学、中国科学院软件研究所、Nvidia、Intel、Mellanox的多位专家代表就“GPU、众核处理器在高性能计算领域里的最新应用发展与挑战”展开演讲与讨论。Nvidia中国 PSG销售经理谢强在会上介绍了Nvidia GPU高效能计算及生态系统的最新发展。

Fermi:GPU从图形处理到超级计算的变革

  据了解,Nvidia的GPU核心业务一共有四条线:针对消费PC市场的GeForce显卡,针对专业工作站的QUADRO显卡,针对高性能计算的Tesla GPGPU产品,以及针对移动和嵌入式计算的TEGRA产品。谢强主要介绍了Tesla GPU硬件产品及CUDA软件开发平台的发展情况。

Fermi:GPU从图形处理到超级计算的变革

  Fermi:GPU从图形处理到超级计算的变革

  Tesla是Nvidia专门针对高性能计算打造的GPU产品,在超级计算机中充当并行计算加速器的角色——通用的X86多核处理器(CPU)负责数据库、操作系统等串行应用,GPU众核处理器则负责高性能并行计算,二者相互配合,从而数倍、十倍、甚至百倍地提高计算效率。

  Fermi则是Nvidia专门为高性能计算优化的新一代处理器架构。跟前一代产品相比,基于该架构的Tesla GPU处理器拥有30亿颗晶体管,512个计算内核,双精度性能提升8倍,带有ECC校验功能,增加了L1和L2两级缓存,内存带宽提高两倍,理论上支持1TB GPU内存。当前支持Fermi架构的Tesla产品是C/S2050系列,年底将增加C/S2070系列。

Fermi:GPU从图形处理到超级计算的变革

  在GPU领域本身来看,这一架构堪称具有“革命性”——让GPU得以脱掉传统图形处理器的外衣,换上了“专门针对高性能并行计算的众核处理器”的新装。新架构增加了两级缓存,是为了提高GPU的适用面,可以更好的适应数据密集型的应用。在支持的内存容量上,理论上的最大寻址空间可以达到1TB,但实际上,目前只能做到支持3GB内存,但比上一代产品已经有了很大的提升,而预计到今年底,Tesla系列可以支持到6GB,明年还可以支持到12GB。谢强表示,之所以目前还不支持更大的内存,一方面是考虑到应用的需要,另一方面也是出于性价比的考虑。另外在内核数量上,“虽然Fermi架构GPU可以做到512个内核,但受良品率的限制,实际上目前市场上的Tesla C2050都只集成了448个核,512核的版本预计要到年底才能推出。”

  尽管还存在些许不足,但这些并不影响Tesla在高性能计算领域广受追捧。据最新出炉的全球高性能计算机TOP500排行榜,名列第二的曙光“星云”就使用了几千颗Tesla C2050,Linpack性能达到1.27千万亿次每秒!而从不久前落幕的SC2010(超级计算大会)上了解到的信息来看,包括中国的曙光“星云”和中科院过程所的Mole-8.5在内,国际上一共有8个类似的大型超级计算机项目在使用GPU做加速器,“使用GPU,我们很容易就可以突破100万亿次、200万亿次的Linpack性能。”Linpack测试性能值是目前TOP500排行的标准。

0
相关文章