服务器 频道

Fermi GPU与高性能计算的"七个小矮人"

  【IT168 资讯】自2004以来,CPU的主频就在3-4GHz左右徘徊,受限于功耗,无法进一步提升,之后人们就把计算性能的提高寄托在了多核、众核技术身上,这也使得并行计算受到越来越多的关注,同时也为GPU这种拥有数百个计算内核的架构带来了新的生命。

  作为HPC China 2010大会的前戏,由国际高性能计算咨询委员会举办的研讨会10月27日在北京国家会议中心举行。NVIDIA高级工程师王鹏博士介绍了新一代的Fermi架构及其在高性能计算领域的适用场景。

GPU与高性能计算的“七个小矮人”

  高性能是GPU的最大诱惑之处,下图比较了过去几年来NVIDIA GPU与英特尔CPU在并行计算和吞吐带宽方面的性能,一般GPU浮点计算性能要高10倍,内存带宽高6-7倍。图中还显示出新一代的Fermi架构C2050在双精度性能方面与上一代相比有了堪称“突飞猛进”的变化,这也使得今年TOP100、TOP500上面出现了许多CPU+GPU的混合架构高性能计算系统。

GPU与高性能计算的“七个小矮人”

  基于Fermi架构的Tesla GPU有C2050和C2070两种,其中前者的内存是3GB,后者是6GB。

GPU与高性能计算的“七个小矮人”

  美国超算领域知名的数学算法专家Phillip Colella,在2004年就提出了科学计算的七种算法模型,也被称作“七个小矮人”,包括:结构性网格、非结构性网格、快速傅立叶变化(FFT)、Dense Linear Algebra、Sparse Linear Algebra、粒子动力学(Particles)、Monte Carlo。王鹏认为,这七种算法都非常适合在GPU上运行,有些比较容易,有些相对难一些,获得的加速比也各不相同,从几倍到几十倍都有可能。

  比如,虽然对于某些商业软件来说,在GPU上的加速比可能不会象科研单位自编的软件能够实现几十倍、上百倍的性能提升,但对于某个设计公司而言,如果能够把别人快上2-3倍,这就已经是非常有“革命性”的进步了。

GPU与高性能计算的“七个小矮人”
▲CFD的GPU加速比

  王鹏也指出,高并行度和重新设计数据结构是获得GPU应用成功的关键。

0
相关文章