Fermi GPU与高性能计算的"七个小矮人"-服务器专区

Fermi GPU与高性能计算的"七个小矮人"

作者：洪钊峰编辑：洪钊峰 2010-10-27 15:01 IT168网站原创

　　【IT168 资讯】自2004以来，CPU的主频就在3-4GHz左右徘徊，受限于功耗，无法进一步提升，之后人们就把计算性能的提高寄托在了多核、众核技术身上，这也使得并行计算受到越来越多的关注，同时也为GPU这种拥有数百个计算内核的架构带来了新的生命。

　　作为HPC China 2010大会的前戏，由国际高性能计算咨询委员会举办的研讨会10月27日在北京国家会议中心举行。NVIDIA高级工程师王鹏博士介绍了新一代的Fermi架构及其在高性能计算领域的适用场景。

GPU与高性能计算的“七个小矮人”
▲

　　高性能是GPU的最大诱惑之处，下图比较了过去几年来NVIDIA GPU与英特尔CPU在并行计算和吞吐带宽方面的性能，一般GPU浮点计算性能要高10倍，内存带宽高6-7倍。图中还显示出新一代的Fermi架构C2050在双精度性能方面与上一代相比有了堪称“突飞猛进”的变化，这也使得今年TOP100、TOP500上面出现了许多CPU+GPU的混合架构高性能计算系统。

GPU与高性能计算的“七个小矮人”
▲

　　基于Fermi架构的Tesla GPU有C2050和C2070两种，其中前者的内存是3GB，后者是6GB。

GPU与高性能计算的“七个小矮人”
▲

　　美国超算领域知名的数学算法专家Phillip Colella，在2004年就提出了科学计算的七种算法模型，也被称作“七个小矮人”，包括：结构性网格、非结构性网格、快速傅立叶变化(FFT)、Dense Linear Algebra、Sparse Linear Algebra、粒子动力学(Particles)、Monte Carlo。王鹏认为，这七种算法都非常适合在GPU上运行，有些比较容易，有些相对难一些，获得的加速比也各不相同，从几倍到几十倍都有可能。

　　比如，虽然对于某些商业软件来说，在GPU上的加速比可能不会象科研单位自编的软件能够实现几十倍、上百倍的性能提升，但对于某个设计公司而言，如果能够把别人快上2-3倍，这就已经是非常有“革命性”的进步了。

GPU与高性能计算的“七个小矮人”
▲CFD的GPU加速比

　　王鹏也指出，高并行度和重新设计数据结构是获得GPU应用成功的关键。

关注我们