服务器 频道

NVIDIA:GPU计算机2010年冲击世界前十

性能与功耗的问题

    不过,记者也了解到,目前高性能计算用户大都需要双精度计算,Tesla有限的双精度性能使其应用领域受到了限制。Andy Keane告诉记者,NVIDIA的GPU向双精度方向发展也是这两年的时间,在2006年时还没有双精度单元,但到2008年我们已经把双精度性能做到了84 GFlops。

    他谈到,当前10系列GPU是首批拥有双精度的NVIDIA处理器。过去这种性能曾作为GPU的一个模块添加在GPU当中。而在这一代产品中,NVIDIA为每组八个单精度处理器加入了一个双精度单元。随着快速发展,未来的GPU将拥有更多双精度单元。由于GPU的性能一般每年都会翻一番,未来双精度性能将至少比当前的速度快5倍。

    除了性能提升,成本、功耗、占地面积也是大规模超级计算机用户所关心的重要因素。目前,NVIDIA的GPU桌面高性能计算机在美国麻省理工学院、哈佛大学、伊利诺伊大学、英国剑桥大学、德国布伦瑞克里大学以及韩国延世大学的使用也证明了这些价值。如比利时安特卫普大学原来用的超级计算机有512颗处理器核,成本是530万美元,占用了好几个机柜;而后来换成一台拥有8个GPU的台式系统,性能相当,成本只有7000美元,占地面积也大为减少。

    另外值得一提的是,通过混合架构来提升性能,降低功耗的做法在IBM的“走鹃”超级计算机中已经得到较好的验证。比如同样是一千万亿次的计算性能,IBM“走鹃”的系统功耗只有2483.47千瓦,而Cray “美洲豹”却使用了6950.6千瓦。一个重要的原因就在于IBM“走鹃”采用了“Opetron+CELL”的混合结构:皓龙处理器负责标准的运算处理如文件系统的I/O,而PowerXCell 芯片主要加速数学和CPU密集型运算。从性能上看,正是这些CELL处理器承担了大多数计算重任——6000多个Opteron处理器仅贡献了44万亿次每秒(teraflops)的性能,而12000多颗CELL芯片贡献了1332万亿次峰值性能,使得功耗大幅降低。

    而NVIDIA的GPGPU计算思路可谓有异曲同工之妙。Andy Keane告诉记者,在NVIDIA的“CPU+GPU”混合系统中,CPU负责执行顺序型任务,如操作系统和数据库,GPU则主要承担并行计算任务。“Tesla可以节省100倍的成本和100倍的功耗。”
 

0
相关文章