鱼和熊掌兼得 5万元搞定万亿次计算-服务器专区

鱼和熊掌兼得 5万元搞定万亿次计算

作者：泉之源编辑：杨晓勇 2009-03-03 14:13 来源：IT168�

　　【IT168 专稿】峰值计算能力高达万亿次/秒，相当于40台服务器或200台PC的计算力。过去，一台达到如此计算力的传统高性能计算机动辄数十万元甚至上百万元，而今天，仅仅5万元即可轻松实现！听起来这似乎是个梦想，而谁将会把这个梦想变为现实呢？

　　3月2日，国产服务器厂商浪潮高调发布"倚天"桌面超级计算机。这个体积与普通PC大小相差无几的"小个子"，就是上面提到的轻松实现万亿次计算的多面手。高性能与低价格第一次在高性能计算上（HPC）得以并存，真正实现了"鱼和熊掌可以兼得"。

　　高性能计算的低成本实现

　　四年前，上海超级计算中心所采用的10万亿次超级计算机曙光4000A需要近亿元人民币，占地1/4个足球场。而今天，实现峰值4万亿次/秒计算能力的"倚天"桌面超级计算机，体积仅同PC，成本则只有传统HPC的1/5。是什么秘诀让它拥有如此魅力？

　　据介绍，"浪潮'倚天'打破了原有的高性能集群思路，采用CPU+GPU协同加速架构的方式，实现了在单台计算机上性能的倍速提升，而整体成本则由于GPU的成本绝对优势从而大幅度下降。其中CPU即为传统的多核处理器，而GPU，正是近来备受业界广泛关注的Tesla，Tesla是NVIDIA专为HPC和超级运算设备市场而设计的系列GPU。与CPU不同的是，GPU拥有更多数据处理单元的晶体管，而负责数据缓存和浮点控制的单元相应减少。这种设计使得Tesla GPU特别适于高算法强度、流量并发的单一程序的运算，或是存储交换量大的运算。NVIDIA方面表示，跟传统仅基于CPU的架构相比，CPU与GPU混合的架构在某些应用领域效率更高，数十倍甚至上百倍的性能提升正是GPU的最大优势。

　　上图显示的是Tesla服务器的配置情况：一台或更多Tesla服务器与基于CPU的服务器通过PCI-E卡连接起来。为了发挥Tesla服务器最大的效率，NVIDIA的官方建议是每颗GPU对应一核CPU，也就是说一台4x4的服务器（16核）能支持16颗GPU（2-4台Tesla服务器）。

　　据浪潮相关人员介绍，在"倚天"桌面超算的这种协同加速架构中，CPU专职逻辑选择、判断跳转和IO通信计算，GPU则专职计算密集型、高度并行的计算任务，使得CPU和GPU计算资源合理的分配，计算力被充分释放，计算性能达到从几倍到几百倍的增长。此外，"倚天"桌面超算还创新的使用了高速IO交换技术和QPI技术，使得CPU和GPU之间更加有效的协同计算。

　　同时，"倚天"易用的开发环境也易于掌握，它就是基于NVIDIA推出的CUDA编程环境。据介绍，这是一种专门针对GPU的C语言开发工具。与以往采用图形API接口指挥GPU完成各种运算处理功能不同，CUDA的出现使研究人员和工程师可以在熟悉的C语言环境下，自由地输入代码调用GPU的并行处理架构。这使得原先需要花费数天数周才能出结果的运算大大缩短到数几小时，甚至几分钟之内。"CUDA并行架构支持OpenCL、DX11等API，支持C/C++、FORTRAN等通用语言。由于该架构支持工业标准的C语言编程环境，使得开发人员可以非常方便、快捷地利用到GPU的并行计算性能。而且关键的一点是，对于我们不同代的GPU产品，软件编写一次后就不需要修改"NVIDIA对此信心十足。

　　依托于NVIDIA的Tesla GPU，浪潮将"倚天"桌面超级计算机性能发挥至极致。而对于之前担心的GPU双精度计算性能偏低的情况，浪潮高性能服务器产品部总经理刘军告诉记者"目前很多人对高性能计算或多或少都存在认识上的误区，实际上，高性能计算并不全是双精度计算，有接近70~80%的应用都偏重于单精度计算，在这一点上，倚天的协同加速架构完全没有问题，况且，GPU的双精度在不久的未来，随着产品的更新，会有大幅度的提升"。

　　那么，对于这样一台速度快、部署快、省成本、省空间、省电力的万亿次设备，它更适合HPC的哪些应用呢？浪潮方面告诉记者，像生命科学、天体物理、量子化学研究、资源勘探、机械制造、汽车设计、金融模拟、医学成像、视频和音频解码、图形渲染等应用领域，都是"倚天"大显身手的地方。

第1页：高性能计算的低成本实现第2页：普及高性能计算贴紧应用是关键

关注我们