【IT168 专稿】峰值计算能力高达万亿次/秒,相当于40台服务器或200台PC的计算力。过去,一台达到如此计算力的传统高性能计算机动辄数十万元甚至上百万元,而今天,仅仅5万元即可轻松实现!听起来这似乎是个梦想,而谁将会把这个梦想变为现实呢?
3月2日,国产服务器厂商浪潮高调发布"倚天"桌面超级计算机。这个体积与普通PC大小相差无几的"小个子",就是上面提到的轻松实现万亿次计算的多面手。高性能与低价格第一次在高性能计算上(HPC)得以并存,真正实现了"鱼和熊掌可以兼得"。

高性能计算的低成本实现
四年前,上海超级计算中心所采用的10万亿次超级计算机曙光4000A需要近亿元人民币,占地1/4个足球场。而今天,实现峰值4万亿次/秒计算能力的"倚天"桌面超级计算机,体积仅同PC,成本则只有传统HPC的1/5。是什么秘诀让它拥有如此魅力?
据介绍,"浪潮'倚天'打破了原有的高性能集群思路,采用CPU+GPU协同加速架构的方式,实现了在单台计算机上性能的倍速提升,而整体成本则由于GPU的成本绝对优势从而大幅度下降。其中CPU即为传统的多核处理器,而GPU,正是近来备受业界广泛关注的Tesla,Tesla是NVIDIA专为HPC和超级运算设备市场而设计的系列GPU。与CPU不同的是,GPU拥有更多数据处理单元的晶体管,而负责数据缓存和浮点控制的单元相应减少。这种设计使得Tesla GPU特别适于高算法强度、流量并发的单一程序的运算,或是存储交换量大的运算。NVIDIA方面表示,跟传统仅基于CPU的架构相比,CPU与GPU混合的架构在某些应用领域效率更高,数十倍甚至上百倍的性能提升正是GPU的最大优势。

上图显示的是Tesla服务器的配置情况:一台或更多Tesla服务器与基于CPU的服务器通过PCI-E卡连接起来。为了发挥Tesla服务器最大的效率,NVIDIA的官方建议是每颗GPU对应一核CPU,也就是说一台4x4的服务器(16核)能支持16颗GPU(2-4台Tesla服务器)。
据浪潮相关人员介绍,在"倚天"桌面超算的这种协同加速架构中,CPU专职逻辑选择、判断跳转和IO通信计算,GPU则专职计算密集型、高度并行的计算任务,使得CPU和GPU计算资源合理的分配,计算力被充分释放,计算性能达到从几倍到几百倍的增长。此外,"倚天"桌面超算还创新的使用了高速IO交换技术和QPI技术,使得CPU和GPU之间更加有效的协同计算。
同时,"倚天"易用的开发环境也易于掌握,它就是基于NVIDIA推出的CUDA编程环境。据介绍,这是一种专门针对GPU的C语言开发工具。与以往采用图形API接口指挥GPU完成各种运算处理功能不同,CUDA的出现使研究人员和工程师可以在熟悉的C语言环境下,自由地输入代码调用GPU的并行处理架构。这使得原先需要花费数天数周才能出结果的运算大大缩短到数几小时,甚至几分钟之内。"CUDA并行架构支持OpenCL、DX11等API,支持C/C++、FORTRAN等通用语言。由于该架构支持工业标准的C语言编程环境,使得开发人员可以非常方便、快捷地利用到GPU的并行计算性能。而且关键的一点是,对于我们不同代的GPU产品,软件编写一次后就不需要修改"NVIDIA对此信心十足。
依托于NVIDIA的Tesla GPU,浪潮将"倚天"桌面超级计算机性能发挥至极致。而对于之前担心的GPU双精度计算性能偏低的情况,浪潮高性能服务器产品部总经理刘军告诉记者"目前很多人对高性能计算或多或少都存在认识上的误区,实际上,高性能计算并不全是双精度计算,有接近70~80%的应用都偏重于单精度计算,在这一点上,倚天的协同加速架构完全没有问题,况且,GPU的双精度在不久的未来,随着产品的更新,会有大幅度的提升"。
那么,对于这样一台速度快、部署快、省成本、省空间、省电力的万亿次设备,它更适合HPC的哪些应用呢?浪潮方面告诉记者,像生命科学、天体物理、量子化学研究、资源勘探、机械制造、汽车设计、金融模拟、医学成像、视频和音频解码、图形渲染等应用领域,都是"倚天"大显身手的地方。
普及高性能计算 贴紧应用是关键

浪潮集团技术总监胡雷钧(右)浪潮高性能服务器产品部总经理刘军(左)接受记者专访
5万元能够实现过去所不敢想象的万亿次计算,但并不等于5万元就能在国内普及高性能计算。浪潮表示,技术的创新能够带动产品成本的降低,但仅有技术的创新还远远不够,目前我国高性能计算的落后的根本原因在于应用的落后。技术创新和应用推动相辅相成,缺一不可。

我们知道,作为一种高性能产品,高性能计算在重新编程、语言编译、应用开发移植等多个方面都有异于普通计算之处。"倚天"桌面超算采用的协同加速架构,同样意味着一种新的编程体系和应用开发环境,尽管NVIDIA宣称在其CUDA工具下就像写C语言一样简单,但对于初期接触的用户来说,实现起来并不十分轻松。
从这个角度来说,高性能计算设备供应商对于用户需求的理解和应用服务能力,成为推动高性能计算普及的关键。浪潮集团技术总监胡雷钧在接收记者采访时表示,浪潮作为长期深入服务与中国客户应用的一线厂商,针对"倚天"桌面超级计算机和未来的协同计算架构产品,会在应用工具开发、用户培训与教育、软件移植等多个方面,开展一系列的应用推广战役。浪潮认为,唯有如此,才能真正将创新的协同加速架构的技术利益让用户实实在在享受到,推动"高性能计算用得好、用得起"这样一个愿景逐步变为现实。
实际上,在桌面超级计算机或者说个人高性能计算领域,浪潮并不孤单。泰安的"TYPHOON台风"600系列、曙光的pHPC100、CRAY CX1,甚至连IBM 的BladeCenter S、HP的 BladeSystem C3000等,都属于这类产品。只不过,各家的产品架构和应用定位稍有区别而已。在谈到为何选择GPU路线架构时,浪潮集团技术总监胡雷钧强调"像曙光的pHPC 100产品,更像小型化的HPC,他们的产品秉承了传统思路,也是不错的产品。而我们则定位于桌面,"倚天"桌面超算更像是一个你随手可以拿到、可以用到,就在你桌边的产品,而不是装在柜子里,或者放在桌边的电老虎。这种系统更专注于计算密集型,和通用处理器做出来集群式的产品相比,计算密集型的应用效果会更好。"
5万元的小箱子,即可解决万亿次计算的大问题,这样的好处我们每个人都期盼。但市场是否真的普遍接受这样的产品,还需要时间的检验。预祝浪潮"倚天"发布成功。