用GPU和CELL充当HPC加速器
使用GPU和CELL处理器来充当流处理加速器(stream processing accelerator),这一做法已经在HPC业界引发了相当的关注。人们可以通过这些处理器来实现应用加速,其目标领域包括3D可视化、广播编码、医疗成像、多媒体内容创作、图像和信号处理、金融财务分析、地震资料处理、大规模数据库交易和企业科研,几乎适用于所有要求强劲计算性能的数据密集型应用。这些多核加速器在HPC领域里的广泛适用性,已经吸引了软件开发商的关注。
早在去年9月份,Peaksteram公司就推出了一种“基于GPU显卡来构建超级计算机”的解决方案——该公司的C/C++程序接口、虚拟机处理任务调度和内存管理等工具软件,为程序员提供一种方便的途径,利用多内核x86或Cell处理器和GPU组成联合系统。编程人员可以象以往那样使用C/C++ 语言编写程序,PeakStream的软件负责硬件资源的分配。虽然客户必须根据PeakStream软件的接口对应用软件进行改编,但跟搞明白图形卡或其它硬件产品的内部原理来说,还是要简单得多。如其今年3月发布的PeakStream Workstation for Windows包含了一系列工具和库文件,可以方便开发者在微软的Visual Studio下为显卡开发多线程通用运算程序。
![]() |
PeakStream软件架构
RapidMind是加拿大的一家为多核平台(GPU/Cell等)提供编程环境的公司,近期也推出了类似的平台,宣称能够支持IBM CELL处理器以及最新的NVIDIA、 AMD/ATI GPU产品在HPC领域里的应用,并表示不久就会支持多核X86处理器。RapidMind提供C++的编程环境,对C++进行了一些扩展,比如特殊的数据类型,以及数字图像处理、游戏编程等库函数。目前来看,PeakStream使用的技术和RapidMind非常相似,都是C/C++和library方式,都是Array Programming Model,都是动态编译,都提供虚拟机。
除了商业公司,科研人员也正在研究新的基于CELL的加速器技术。今年4月份,中国科学院(CAS)计算机网络信息中心和IBM在国内合作的第一台基于Cell BE(Broadband Engine, 宽带引擎)的刀片服务器系统开始投入运行。在早期的系统测试中,中国国家网格(CNGrid)和IBM联合组建的测试团队通过进行一系列优化软件和Cell BE的硬件潜力开发,将地震应用的计算速度提高了60倍。地震预报专家将可以在短短几分钟内得到以往需要数个小时才能得到的计算结果。(参见:国内首台Cell刀片服务器落户中科院http://publish.it168.com/2007/0416/20070416034401.shtml)
![]() |
IBM的CELL刀片系统
在美国的田纳西州大学,Jack Dongarra和他的小组在创新计算实验室(Innovative Computing Laboratory)中安装了基于IBM CELL 处理器的系统——跟中科院使用的刀片系统不同,这是一套由4个节点子系统组成的PlayStation3 (PS3)集群,用作科学计算的研究平台。仅仅花费了2400美元,他们就构建了这套可以提供600 Glops(单精度浮点运算)峰值性能的系统。尽管PS3从来都不是专门针对高性能计算机群节点来设计的,但其低廉的价格和可用性还是得到了一些正在寻求低成本FLOPS的HPC FANS的青睐。值得一提的是,田纳西州大学小组正在评估PS3机群的编程模型,及该架构对HPC的某些限制。
