【IT168 专稿】近日,在美国加州圣荷西召开的Nvidia开发者大会上,美国橡树岭国家实验室(Oak Ridge National Laboratory)宣布将建造新型超级计算机,用来研究能源和气候变迁,而其速度将比目前最快的“走鹃”(每秒千万亿次)快百倍以上。据透露,新的超级计算机将采用Nvidia新一代GT300核心GPU处理器,集成超过30亿个晶体管,512个流处理器。当然,该系统中也将会使用英特尔、AMD或其他处理器——由此可见异构超级计算机渐成趋势(我国也将研制龙芯混搭的异构超级计算机)。
据该实验室电脑与运算科学副实验室主任Jeff Nichols介绍:“Nvidia最新的GT300架构(代号Fermi)的GPU可促成以往不可能实现的“重大科学突破”。借由Nvidia的技术支持,我们能创造一个能提供亿亿次(exascale,10的18次方)计算速度的平台。”据了解,亿亿次运算是超越目前千万亿次(petaflop)运算100倍的技术,此前由于功耗和单节点运算能力的限制而很难达到。
随着Nvidia开发者大会的召开,我们拿到越来越多关于GT300的资料。首先是黄仁勋先生展示了GT300的工程样品,因为它采用了40nm制造工艺,因此看起来比GT200小一些(估计20%左右)。但另一方面,由于集成了30亿晶体管,因此芯片面积还是比AMD Cypress要大不少。样品表面上的“0935A1”字样告诉我们,这颗芯片还是最初级的A1修订版本,生产于2009年第35周,也就是8月24-30日,刚刚满月不久。
Nvidia最新的GT300架构代号“费米(Fermi)”,具体规格如下:
- 制造工艺:台积电40nm
- 晶体管:30亿个
- 流处理器:512个(32×16)
- 一级缓存:1MB
- 二级统一缓存:768KB
- 显存位宽:384-bit
- 显存容量:1.5/3/6GB GDDR5
- 浮点精度:半速IEEE754双精度
Nvidia目前的Tesla高性能计算卡集成的是GT200系列处理器,拥有240个流处理器,而GT300一举增加到了512个,并分成16组SM(Streaming Multiprocessor),每组32个流处理器,难怪乎美国橡树岭国家实验室也为之倾慕。此外,GT300集成了六个64-bit显存控制器,合计规格384-bit,低于GT200 512-bit,但搭配速度更快的GDDR5显存,Tesla上的内存容量将达到惊人的3/6GB。
作为最突出的改进,GT300改变了传统GPU指令的执行方式,单精度模式下每个时钟循环均可执行512个积和熔加运算(Fused Multiply-Add/FMA),双精度下则是256个。IEEE浮点算法格式方面,NVIDIA过去支持的是IEEE754-1985,现在GT300则升级到了最新的IEEE754-2008。虽然具体的浮点运算能力还不清楚,但非常有希望摆脱近年来始终不如对手的尴尬。
除此之外,GT300架构原生支持C(CUDA)、C++、DirectCompute、DirectX 11、Fortran、OpenCL、OpenGL 3.1/3.2等一系列技术标准,尤其是C++,这是GPU历史上第一次能够顺利运行这种代码,再加上C、Fortran就可以看出NVIDIA在通用计算方面的雄心壮志了。
黄仁勋先生还展示了采用了GT300处理器的Tesla高性能计算卡——初看起来和GeForce GTX 200系列长相差不多:长度约9英寸(22.9厘米),背部覆盖一半辅助散热,双插槽,两个PCI-E供电接口,其中八针位于尾部、六针位于上部。
正面贴纸上的“TESLA”几个字母说明它并不是一块简单的显卡,而是主攻高性能通用计算的专业产品,不过它还是保留了一个DVI视频输出接口(此前的Tesla产品上可没有),而且有两个SLI桥接金手指,显然又不是纯粹的计算卡。当然这只是一块工程样卡,相信今后肯定还会继续改进。
截止发稿为止,国外又有消息称NVIDIA将和微软合作,开发使用Tesla高性能计算卡的基于Windows HPC Server 2008平台的集群服务器。不论是黄仁勋的表态还是客户的积极响应,都表明Nvidia在超算市场的影响力越来越高,GPU通用计算在高性能计算中发挥的作用也将越来越强。
黄仁勋先生的演讲视频:
附上Nvidia Fermi官方简介视频:
http://us.download.nvidia.com/downloads/FLVs/Fermi/FERMI_HEADER.flv
Fermi架构细节讲解视频:
http://us.download.nvidia.com/downloads/FLVs/Fermi/Fermi_Interview.flv
Fermi架构白皮书:
http://www.nvidia.com/content/PDF/fermi_white_papers/NVIDIAFermiComputeArchitectureWhitepaper.pdf