【IT168 专稿】早在去年11月中旬,NVIDIA就先行宣布了基于Fermi新架构、面向高性能计算领域的Tesla 20系列计算处理器和计算系统。现在,终于有合作伙伴推出相关系统了,也实现了NVIDIA的发布进程规划。
首先是Appro的1U Tera GPU服务器,包括“1326G4”、“1426G4”两种型号,均配备了四块Fermi Tesla M2050,拥有1792个流处理器、12GB ECC GDDR5显存,双精度浮点性能超过2TFlops。
两套系统分别采用两颗AMD Opteron 6100八/十二核心处理器、SR5690+SP5100芯片组和两颗Intel Xeon 5500/5600四/六核心处理器、5520芯片组,八条DDR3-1333/1066内存插槽,最大容量128GB或者96GB,六个热插拔2.5寸SATA硬盘位,最大容量3TB,两条PCI-E 2.0 x16插槽,操作系统可选Windows、Linux,电源额定功率1400W。
由于去年底Nvidia发布了全新的Tesla 20系列并行计算卡(Fermi架构),但是CUDA编程环境却仍然停留在2.0阶段,因此无法支持Fermi架构GPU的诸多新特性。而最新推出的CUDA 3.0则支持包括Tesla 20系列、Geforce GTX 400系列、Quadro专业显卡等三大产品线的所有Fermi架构GPU核心。
从Nvidia发布Fermi时公布的数据来看,Fermi架构拥有完整的16组SMI阵列,每组又有32个流处理器(Nvidia称之为CUDA核心),总共512个,但是实际上Tesla 20系列使用的GPU屏蔽了两组SMI阵列,因此实际拥有448个流处理器。其原因也很简单——为了控制功耗。服务器功耗现在已经成为数据中心和企业在选择IT设备时必须考虑的关键因素,而Tesla 20系列在正常负载的情况下功耗可达190瓦,而满载功耗最大可以达到225瓦,不过就计算性能和功耗比来看,Fermi拥有的30多亿个晶体管将带来前所未有的浮点运算速度。
NVIDIA Tesla业务总经理Andy Keane表示,Appro 1U Tera GPU服务器首次实现了在一套平台内提供两颗CPU和四颗GPU,可满足HPC客户对低价位、高密度和超级计算性能的需求。
Supermicro的“6016GT-TF-FM205”也是1U服务器,配备两块Fermi Tesla M2050,拥有896个流处理器、6GB ECC GDDR5显存,双精度浮点性能超过1TFlops,另外处理器是两颗AMD Opteron 6100系列或者Intel Xeon 5600系列,内存支持最高192GB DDR3-133/1066 Reg. ECC,三个热插拔3.5寸SATA硬盘位,1400W电源。
Supermicro还即将提供GPU计算系统“7046GT-TRF-FC405”,在4U塔式机箱“SC747TQ-R1400”之内并排安放四块Fermi Tesla C2050,搭配Xeon 5500/5600系列处理器,还支持八个热插拔3.5寸SAS/SATA硬盘位,适合集群配置和个人超级计算机。
Andy Keane表示指出,Supermicro的系统可以在大型商业、科学计算数据中心中无缝集成GPU。Appro、Supermicro都没有透露各自GPU计算产品的价格。Tesla C2050的官方建议零售价为2499美元,拥有6GB GDDR5显存、双精度浮点性能630GFlops的高端型号C2070则是3999美元,但还要等一段时间才能上市。
Tesla C2050计算卡真容
2009年的超级计算研究中,有12%的论文是基于Nvidia GPU的
诸多Tesla计算卡,主要面向个人超算领域,可以看到本次发布的C2050
这是面向超级计算机的Tesla计算节点(说明本季度还会发布新的计算刀片)