【IT168资讯】HP xw4600 + NVIDIA Tesla C1060


科卓Quadro 4100-TC在HP xw4600工作站基础上选择了性能强大的Intel Core 2 Quad Q9650四核处理器,适用于CPU+GPU异构计算。如果您的应用对CPU的多线程处理能力要求不高,可以考虑更换为相对廉价的双核处理器。
T10:NVIDIA第二代CUDA处理器
CUDA虽然发布只有一年半的时间,但现在已经有很多领域在使用。NVIDIA所要做的是要让人们可以在网上找到免费的软件,而且让自身的GPU产品支持CUDA。NVIDIA T8系列以上Tesla产品都将支持CUDA。截止到目前,CUDA GPU的市场保有量已经达到了8000万颗。
在2008年的8月,NVIDIA向市场提供了其第二代CUDA处理器——T10系列。T10 GPU可谓是当前世界上最大的芯片,拥有14亿个晶体管,共有240个流处理器计算核心,一块这样的GPU卡的浮点运算性能可达到1万亿次每秒(Tflops),而现在1颗四核CPU只有每秒700亿次浮点计算。

跟T8系列相比,T10在性能和显存容量上都增加了一倍,还增加了双精度浮点运算的支持,从而能更好地加速汽车飞机设计、CFD计算流体动力学以及金融分析等需要高准确度的应用。由于高性能计算应用的数据量往往很大,需要用到大容量内存,所以T10的板载显存容量也从原来的1.5GB提升到了4GB。NVIDIA工程师在逆时偏移测试时发现,在同样配置1.5GB内存时,T10仅比G80提升了1.9倍,而如果把内存加大到4GB,性能会提高到3.5倍。
NVIDIA推出了两款基于T10的GPU新产品:一款是Tesla S1070 1U机架服务器,共有4个GPU卡,共960个计算核心,性能达到每秒4万亿次浮点运算,功耗只有700瓦,而如果要达到相同计算性能,需要一个小服务器集群才能实现,而功耗可能达到几万瓦;另一款产品是Tesla C1060,可以用到普通的PC和工作站中,单精度和双精度浮点运算性能分别为933Gflops、78Gflops(峰值),典型功耗只有160瓦。

假设要构建一个具有100万亿次规模的数据中心,如果完全采用基于CPU 的1U服务器,需要用到1429台四核服务器,成本高达310万美元,功耗571KW(千瓦);而如果采用CPU+GPU的异构模式,则仅需要25台CPU服务器和25台Tesla系统,仅需31万美元,功耗只有27KW。
据了解,在GPGPU集群中,CPU服务器负责执行顺序型任务,如操作系统和数据库,CPU服务器与GPU服务器之间通过Infiband进行连接通信,GPU服务器则作为“一种协处理器的拓展”,通过PCI-E 2.0连到CPU服务器上,承担并行计算任务。由于GPU服务器上没有CPU,所以操作系统的启用需要用到CPU服务器。用户可以根据顺序任务和并行任务的比率,来配备CPU核与GPU核的不同数量。
作为HP惠普工作站产品增值合作伙伴和ELSA艾尔莎专业产品全国分销平台的北京科卓同创信息技术有限公司,长期以来一直致力于为用户提供性价比更高的图形工作站及相关产品解决方案。
北京科卓同创信息技术有限公司
地址:北京市海淀区苏州街3号大河庄苑6号楼1601室
电话:010-82569239/82569530
网址:http://www.quadro.net.cn