服务器 频道

Quadro FX 5600 SLI创造SPEC测试新纪录

  【IT168资讯】HP xw9400、Quadro FX 5600 SLI平台介绍

  最近有幸拿到了一台惠普HP xw9400工作站,上面安装了2块NVIDIA Quadro FX 5600高端专业显卡并配置为SLI。终于实现了我们长久以来测试专业显卡SLI性能的梦想。

  我们看到,这台HP xw9400工作站使用的是液冷CPU散热系统。由于Quadro FX 5600的最大功耗高达171W,因此每块显卡都连接了2个6pin供电插头。

  拆掉CPU散热器后,我们看到2颗AMD Opteron处理器在HP xw9400工作站主板上的位置不像Intel Xeon系统那样并排在一列上,而是一前一后的方式。这一点与AMD的CPU中整合了内存控制器有关,因为每个CPU控制的4根内存插槽都要以并联的方式连接到处理器上。如果使用传统的风冷散热器,由于机箱内的空气是从前向后流动,靠近机箱后背板的那个CPU温度会相对高一些。(Intel即将发布的下一代基于Nehalem架构的双路Xeon 5500平台在散热设计上也会遇到类似的问题。)在这种情况下,液冷的优势就显现出来了,这也是惠普目前只在xw9400一款工作站上引入液冷CPU散热器的原因。另外,HP还在内存上方设置了一个风扇和导风罩来帮助内存散热。

  我们对这套液冷CPU散热系统比较感兴趣,于是专门研究一下它。上图中每个CPU上方的液冷头分别引出2条导管(一进一出)连接至后方的散热片。

  再来看看散热器的底部,2个铜质并带有热管的液冷吸热装置固定在CPU的上方。整套CPU散热系统共有3个12V风扇接头,左边的4pin连接位于机箱后部的大尺寸温控风扇(即原来的机箱风扇位置);中间是位于散热器底部的一个3pin小风扇,该风扇的作用应该是辅助主板上的CPU VRM(供电)等元件的散热;最右边的那条线连接的可不是风扇,而是液冷系统的核心部件——水泵。

  我们进一步拆开液冷散热器的塑料外壳,终于露出了储液(水)盒和水泵。右边这个被黑色胶皮包裹的就是日本Shinano Kenshi(信浓)公司生产的微型水泵,它采用了与4pin风扇相同的PWM转速控制技术。(为什么很多优质的风扇等马达设备如:Nidek、Sanyodenki、Matsushita等都是日本的品牌呢?看来想抵制日货也不容易啊)

  这就是巨大的铝制散热片和15cm直径的NMB风扇,惠普在用料上可谓不惜成本。

  这台HP xw9400工作站配置了2个四核Opteron 2356 2.3GHz处理器,我们曾经在2008年7月做过相关报道(详见:“HP xw9400工作站配置更新 可选Opteron 2300系列四核处理器”一文)。在惠普工作站2008年11月的价格表(见下图)中,可选的CPU项目发生了变化,其中2MB三级缓存的4核处理器只保留了Opteron 2352(2.1GHz)、2358SE(2.4GHz)和2360SE(2.5GHz)3个型号,新加入了4款6MB三级缓存的Opteron 2376(2.3GHz)、2378(2.4GHz)、2380(2.5GHz)和2384(2.7GHz)即代号为“shanghai(上海)”的服务器/工作站CPU。

  上图中的“LiqCool”字样就是搭配液冷散热器的CPU选项。在HP的价格表中,xw9400工作站选配的每种CPU型号都有风冷(AirCool)和液冷两种,后者的价格比前者高出265美金。

  该HP xw9400工作站共安装了4条4GB DDR2-667 ECC Reg.内存,分别对应连接每个CPU中整合的双通道内存控制器。内存颗粒和模组的制造商为Micron(美光),芯片的配置方式为2 Rank×4,也就是说每条内存正反两面一共有36个内存芯片(其中4个用于ECC校验)。

  这就是本文的主角,2片NVIDIA Quadro FX 5600显卡使用软质SLI桥接电缆相连。需要注意的是,目前主流的Intel芯片组主板中只有最新的X58(通过NVIDIA授权的)能够支持SLI多显卡互联技术。因此惠普的工作站产品线中只有AMD平台的HP xw9400(采用NVIDIA nForce Professional 3600+3050芯片组)一款能够支持真正的SLI,其它机型即使拥有2个全速PCI Experss x16显卡插槽(Intel X38、5400芯片组)也无法实现SLI。

  以上配件特别是2片Quadro FX 5600的功耗可不是个小数字,惠普为了保证充足的供电,给这台xw9400工作站配备了Delta(台达)1050W 80 Plus电源。该电源的+12V输出共有8路之多,其中包括CPU-0、CPU-1、D(外设)、G1、G2(显卡)、R、M、B(主板),每一路的最大输出电流都是18A,+12V连续工作的最大组合负载不超过84A。

  在本次测试中,Quadro FX 5600 SLI分别在SPECvierperf 10的ensight-03、tcvis-01、ugnx-01三个子项和SPECapc for UGS NX 4的图形成绩上超过了SPEC网站(www.spec.org)上公布的测试结果中的成绩优异。详细的测试结果请看下文。

  测试平台

  说明:HP xw9400工作站提供了2个PCI-E x16扩展槽,不过规格是1.0而不是最新的PCI Experss 2.0;NVIDIA Quadro FX 5600显卡推出的时间比较长,正好也是PCI-E 1.0接口规格,因此没有造成瓶颈。16GB内存在32位Windows XP系统下实际只能用到3GB左右;另外这台样机上的2块SAS硬盘使用板载SAS控制器配置为RAID 0,我们没有做修改。

 

系统信息

设备管理器

  NVIDIA Quadro FX专业显卡驱动SLI设置

  测试安装了NVIDIA专业显卡最新的178.46版驱动,两块1.5GB显存的Quadro FX 5600,我想这是许多人都梦寐以求的优异图形工作站配置。

  上图为NVIDIA Quadro专业显卡的SLI设置界面,只有当显卡、主板全都支持SLI并安装了桥接电缆才会出现这个菜单。下面的“SLI渲染模式”选项才是真正的多显卡并联加速,而上方的“SLI多屏显示模式”其实就是2块显卡独立工作并没有打开SLI。

  进行完上述设置后,运行SPECvierperf等测试软件还不会获得性能上的提升,因为NVIDIA推荐的SLI性能模式默认为“单一 GPU”(见下图)。

  在“管理3D设置”界面中还需要进行强制选择才能够成功应用Quadro SLI。这里又有3种不同的加速模式,其中“分割帧渲染”和“交替帧渲染”即为SFR和AFR两种方式,前者对显卡输出的每一帧画面分割为2部分由两块显卡来渲染,而后者则是将奇数帧和偶数帧分别交给不同的显卡渲染。SFR多用于游戏,而基于OpenGL的3D图形设计通常采用AFR的效果比较好。

  右边的“程序设置”菜单中,显卡驱动识别到了安装的UGS NX软件,在这里也能单独设置针对UGS NX的SLI性能模式。

  1.SPECViewperf 10

  我们分别记录了Quadro FX 5600单卡、强制使用交替帧渲染1(AFR1)和强制使用交替帧渲染2(AFR2)三种设置下的SPECviewperf 10测试成绩。可以看出,专业显卡SLI在ugnx-01子项的提升接近1倍;ensight-03和tcvis-01(模拟的是UGS Teamcenter Visualization Mockup可视化仿真应用)两项分别有58%和36%的优势;其余项目除了3dsmax-04和catia-02两个之外SLI也存在小幅领先。另外我们还发现AFR1在proe-04和sw-01的表现相对好一些,而AFR2在maya-02一项上效果更明显。

Quadro FX 5600 SLI SPECviewperf成绩

  下面我们列出了SPEC网站公布的viewperf测试结果列表,供大家参考:

  SPECviewperf 10 TM

  Benchmark Results Summary

  注:以上表格来源于SPEC官方网站,2008年12月17日

  我们测试的Quadro FX SLI系统分别在ensight-03、tcvis-01、ugnx-01三项上超过了SPEC网站上公布的成绩优异,对比系统中包括了NVIDIA Quadro FX 3700 SLI和ATI FireGL V7700这样强劲的对手。然而SPECvierperf 10毕竟只是一个测试软件,下面我们来进行实际应用测试,看看专业显卡SLI真正的价值有多大。

  2.SPECapc for UGS NX 4

  我们先在没有修改UGS NX 4软件中任何设置的情况下运行了测试(以前我们也都是这样做的),发现Quadro FX 5600 SLI的性能提升幅度并没有在SPECvierperf测试中那么大。这里只对比了单卡和AFR1设置的测试结果,AFR2(强制使用交替帧渲染2)在NX 4中的成绩与AFR1相似而略低,故不再列出。同时我们发现Quadro FX 5600单卡在AMD架构的HP xw9400工作站上表现还不如xw4600工作站上的FX 3700(详见:“08年最值得期待的专业显卡-Quadro FX 3700深入对比测试”一文),不知道AMD最新的“shanghai(上海)”CPU能有多大的改观?

  下面是SPEC网站公布的SPECapc for UGS NX 4测试结果:

  SPECapc SM UGS NX 4 TM

  Benchmark Results Summary

  注:以上表格来源于SPEC官方网站,2008年12月17日

  参考系统中Fujitsu Siemens CELSIUS V840配置了2块nVidia Quadro FX3700组成SLI,其图形得分高达21.56。难道是因为它的Opteron 2222 3.016GHz CPU主频超过了我们测试的系统?不过根据我们以往的经验,SPECapc for UGS NX 4测试的图形成绩瓶颈在于显卡而不是CPU。因此还有必要做进一步的研究。

  上图摘自SPEC网站上参考系统运行测试时的相关设置信息,其中“View frustrum culling”和“translucency”(透明)2个选项是关闭的。

  在UGS NX 4软件中,我们找到了“View frustum culling”这个选项,它的默认设置为打勾状态(另外一项本身就是关闭的)。从字面上解释的意思应该是“隐藏面剔除”或者“切除不可见部分”。

View frustum culling打开

  上图和下图分别为打开和关闭“View frustum culling”选项时模型Studio(展示)浏览方式的实际效果,我们看到包括透明顶盖下方在内的模型细节没有任何显示上的差别。不显示隐藏(被遮挡)部分的图形能够有效节约显示子系统的资源,提高速度,类似的技术在3D游戏中也有应用。既然是SPEC官方推荐的设置,应该不算是“作弊”,关闭该选项(见下图)后我们又运行了一遍测试。

View frustum culling关闭

  这一次,Quadro FX 5600 SLI(AFR1)的图形得分达到惊人的27.62(见下图),而单卡的成绩也提高了不少。此时专业显卡SLI的领先幅度为39.7%,虽然距离理论的一倍性能提升还有相当大的差距,但在百尺竿头,能够更进一步已经相当不简单了。

不知道这是不是SPEC系列图形测试中又一项新的世界纪录?

  我们又列出了修改软件“View frustum culling”设置前后(上方和下方)不同测试模型的单项成绩。在默认设置下,“中等大小模型完全着色”一项SLI的优势最大,其它几个模型也有不同程度的提升,只有小模型2出现了下降;关闭View frustum culling选项之后,Quadro FX 5600 SLI在部分项目的领先幅度有所加大,“中等模型线框”一项也开始明显占优,而小模型2依然处于落后。看来专业显卡SLI并不是在所有的UGS NX模型应用中都有良好的效果。

  下面的图表为Quadro SLI优势最大的一项——“中等模型完全着色” 测试的具体时间记录,数值越小代表图形操作的帧速度越快。

  前面几种图形操作Quadro FX 5600 SLI都只用了单卡一半左右的时间,这样的情况和前文中SPECvierperf 10测试中ugnx-01子项的水平相当;而最后一项主要取决于CPU的操作SLI耗时比单卡还要多出0.7秒。

  上方和下方分别列出了修改软件“View frustum culling”设置前后模型旋转测试的成绩汇总(时间总和的反比)。这部分测试包括每个模型在各种显示方式下分别进行200次旋转操作(并不是指旋转200周,而是指画面的每一帧动作)。我们看到采用UGS NX默认设置时Quadro FX 5600 SLI在“线框”和“着色不显示边框”2项中还出现了落后;而当关闭了“View frustum culling”以后除了线框之外的其它模式下SLI都大幅领先50%左右。

  Quadro专业显卡SLI适合那些应用?

  除了UGS NX之外,我们还测试了Quadro FX 5600 SLI在Maya和SolidWorks中的表现。由于NVIDIA专业显卡驱动针对Maya的优化设置中“覆盖(Overlay)”一项是默认打开的,因此强行启用SLI后速度不升反降,如果关闭Overlay也无法获得性能上的改善;至于SolidWorks,该软件对显卡的要求不是太高,Quadro FX 1700就能够满足绝大多数的应用,如果用1片Quadro FX 5600已经属于浪费,打开SLI之后测试成绩几乎没有变化。

  那么,专业显卡SLI还适合其它方面的应用吗?我们注意到SPECviewperf 10测试中提升比较大的ensight-03和tcvis-01两项,它们都属于可视化一类的应用。其中tcvis-01对应的UGS Teamcenter Visualization Mockup软件是Siemens PLM(产品生命周期管理)系列软件中的一员;而EnSight软件用于将ANSYS等分析软件生成的工程和科学数据进行可视化。由于手头没有合适的模型,我们没有进行相关的测试。

  在可视化应用中还包括RTT和Opticore这两个广泛应用于汽车模型实时仿真的软件,它们也可以归类为VR(虚拟现实)应用。二者共同的特点是对显示质量和画面精细程度的要求非常苛刻,通常需要通过显卡开启高倍数的FSAA(全屏幕反锯齿)功能。而Quadro专业显卡SLI能够将单卡最高支持的FSAA级别提高一倍,例如1块Quadro FX 5600显卡支持32X FSAA,而2块Quadro FX 5600组成SLI之后就能够支持到64X FSAA。Quadro Plex外置式高端显示方案就是针对这种应用而设计的,其中的多显卡互联用的也是SLI技术。

  作为HP惠普工作站产品增值合作伙伴和ELSA艾尔莎专业产品全国分销平台的北京科卓同创信息技术有限公司,长期以来一直致力于为用户提供性价比更高的图形工作站及相关产品解决方案。

  北京科卓同创信息技术有限公司

  地址:北京市海淀区苏州街3号大河庄苑6号楼1601室

  电话:010-82569239/82569530

  网址:http://www.quadro.net.cn


 

0
相关文章