【IT168评测中心】时至今日,双卡甚至多卡互联并不是什么新鲜的技术,NVIDIA和AMD都提供了自己的互联解决方案,部分发烧友也率先体验到了双卡(多卡)互联的快感,当然这还是指娱乐级显卡来说。对于专业卡,双卡(多卡)互联却还是一个少人涉及的领域。正如我们在之前文章中提到的那样,双卡互联多是优异用户的无奈选择(找不到更高端的显卡,唯一的办法就是在数量上取胜),大多数用户还是更愿意升级显卡。虽然看起来市场空间不大,但是依然有厂商在这个领域不断钻研。
几个月前,我们为大家介绍过当时华硕一款支持6条PCI-E显卡插槽的工作站主板——P6T6 WS Revolution(详情请见:六块显卡互联 华硕Nehalem主板全国首测)。当时,我们对华硕使用NVIDIA SLI桥接方案的做法给予了肯定,虽然用户不太可能同时应用6块显卡,但是对工作站应用来说多显卡是目前的大势所趋。
华硕工作站主板线路图
最近,我们又拿到了一款华硕的新产品。这款产品在P6T6 WS Revolution的基础上进一步提升,提供了7条PCI-E x16模样的插槽。这款扩展功能强大的产品名为P6T7 WS SuperComputer。
和我们之前看到的P6T6 WS Revolutio相同,P6T7 WS SuperComputer也使用的是Intel X58芯片组。不过特色在于这款主板使用了两颗NVIDIA NF200桥接芯片,每颗NF200可提供2条PCI-E x16通道,因此一共可提供4条x16的PCI-E通道,可以轻松支持3-waySLI和四路全速CrossFireX,另外三条PCI-E通道只能达到x8的速度。
在我们之前接触过的主板中,无论是X58、X48还是老规格的975X,都提供了SLI功能,只要主板能够提供两条PCI-E x16插槽。不过由于授权的关系,NVIDIA为了保护自己的利益之前一直拒绝为Intel授权,直到今年X58芯片组发布,NVIDIA才为Intel敞开了怀抱。
目前在Intel X58芯片上实现SLI的方法有两种:一种是使用X58芯片原生支持的方式,这种方式只要主板BIOS经过授权即可,无需额外的芯片。比如我们可以用它组建双路SLI,以实现PCI-E x16+x16的模式。而对于3路SLI来说,则是PCI-E x16+x8+x8(其中一条PCI-E x16拆为x8+x8);如果是4路SLI就是4条PCI-E x8 。这种方式是目前比较常见的做法,首先它在技术上的难度不大,只需要一个授权的BIOS即可;其次它的成本较低,不需要额外附加芯片。
BIOS授权SLI解决方案
桥接芯片SLI解决方案
另外一种方法就比较费劲了,这就是通过采用NVIDIA nForce200 SLI桥接芯片。使用SLI桥接芯片的好处是可以提供更多的PCI-E x16通道,不占用X58芯片组本身提供的通道。不过缺点也很明显,使用SLI桥接芯片需要更多的成本投入,单颗nForce200 SLI芯片的价格约为30美元,这样主板的成本和售价都会很高。
本次我们介绍的华硕P6T7 WS SuperComputer主板就是采用了这种解决方案,由于单颗nForce200 SLI芯片提供了32个PCI-E通道,两个SLI芯片一共就是64个通道,加上X58芯片组自带的32通道,这样算下来P6T7 WS SuperComputer主板的通道数量达到了96个,可谓彪悍。
顺便说一句,对于高端旗舰级产品来说,价格并不是最关键的问题。正如《大腕》电影中所提到的那样,“能出2000美金的人根本不在乎再多出2000美金”。套用在这里,能出5000块钱买主板的人根本不在乎再多出5000块钱。而且对于这种旗舰级产品来说,主要用来表现厂商的光辉形象,而且数量也不多,厂商乐得在上面下一番功夫。
在华硕的经典定义中,黑色PCB意味着高端(当然,现在一些低端产品也用上了黑色),这款P6T7 WS SuperComputer主板就是一款全黑色PCB的产品。而且在外观看来颇引人注目的是,它的南桥和北桥都使用了银色热管,上面印有“SuperComputer”字样,看起来更是特别。
看过了华硕P6T7 WS SuperComputer主板的配置,我们只能用两个字来形容——豪华。从设计到做工,从功能到附件,这款主板已经用到了目前最高端的配置。更为难得的是,7条PCI-E插槽的存在为多显卡互联提供了方便,我们对于它的性能也是充满了兴趣。
那么在接下来的测试中,我们将测试P6T7 WS SuperComputer主板的工作站能力,包括基准测试和专业测试,测试会使用当前优异的至强W5580工作站处理器和Quadro FX580专业显卡,看看P6T7 WS SuperComputer的具体表现。
测试之前,我们来看看本次由P6T7 WS SuperComputer主板搭建的测试平台,详细参数如下:
测试平台、测试环境 | |||||||||
测试分组 | |||||||||
类别 | P6T7 WS SuperComputer | ||||||||
处理器子系统 | |||||||||
处理器 | 单路Intel Xeon W5580 | ||||||||
处理器架构 | Intel 45nm Nehalem | ||||||||
处理器代号 | Gainestown | ||||||||
处理器封装 | Socket 1366 LGA | ||||||||
处理器规格 | 四核 | ||||||||
处理器指令集 | MMX,SSE,SSE2,SSE3,SSSE3, SSE4.1,SSE4.2,EM64T,VT | ||||||||
主频 | 2.66Ghz | ||||||||
处理器外部总线 | 2x QPI 3200MHz 6.40GT/s 单向12.8GB/s(每QPI) 双向25.6GB/s(每QPI) | ||||||||
L1 I-Cache | 4x 32KB 8路集合关联 | ||||||||
L1 D-Cache | 4x 32KB 4路集合关联 | ||||||||
L2 Cache | 4x 256KB 8路集合关联 | ||||||||
L3 Cache | 8MB 16路集合关联 | ||||||||
主板型号 | ASUS | ||||||||
北桥芯片组(MCH) | Intel X58 | ||||||||
北桥芯片特性 | 2xQPI VT-d Gen 2 | ||||||||
内存控制器 | 每CPU集成三通道R-ECC DDR3 1333 | ||||||||
2GB R-ECC DDR3 1066 SDRAM x3 | |||||||||
系统磁盘子系统 | |||||||||
磁盘控制器 | Intel ICH10R AHCI Controller | ||||||||
磁盘控制器规格 | AHCI /w NCQ SATA 3Gbps | ||||||||
磁盘控制器设置 | AHCI /w NCQ SATA 3Gbps | ||||||||
磁盘控制器驱动 | Intel Matrix Storage Manager 8.8.0.1009 | ||||||||
磁盘 | Seagate Barracuda 7200.11 | ||||||||
磁盘规格 | 7200RPM 320GB SATA 3Gbps NCQ 16MB Cache | ||||||||
磁盘设置 | SATA 3Gbps NCQ | ||||||||
图形子系统 | |||||||||
NVIDIA Quadro FX 580 | |||||||||
显卡参数 | 512MB RAM | ||||||||
NVIDIA Quadro 182.65 WHQL for XP64 | |||||||||
软件环境 | |||||||||
操作系统 | Microsoft Windows XP Professional x64 |
测试平台环境,我们测试选择了当前优异的至强W5580工作站处理器和Quadro FX580专业显卡,看看P6T7 WS SuperComputer的具体表现。测试选择了常见的Windows XP Professional x64 Edition SP2操作系统作为平台。从软件兼容性来说,很明显Windows XP更适合我们的测试软件。
根据被测平台的情况,我们选择以下列表中的部分测试软件进行测试。
ScienceMark v2.0 Membench
ScienceMark v2.0是一款用于测试系统特别是处理器在科学计算应用中的性能的软件,MemBenchmark是其中针对处理器缓存、系统内存而设计的功能模块,它可以测试系统内存带宽、L1 Cache延迟、L2 Cache延迟和系统内存延迟,另外还可以测试不同指令集的性能差异。
SiSoftware Sandra Pro Business 2009
SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。从Sandra 2007开始支持SSE4指令集。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台,这也是我们选择这款软件的原因之一。
Cinbench R10
CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,我们的平台偏向于服务器多一些,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。
POV-Ray 3.6
POV-Ray是由名为Persistence OF Vision Devlopmentteam的开发小组在DKBTrace2.12的基础上编写而成的一个场景渲染软件。它为了减少了编制算法程序的时间而使用专用的场景描述语言来绘制三维场景。POV-Ray同时支持32位和64位,提供了Windows、Linux等多个平台下的运行版本。
SPECapc for SolidWorks 2007
SPECapc for SolidWorks 2007是由SolidWorks开发的,用于帮助SolidWorks 2007用户快速评估自己的工作站系统的一个工具。它由VB和C语言编写而成,可运行在Windows XP 32/64bi操作系统上。测试过程中使用了大小不一的CAD/CAM solid模型,最大的模型是一个由313万个顶点组成的引擎。
SPECviewperf 9
SPECViewperf 9.0是是专业级、符合工业标准的 OpenGL 图形显示卡效能测试分析软件,其测试项目有六项:3dsmax、DRV、DX、Light、ProE、Ugs,包括软件执行效能仿真(3dsmax、ProE)、以及动画公园场景仿真(Light)..等等,可以产出相关的分析数据。
SPECviewperf 10
SPECviewperf 10是一款测试专业显卡在多个CAD/DCC应用程序中的OpenGL性能的软件,包括3ds max、CATIA、EnSight、Maya、Pro/ENGINEER、SolidWorks等。最新推出的SPECviewperf 10可以告知你在多少倍抗锯齿下显卡性能表现会低于无抗锯齿情况下的10%,并提供截图比较。
SPECapc for Maya 6.5 v1.0
Alias Maya是一款功能强大的软件,集3D建模、动画和渲染等功能于一身,被广泛应用于电影、电视、游戏开发、视觉设计等领域。SPECapc for Maya 6.5测试包括5个部分,总共采用了4种模型(狼人、手、蚂蚁和鱿鱼),分别测试了wireframe、Gouraud-shaded、texture、texture highlighted with a wireframe mesh、texture with wireframe mesh and control points模式下的性能。SPECapc for Maya 6.5相对于上一代的测试软件的最大改进是用glDrawElements取代了glArrayElement,具有更高的效率。
SPECapc for 3ds Max 9
SPECapc for 3ds Max 9是基于典型用户的使用情况设定的负载,在测试过程中会涉及到wireframe modeling、shading、texturing、lighting、blending、inverse kinematics、object creation and manipulation、editing、scene creation、particle tracing、animation 和 rendering。3ds Max 8支持OpenGL和DirectX 8.0/9.0 API。
W5580处理器,主频3.2GHz
X58芯片组+ICH10R南桥
三通道,6GB DDR3 1333内存
本次测试使用的Quadro FX580显卡是Quadro 10代的低端产品,测试驱动为ForceWare 182.65。
SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。从Sandra 2007开始支持SSE4指令集。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台,这也是我们选择这款软件的原因之一。
SiSoftware Sandra Pro Business 2009 | |
测试对象 | |
Processor Arithmetic Benchmark | |
Dhrystone ALU | 78079MIPS |
Dhrystone ALU vs SPEED | 24.35MIPS/MHz |
Whetstone iSSE3 | 66236MFLOPS |
Dhrystone iSSE3 vs SPEED | 20.65MFLOPS/MHz |
Processor Multi-Media Benchmark | |
Multi-Media Int x8 iSSE4.1 | 162.13MPixel/s |
Multi-Media Int x8 iSSE4.1 vs SPEED | 50.56kPixels/s/MHz |
Multi-Media Float x4 iSSE2 | 125.15MPixel/s |
Multi-Media Float x4 iSSE2 vs SPEED | 39.03kPixels/s/MHz |
Multi-Media Double x2 iSSE2 | 68.86MPixel/s |
Multi-Media Double x2 iSSE2 vs SPEED | 21.47kPixels/s/MHz |
Multi-Core Efficiency Benchmark | |
Inter-Core Bandwidth | 38.34GB/s |
Inter-Core Bandwidth vs SPEED | 12.24MB/s/MHz |
Inter-Core Latency | 17ns |
Inter-Core Latency vs SPEED | 0.01ns/MHz |
Memory Bandwidth Benchmark | |
Int Buff'd iSSE2 Memory Bandwidth | 22.91GB/s |
Float Buff'd iSSE2 Memory Bandwidth | 22.90GB/s |
Memory Latency Benchmark | |
Memory(Random Access) Latency | 75ns |
Memory(Random Access) Latency vs SPEED | - |
Speed Factor | 59.60 |
Internal Data Cache Latency | 4clocks |
L2 On-board Cache Latency | 10clocks |
L3 On-board Cache Latency | 49clocks |
Cache and Memory Benchmark | |
Cache/Memory Bandwidth | |
Cache/Memory Bandwidth vs SPEED | 71.23GB/s |
Speed Factor | 21.70 |
Internal Data Cache | 254.69GB/s |
L2 On-board Cache | 223.92GB/s |
Graphics Processing | |
Native Float Shaders | 52.04MPixel/s |
Native Float Shaders vs SPEED | 49.85kPixels/s/MHz |
Graphics Bandwidth | |
Internal Memory Bandwidth | 14.20GB/s |
Data Transfer Bandwidth | 4.58GB/s |
Internal Memory Bandwidth | 14.20GB/s |
System to Device Bandwidth | 4.65GB/s |
Device to System Bandwidth | 3.95GB/s |
借助于至强W5580处理器的高频率和Nehalem核心,华硕P6T7 WS SuperComputer的测试成绩表现不错,较我们之前测试的P6T6 WS Revolution来说优势明显。
ScienceMark v2.0是一款用于测试系统特别是处理器在科学计算应用中的性能的软件,MemBenchmark是其中针对处理器缓存、系统内存而设计的功能模块,它可以测试系统内存带宽、L1 Cache延迟、L2 Cache延迟和系统内存延迟,另外还可以测试不同指令集的性能差异。
ScienceMark Membench | |
厂商 | 华硕 ASUS |
产品型号 | P6T7 WS SuperComputer |
内存技术参数 | 2GB ECC DDR3 1333*3 |
L1带宽 | 95980.12 |
L2带宽 | 39445.80 |
内存带宽(MB/s) | 14023.14 |
L1 Cache Latency(ns) | |
32 Bytes Stride | 0.94 |
L2 Cache Latency(ns) | |
4 Bytes Stride | 1.25 |
16 Bytes Stride | 1.25 |
64 Bytes Stride | 2.81 |
256 Bytes Stride | 2.81 |
512 Bytes Stride | 2.49 |
Memory Latency(ns) | |
4 Bytes Stride | 1.25 |
16 Bytes Stride | 1.56 |
64 Bytes Stride | 7.48 |
256 Bytes Stride | 31.49 |
512 Bytes Stride | 37.42 |
Algorithm Bandwidth(MB/s) | |
Compiler | 12401.35 |
REP MOVSD | 12917.36 |
ALU Reg Copy | 8423.13 |
MMX Reg Copy | 9882.09 |
MMX Reg 3dNow | - |
MMX Reg SSE | 13469.43 |
SSE PAlign | 13186.02 |
SSE PAlign SSE | 13998.64 |
SSE2 PAlign | 13194.66 |
SSE2 PAlign SSE | 14023.14 |
MMX Block 4kb | 11101.46 |
MMX Block 16kb | 11928.98 |
SSE Block 4kb | 11070.80 |
SSE Block 16kb | 11951.12 |
ScienceMark测试中,我们用三条DDR3 1333内存组建了三通道,内存总容量为6GB。从测试结果来看,L1和L2两项的成绩非常抢眼,近96000的高分得益于W5580处理器的高频。内存带宽的成绩也达到了14000分以上,相比之前我们使用Core i7+3GB内存所获得的P6T WS Professional测试成绩高出许多。
CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,我们的平台偏向于服务器多一些,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。
CineBench R10 | |
---|---|
测试产品 | 华硕P6T7 WS SuperComputer |
显卡 | Quadro FX 580 |
CPU Benchmark | |
Rendering (1 CPU) | 4591 CB-CPU |
Rendering (x CPU) | 18242 CB-CPU |
Multiprocessor Speedup | 3.97x |
OpenGL Benchmark | |
OpenGL Standard | 8376 CB-GFX |
首先我们来看处理器的测试。单路处理器下P6T7 WS SuperComputer的成绩不错;而在多路处理器中,由于P6T7 WS SuperComputer是一款单路平台,所以成绩并不高,从Multiprocessor Speedup的成绩也可以看出来。
在显卡项目的测试中,P6T7 WS SuperComputer的得分为8376,对于Quadro FX580来说这样的成绩相当不错。
POV-Ray是由名为Persistence OF Vision Devlopmentteam的开发小组在DKBTrace2.12的基础上编写而成的一个场景渲染软件。它为了减少了编制算法程序的时间而使用专用的场景描述语言来绘制三维场景。POV-Ray同时支持32位和64位,提供了Windows、Linux等多个平台下的运行版本,最新的稳定版是3.6。
POV-Ray | |||
测试产品 | 1280*1024 noAA | 1280*1024 AA | |
显卡 | Quadro FX 580 | Quadro FX 580 | |
CPU Time Used(数据越小越好) | |||
分辨率设置 | |||
Kernel(Second) | 0.03 | 0.06 | |
User(Second) | 683.25 | 683.70 | |
Total(Second) | 683.28 | 683.77 | |
Render Benchmark(越大越好) | |||
PPS(Pixel per Second) | 215.81 | 215.65 |
我们在1280*1024分辨率下应用POV-Ray软件进行了测试。虽然POV-Ray提供了场景渲染,不过它依然是一款测试处理器性能的软件。从测试结果来看,在开启抗锯齿并没有带来大范围的性能波动,两种情况下的测试成绩较为接近。
SPECapc for SolidWorks 2007是由SolidWorks开发的,用于帮助SolidWorks 2007用户快速评估自己的工作站系统的一个工具。它由VB和C语言编写而成,可运行在Windows XP 32/64bi操作系统上。测试过程中使用了大小不一的CAD/CAM solid模型,最大的模型是一个由313万个顶点组成的引擎。
华硕P6T7 WS SuperComputer在这个项目下的表现也不错,虽然更多的依然是显卡的功劳。这里,Quadro FX580显卡跑出了4.46分的总成绩,耗时仅为113.84秒。就单项成绩来说,处理器的得分为3.95分,显卡得分为5.27分,两者耗时分别为31.39秒和37.82秒。
SPECapc for 3ds Max 9是基于典型用户的使用情况设定的负载,在测试过程中会涉及到wireframe modeling、shading、texturing、lighting、blending、inverse kinematics、object creation and manipulation、editing、scene creation、particle tracing、animation 和 rendering。3ds Max 9提供了32位/64位两种版本,我们使用的是32位版本。
3ds Max 9的三种测试模式中,Software耗时最长,说明在这个模式下显卡的性能最差。OpenGL和Direct 3D模式的成绩相差不大,具体说来Direct 3D的成绩还要略好一些,运行时间在1000秒以内。
SPECViewperf 9.0是专业级、符合工业标准的 OpenGL 图形显示卡效能测试分析软件,其测试项目有六项:3dsmax、DRV、DX、Light、ProE、Ugs,包括软件执行效能仿真(3dsmax、ProE)、以及动画公园场景仿真(Light)..等等,可以产出相关的分析数据。
SPECViewperf测试更多侧重于硬件性能,也就是显卡本身所能达到的最大性能。同样的FX580显卡,这个测试结果相比之前在DELL T5500工作站上的成绩好了许多,看来SPECViewperf对于双路并不敏感。
SPECviewperf 10是一款测试专业显卡在多个CAD/DCC应用程序中的OpenGL性能的软件,包括3ds max、CATIA、EnSight、Maya、Pro/ENGINEER、SolidWorks等。最新推出的SPECviewperf 10可以告知你在多少倍抗锯齿下显卡性能表现会低于无抗锯齿情况下的10%,并提供截图比较。
SPECviewperf 10的测试成绩跟之前SPECviewperf 9表现的结果相比,主要是增加了多倍抗锯齿和多线程。在多倍抗锯齿测试中,虽然FX580也能够实现32X,但很明显个位数的成绩并不能满足现实的需要。多线程模式下,maya-02、tcvis-01等项目随着线程的增加而成绩下降,4线程的性能提升在多数项目中表现并不明显。
Alias Maya是一款功能强大的软件,集3D建模、动画和渲染等功能于一身,被广泛应用于电影、电视、游戏开发、视觉设计等领域。SPECapc for Maya 6.5测试包括5个部分,总共采用了4种模型(狼人、手、蚂蚁和鱿鱼),分别测试了wireframe、Gouraud-shaded、texture、texture highlighted with a wireframe mesh、texture with wireframe mesh and control points模式下的性能。SPECapc for Maya 6.5相对于上一代的测试软件的最大改进是用glDrawElements取代了glArrayElement,具有更高的效率。
Maya 2008项目的测试,P6T7 WS SuperComputer的总分为4.9,其中CPU得分达到了9.59,依然是最高;显卡得分仅为4.32。
【IT168评测中心】作为目前唯一一款支持7条PCI-E x16模样插槽的主板,P6T7 WS SuperComputer引起了我们浓厚的兴趣。扎实的做工、巨大的热管、广阔的升级空间和丰富的功能赋予了P6T7 WS SuperComputer强大的能力,这一点通过我们的测试更可以表现出来。
经过我们的测试,P6T7 WS SuperComputer主板的性能出色,对于专业卡的支持比较好。借助于目前最强大的Nehalem处理器——至强W5580,P6T7 WS SuperComputer发挥了强大的实力,在内存基准性能和处理器性能的测试中表现都超越了华硕之前的产品。当然,依旧是得益于高频处理器,它对于Quadro FX580性能的发挥相比之前我们使用DELL T5500工作站还要好一些(由于软件的限制,双路工作站的性能并没有发挥出来)。
应该说,P6T7 WS SuperComputer是一款当下优异的X58平台,7条PCI-E x16插槽更为它实现SLi或者CrossFire功能提供了基础。在单卡性能测试中,我们已经看到了P6T7 WS SuperComputer的强大实力。接下来,我们将测试P6T7 WS SuperComputer的双卡互联性能。不过由于Quadro优异产品才能支持SLI功能,而且价格不菲(Quadro FX5800单块卡售价接近20000元人民币),我们准备使用娱乐级显卡来实现这一测试,主要观察双卡所带来的性能提升幅度。
未来的双卡互联测试正在积极准备中,请继续关注IT168评测中心。(完)