服务器 频道

至强VS皓龙 惠普高端工作站性能大比拼

  【IT168 评测中心】从2005年推出第一台基于AMD平台的xw9300工作站开始,惠普就是AMD工作站的鉴定支持者。今年7月,借助AMD发布6核心伊斯坦布尔(Istanbul)处理器的春风,惠普宣布推出采用最新6核心皓龙(Opteron)处理器的xw9400工作站。这也是目前首款采用AMD Istanbul皓龙2400系列处理器的工作站。最近,我们收到了这台工作站的送测样机,接下来我们就一起体验一下。


惠普xw9400工作站

  本次我们测试的惠普工作站型号为xw9400。如果您有印象的话,在几个月前我们测试了一款型号为Z800的工作站,当时我们介绍说Z800是惠普今年的主打产品,也是旗舰级机型。时隔不久,xw9400也成为了旗舰级机型。不过和Z800基于Intel平台所不同的是,xw9400基于AMD平台,也是未来一段时间内的惠普的主推型号。


工作站正面

  xw9400工作站的造型和之前的Z800有些类似,银黑色的搭配也是惠普的一贯风格。不同的是,Z800有着宝马汽车一样的特别设计,相比之下xw9400的模具沿用了xw8400的风格,看起来要普通一些。


前面板上标明了产品型号,还提供了前置USB和音频输出接口

  xw9400工作站的前置接口较为丰富,除了两个USB2.0之外,还有一个IEEE1394a接口、音频输出接口。虽然看起来和我们日常使用的台式机类似,不过机身并没有提供重启按键,这一点和某些塔式服务器的配置是一致的。 


xw9400工作站背面

  xw9400工作站背面的设计比较简单,只有一些常见的接口。需要特别说明的是,当前许多工作站主板都舍弃了PS/2接口,不过这里xw9400工作站还是给予保留,适用性稍好一些。

  看过了外观,我们再来看看xw9400工作站的内部结构。


xw9400工作站内部结构

  和我们之前测试的Z800工作站类似,xw9400工作站内部也使用了模块化的设计,不过从视觉效果来说并没有Z800看起来豪华。我们可以看到机箱内部有好多塑料架,这些主要是用来固定和散热的。我们先把它们拆下来。


PCI-E显卡支架

  这个东西是显卡的固定支架。xw9400工作站使用的是Quadro FX4800,属于Quadro 10代的中高端产品。中高端显卡除了性能强悍之外,体积大重量大也是其主要特点。Quadro FX4800显卡占用了两条显卡插槽,为此惠普特别配备了一个固定支架,减少显卡对主板插槽的压力。


内存散热导风罩

  这个是内存及处理器周边散热的导风罩。这个设备通过主板4针接口供电,配备了一个8CM风扇负责内存插槽部分的散热。在普通的台式机中,根本不需要这样的设备,而对于工作站这种需要7*24小时运行的电脑来说,稳定性和可靠性是保证性能发挥的基础。


拆下处理器风扇和显卡

  我们继续,拆下处理器风扇、显卡和硬盘,工作站的主板就暴露在我们面前了。很明显,这是一台双路AMD平台的工作站,每路处理器提供了4条内存插槽。

 看过了工作站的基本结构,我们来看看它的主要配件。


皓龙2431处理器

  皓龙2431处理器就是我们经常说的Istanbul——伊斯坦布尔6核心处理器。它采用了45nm工艺,主频为2.4GHz,接口标准为Socket F,二级缓存为512KB,三级缓存为6M(共享)。


4GB DDR2 1066内存,共4条组成16GB总容量

  xw9400工作站使用了4条4GB DDR2 1066 ECC内存,使系统内存总容量达到了16GB。由于AMD平台目前还只有双通道技术,所以4条内存刚好可以使两路平台组建双通道。



来自希捷的ST3300656SS硬盘

  xw9400工作站配备了一块希捷ST3300656SS硬盘,作为工作站的存储设备。ST3300656SS硬盘隶属于希捷Cheetah 15K.6系列,使用SAS接口,传输速率为3Gbps,转速为15000rpm,缓存为16MB。

 


Quadro FX4800显卡

   本次测试的xw9400工作站搭配了Quadro FX4800显卡,这是Quadro 10代的中高端产品。Quadro FX4800核心采用55nm工艺,CUDA并行处理器核心,显卡拥有192个CUDA架构下的并行处理器核心,其显存带宽高达76.8GB/s。


台达DPS-1050CB A电源

  惠普xw9400工作站所使用的供电系统是台达DPS-1050CB A电源。这款电源是台达07年设计,08年投产的服务器系列电源,属于台达单体电源里旗舰级别产品(同系列还有DPS-800LB)。产品本身有很多亮点,例如纯12V主变压器,5V 3.3V DC-DC输出;全面贴片技术;高转换效率,07年8月设计时即通过了80plus节能认证,典型负载下转换效率高达84.99%,功率因数超过98%。目前,包括惠普ITX畅游人等诸多高端电脑都使用了这款电源。

 


主板扩展插槽

  除了豪华配件之外,主板本身的扩展性能也相当不错。它提供了4条PCI-E x16插槽、一条PCI插槽和两条PCI-X插槽,方便用户使用一些规格较老的配件(比如阵列卡)。


板载LSI SAS 1068E芯片

  事实上,说到阵列卡,惠普主板本身提供了一颗LSI SAS 1068E芯片。这颗芯片我们在服务器主板中较为常见,它能够支持简单的RAID 0、RAID 1和RAID 0+1阵列,提供了基础阵列功能。


NEC PCI-X芯片,提供PCI-X插槽

瑞昱ALC262芯片,提供基础的2.1音效
板载Marvell 88E1121千兆网络芯片

 看过了惠普xw9400工作站的基本配置,我们来看看它的散热系统。


机箱前端的8CM散热风扇

机箱背部的12CM散热风扇

  对于普通台式机来说,散热系统并不是关键,即便是在炎热的夏季,电脑也很少出现过热死机的情况(归功于处理器主频的降低和功耗的控制)。不过对于工作站来说,因为要实现苛刻的7*24小时运行,散热问题就成为了与可靠性相关的重要内容。惠普xw9400工作站提供了前后两个散热风扇,加上之前我们提到的内存散热导风罩,一共有3个设备为系统散热。再加上处理器风扇、显卡风扇和电源风扇,机箱内的风扇数量达到了7个。事实上我们在开机状态下听不到太大的噪音,说明惠普的噪音控制也还不错。


惠普xw9400工作站

  在以上的文章中,我们详细介绍了惠普xw9400工作站的硬件配置,并对其中一些配件的使用进行了分析。通过拆解我们看到,惠普xw9400工作站和之前我们测试的Z800还是有很大区别的。除了使用不同的处理器平台之外,xw9400工作站的模块化设计也没有Z800那么优秀。Z800号称是8岁的小孩都可以自由拆解,但是xw9400工作站很显然没有这么简单。

 

  下面,我们将对xw9400工作站的性能进行测试。为了能让大家看到AMD新一代平台的性能,我们选取了老规格的巴塞罗那处理器Opteron 8354作为对比,同时增加了当前Intel平台中主流的至强5500平台作为参照。

  测试对比平台的详细参数如下:

测试平台、测试环境
测试分组
类别DELL Precision T5500工作站
双路Intel Gainestown
Xeon X5550
+ Quadro FX4800
HP xw9400工作站
双路AMD Barcelona
Opteron 8354
+ Quadro FX4800
HP xw9400工作站
双路AMD Istanbul
Opteron 2431
+ Quadro FX4800
处理器子系统
处理器
双路Intel Xeon X5550双路AMD Opteron 8354双路AMD Opteron 2431
处理器架构Intel 45nm NehalemAMD Opteron 8354AMD Opteron 2431
处理器代号GainestownBarcelonaIstanbul
处理器封装Socket 1366 LGASocket F 1207Socket F 1207
处理器规格四核四核六核
处理器指令集MMX,SSE,SSE2,SSE3,SSSE3,
SSE4.1,SSE4.2,EM64T,VT
MMX,3DNow!,SSE,SSE2,
SSE3,SSE4A,x86-64
MMX,3DNow!,SSE,SSE2,
SSE3,SSE4A,x86-64
主频2.67GHz2.2GHz2.4GHz
处理器外部总线2x QPI
3200MHz
6.4GT/s
单向12.8GB/s(每QPI)
双向25.6GB/s(每QPI)
HTL:1000MHz HTL:1000MHz 
L1 D-Cache4x 32KB
8路集合关联
4x 64KB
2路集合关联
4x 64KB
2路集合关联
L1 I-Cache4x 32KB
4路集合关联
4x 64KB
2路集合关联
4x 64KB
2路集合关联
L2 Cache4x 256KB
8路集合关联
2x 512KB
16路集合关联
2x 512KB
16路集合关联
L3 Cache8MB @ 2664MHz
16路集合关联
2MB
32路集合关联
6MB
48路集合关联
主板
主板型号
DELL Precision T5500
HP xw9400
HP xw9400
芯片组Intel Tylersburg-EP
IOH:Intel 5520(Tylersburg-36D)
ICH:Intel 82801JR(ICH10R)
NVIDIA nForce Pro 3600NVIDIA nForce Pro 3600
芯片特性2x QPI
VT-d Gen 2
--
内存控制器CPU集成三通道R-ECC DDR3 1066每CPU集成双通道DDR2-667每CPU集成双通道DDR2-800
内存2GB R-ECC DDR3 1066 SDRAM x62GB R-ECC DDR2 667 SDRAM x42GB R-ECC DDR2 667 SDRAM x4
系统磁盘子系统
磁盘控制器
Intel ICH10R RAID ControllerLSI SAS 1608E ControllerLSI SAS 1608E Controller
磁盘控制器规格6x SATA 3Gb/s
MatrixRAID 0/1/3/5
6x SAS 3Gb/s
RAID 0/1/10
6x SAS 3Gb/s
RAID 0/1/10
磁盘控制器设置SATA 3Gb/s
AHCI w/NCQ
SAS 3Gb/s
AHCI w/NCQ
SAS 3Gb/s
AHCI w/NCQ
磁盘控制器驱动Intel Matrix Storage Manager
8.8.0.1009 x64
LSI Embedded MegaRAID WHQL DriverLSI Embedded MegaRAID WHQL Driver
磁盘Seagate
Barracuda 7200.11 x1

希捷Seagate
Cheetah 15K.6
ST3300656SS*1
 

希捷Seagate
Cheetah 15K.6
ST3300656SS*1
 

磁盘规格7200RPM
320GB
SATA  3Gbps
16MB Cache
15000RPM
146GB
SAS 3Gb/s
16MB Cache
NCQ
15000RPM
146GB
SAS 3Gb/s
16MB Cache
NCQ
磁盘设置SATA 3Gb/s
NCQ
50GB系统分区
SAS 3Gb/s
NCQ
50GB系统分区
SAS 3Gb/s
NCQ
50GB系统分区
图形子系统
显卡Quadro FX4800Quadro FX4800Quadro FX4800
显卡规格PCI Express x16 Gen2
320 Stream Processor @ 750MHz
1GB GDDR5 RAM @ 128-bit
850MHz
PCI Express x16 Gen2
320 Stream Processor @ 750MHz
1GB GDDR5 RAM @ 128-bit
850MHz
PCI Express x16 Gen2
320 Stream Processor @ 750MHz
1GB GDDR5 RAM @ 128-bit
850MHz
显卡驱动ForceWare 186.18ForceWare 191.66ForceWare 191.66
软件环境
操作系统Microsoft
Windows XP Professional x64 Edition SP2
Microsoft
Windows XP Professional x64 Edition SP2
Microsoft
Windows XP Professional x64 Edition SP2

  本次测试我们选择了常见的Windows XP Professional x64 Edition SP2操作系统作为平台,通过与至强5500平台及AMD巴塞罗那平台的不同对比,查看被测工作站的性能。值得一提的是,三款平台的是相同的Quadro FX4800显卡,这是NVIDIA在今年发布的Quadro 10代中高端显卡,避免了显卡性能瓶颈。AMD平台使用的是最新的ForceWare 191.66驱动,而Intel平台使用了老款的186.18驱动,这或许会对性能产生一些影响。

  根据被测工作站的情况,我们选择以下列表中的部分测试软件进行测试。

  SiSoftware Sandra 2009

  SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。从2007开始,Sandra的Arithmetic benchmarks增加了对SSE3 & SSE4 SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,另外还升级了File System benchmark和Removable Storage benchmark两个子项目。对于新的硬件的支持当然也是该软件每次升级的重要内容之一。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台,这也是我们选择这款软件的原因之一。

  Cinbench R10

  CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,我们的平台偏向于服务器多一些,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。

  SPECapc for SolidWorks 2007

  SPECapc for SolidWorks 2007是由SolidWorks开发的,用于帮助SolidWorks 2007用户快速评估自己的工作站系统的一个工具。它由VB和C语言编写而成,可运行在Windows XP 32/64bi操作系统上。测试过程中使用了大小不一的CAD/CAM solid模型,最大的模型是一个由313万个顶点组成的引擎。

  SPECviewperf 9

  SPECViewperf 9.0是是专业级、符合工业标准的 OpenGL 图形显示卡效能测试分析软件,其测试项目有六项:3dsmax、DRV、DX、Light、ProE、Ugs,包括软件执行效能仿真(3dsmax、ProE)、以及动画公园场景仿真(Light)..等等,可以产出相关的分析数据。

  SPECviewperf 10

  SPECviewperf 10是一款测试专业显卡在多个CAD/DCC应用程序中的OpenGL性能的软件,包括3ds max、CATIA、EnSight、Maya、Pro/ENGINEER、SolidWorks等。最新推出的SPECviewperf 10可以告知你在多少倍抗锯齿下显卡性能表现会低于无抗锯齿情况下的10%,并提供截图比较。

  SPECapc for Maya 6.5 v1.0

  Alias Maya是一款功能强大的软件,集3D建模、动画和渲染等功能于一身,被广泛应用于电影、电视、游戏开发、视觉设计等领域。SPECapc for Maya 6.5测试包括5个部分,总共采用了4种模型(狼人、手、蚂蚁和鱿鱼),分别测试了wireframe、Gouraud-shaded、texture、texture highlighted with a wireframe mesh、texture with wireframe mesh and control points模式下的性能。SPECapc for Maya 6.5相对于上一代的测试软件的最大改进是用glDrawElements取代了glArrayElement,具有更高的效率。

  SPECapc for 3ds Max 9

  SPECapc for 3ds Max 9是基于典型用户的使用情况设定的负载,在测试过程中会涉及到wireframe modeling、shading、texturing、lighting、blending、inverse kinematics、object creation and manipulation、editing、scene creation、particle tracing、animation 和 rendering。3ds Max 8支持OpenGL和DirectX 8.0/9.0 API。

   我们首先使用CPU-Z查看工作站当前使用的处理器。


六核心伊斯坦布尔皓龙2431

  惠普xw9400工作站使用了最新的皓龙2431处理器,它属于六核心皓龙,产品代号为伊斯坦布尔。相比我们之前曾经测试过面向多路应用的皓龙8431,两款处理器的规格相近,只不过皓龙2431是面向双路平台的产品,这一点从型号上就可以分辨出来。具体说到规格,皓龙2431的主频为2.4GHz,采用45nm工艺制造,接口标准为Socket F,共享6MB三级缓存。

  AMD今年宣布要推出自己的芯片组,不过在正式的产品上市之前,我们看到的大多数皓龙都是搭配了NVIDIA nForce Pro 3600平台。

  和Intel的Nehalem-EP所使用的三通道DDR3不同,AMD处理器目前还停留在双通道DDR2时代,这也是AMD所谓的无缝升级。不过从下一代的推土机开始,AMD也要转向更先进的DDR3平台了。

  除了CPU-Z之外,Everest软件可以提供更为详细的处理器信息。


12个处理器核心,看起来够壮观的


处理器的详细规格介绍

  我们刚才说过,AMD针对皓龙平台目前还没有推出合适的芯片组,我们常见的搭配都是使用NVIDIA芯片的。 


  软件将皓龙处理器识别成为了北桥。很久之前,AMD就在处理器内部整合了内存控制器,替代了北桥的大部分功能。



所谓的南桥部分则是由两颗NVIDIA芯片构成的,主控芯片是nForce Pro 3600

  看过了工作站的处理器、芯片组信息,我们再来看看它所搭配的显卡。


Quadro FX4800显卡规格

  这里,我们看到Quadro FX4800的接口类型还是PCI-E 1.0,事实上Quadro 10代都可以支持PCI-E 2.0规格,这种情况显然是由于主板还只能够支持PCI-E 1.0。从1.0到2.0,每条串行线路数据传输率由原来2.5Gbps提升到了5Gbps,供电能力也得到了大幅度提升。换句话说,PCI-E 2.0是PCI-E 1.0的速度升级版和供电能力提升版。这一点对于测试结果也会有一定影响。


  Quadro FX4800显卡大家都很熟悉了,我们之前就曾测试过这款产品。它的核心采用55nm工艺,显卡拥有192个CUDA架构下的并行处理器核心,其显存带宽高达76.8GB/s。另外,显卡支持DirectX10,通过最新的ForceWare 191.66,Quadro全系列显卡可以支持OpenGL 3.2。

   SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,它可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台。我们利用了其中多个性能测试模块对于被测系统的性能进行了快速的测试。

SiSoftware Sandra Pro Business 2009

测试对象

DELL Precision T5500工作站
双路Intel Gainestown
Xeon X5550
+ Quadro FX4800

HP xw9400工作站
双路AMD Barcelona
Opteron 8354
+ Quadro FX4800

HP xw9400工作站
双路AMD Istanbul
Opteron 2431
+ Quadro FX4800

Processor Arithmetic Benchmark
处理器架构测试

Dhrystone ALU

138679MIPS

62091MIPS104576MIPS

Dhrystone ALU vs SPEED

52.13MIPS/MHz

28.22MIPS/MHz43.57MIPS/MHz

Whetstone iSSE3

121017MFLOPS

49606MFLOPS83301MFLOPS

Dhrystone iSSE3 vs SPEED

45.50MFLOPS/MHz

22.55MFLOPS/MHz34.71MFLOPS/MHz

Processor Multi-Media Benchmark
处理器多媒体测试

Multi-Media Int x8 iSSE4.1

284.58MPixel/s

197.95MPixel/s326.09MPixel/s

Multi-Media Int x8 iSSE4.1 vs SPEED

106.99kPixels/s/MHz

89.98kPixels/s/MHz135.87kPixels/s/MHz

Multi-Media Float x4 iSSE2

217.19MPixel/s

120.24MPixel/s201.5MPixel/s

Multi-Media Float x4 iSSE2 vs SPEED

81.65kPixels/s/MHz

54.65kPixels/s/MHz83.96kPixels/s/MHz

Multi-Media Double x2 iSSE2

119.23MPixel/s

66.13MPixel/s110.73MPixel/s

Multi-Media Double x2 iSSE2 vs SPEED

44.82kPixels/s/MHz

30.06kPixels/s/MHz46.14kPixels/s/MHz

Multi-Core Efficiency Benchmark

Inter-Core Bandwidth

69.66GB/s

5.21GB/s6.09GB/s

Inter-Core Bandwidth vs SPEED

26.82MB/s/MHz

2.42MB/s/MHz2.60MB/s/MHz

Inter-Core Latency
(越小越好)

17ns

169ns160ns

Inter-Core Latency vs SPEED
(越小越好)

0.01ns/MHz

0.08ns/MHz0.07ns/MHz

Memory Bandwidth Benchmark
内存带宽测试

Int Buff'd iSSE2 Memory Bandwidth

15.08GB/s

15.08GB/s17.85GB/s

Int Buff'd iSSE2 Memory Bandwidth vs SPEED

-

23.18MB/s/MHz27.44MB/s/MHz

Float Buff'd iSSE2 Memory Bandwidth

15.08GB/s

14.97GB/s17.82GB/s

Float Buff'd iSSE2 Memory Bandwidth vs SPEED

-

23.02MB/s/MHz27.40MB/s/MHz

Memory Latency Benchmark
内存延迟测试

Memory(Random Access) Latency
(越小越好)

114ns

133ns124ns

Memory(Random Access) Latency vs SPEED
(越小越好)

-

0.20ns/MHz0.19ns/MHz

Speed Factor
(越小越好)

78.00

95.4095.90

Internal Data Cache Latency
(越小越好)

4clocks

3clocks3clocks

L2 On-board Cache Latency
(越小越好)

10clocks

16clocks16clocks

Cache and Memory Benchmark
缓存及内存测试

Cache/Memory Bandwidth

128.85GB/s

69.80GB/s113.5GB/s

Cache/Memory Bandwidth vs SPEED

49.60MB/s/MHz

32.49MB/s/MHz48.43MB/s/MHz

Speed Factor

25.70

27.1043.70

Internal Data Cache

424.43GB/s

260.25GB/s439.60GB/s

L2 On-board Cache

395.93GB/s

143.80GB/s283.78GB/s

Graphics Processing
图形处理性能

Native Float Shaders

537.10MPixel/s

272.04MPixel/s274.48MPixel/s

Native Float Shaders vs SPEED

542.11kPixels/s/MHz

225.95kPixels/s/MHz227.97kPixels/s/MHz

Graphics Bandwidth
图形带宽

Internal Memory Bandwidth

78.03GB/s

59.35GB/s59.56GB/s

Data Transfer Bandwidth

9.25GB/s

3.08GB/s2.90GB/s

Internal Memory Bandwidth

78.03GB/s59.35GB/s59.56GB/s

System to Device Bandwidth

9.58GB/s3.10GB/s2.93GB/s

System to Device Bandwidth Efficiency

61.30%79.36%75.13%

Device to System Bandwidth

6.34GB/s

2.92GB/s2.60GB/s

Device to System Bandwidth Efficiency

40.57%

74.82%66.56%

  测试结果可以通过两部分来分析。首先,AMD自家的巴塞罗那和伊斯坦布尔进行对比,很明显使用六核心的xw9400工作站性能要好很多,在处理器测试中的各个项目都有明显的提升,内存提升则相对小了一些。而与Intel平台的比较来看,由于至强5500系列处理器规格更为先进,可以支持SSE4,而AMD的Opteron只能支持SSE3,所以两者的性能看起来差距很大。另外一方面,至强E5550在主频上也略高于皓龙Opteron 2431,因此取得优势并不奇怪。

  CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,我们的平台偏向于服务器多一些,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。

CineBench R10
测试产品

DELL Precision T5500工作站
双路Intel Gainestown
Xeon X5550
+ Quadro FX4800

HP xw9400工作站
双路AMD Barcelona
Opteron 8354
+ Quadro FX4800

HP xw9400工作站
双路AMD Istanbul
Opteron 2431
+ Quadro FX4800

显卡Quadro FX4800Quadro FX4800Quadro FX4800
CPU Benchmark
Rendering (1 CPU)4045 CB-CPU2097 CB-CPU2800 CB-CPU
Rendering (x CPU)26984 CB-CPU14617 CB-CPU23802 CB-CPU
Multiprocessor Speedup6.67x6.97x8.50x
OpenGL Benchmark
OpenGL Standard8253 CB-GFX3837 CB-GFX5624 CB-GFX

  CineBench R10测试中,处理器性能依然占据重要的比例。和之前的测试结果类似,6核心果然比4核心更为出色,Opteron 2431的性能比Opteron 8654强出许多,性能提升大概在30%以上,Multiprocessor Speedup参数更是达到了惊人的8.5x。对比Intel平台,我们却发现Opteron还是有着不小的差距,特别是在单处理器的性能上表现落后很多。而在多处理器中两者的成绩接近,Multiprocessor Speedup数值也反映出12核心在这里的作用。

  受到处理器的影响,OpenGL测试成绩也出现了差距很大的状况,只能说伊斯坦布尔相比上一代产品还是强出许多。

   SPECapc for SolidWorks 2007是由SolidWorks开发的,用于帮助SolidWorks 2007用户快速评估自己的工作站系统的一个工具。它由VB和C语言编写而成,可运行在Windows XP 32/64bi操作系统上。测试过程中使用了大小不一的CAD/CAM solid模型,最大的模型是一个由313万个顶点组成的引擎。


DELL Precision T5500工作站测试成绩
 HP xw9400工作站(双路Opteron 8354)测试成绩
 HP xw9400工作站(双路Opteron 2431)测试成绩

  处理器效能的问题继续体现出来。由于三款平台使用的是同样的显卡,在SolidWorks 2007测试中影响性能发挥的因素更多来源于处理器,处理器在这里已经成为了性能瓶颈。单独比较AMD平台,HP xw9400工作站(双路Opteron 2431)的测试成绩为182.48秒,相比HP xw9400工作站(双路Opteron 8354)的231.50秒来说提升了20%以上;前者的总分也达到了2.75分,比后者有了近30%的提升。

  相比Intel至强5500平台,131.24的耗时和3.72分的总成绩高出AMD平台好多,两者的差距在40-50%,看来AMD处理器在这项测试中依然落后于Intel。

  SPECapc for 3ds Max 9是基于典型用户的使用情况设定的负载,在测试过程中会涉及到wireframe modeling、shading、texturing、lighting、blending、inverse kinematics、object creation and manipulation、editing、scene creation、particle tracing、animation 和 rendering。3ds Max 9提供了32位/64位两种版本,我们使用的是32位版本。

  大家很熟悉的3ds Max 9测试成绩,依然是以不同模式下的耗时作为考察平台性能的基准。耗时最少的还是Intel至强5500平台,从图表来看耗时只有巴塞罗那系统的一半多。伊斯坦布尔平台的耗时也低于巴塞罗那,相比之下性能提升约为20%左右。

  SPECViewperf 9.0是专业级、符合工业标准的 OpenGL 图形显示卡效能测试分析软件,其测试项目有六项:3dsmax、DRV、DX、Light、ProE、Ugs,包括软件执行效能仿真(3dsmax、ProE)、以及动画公园场景仿真(Light)..等等,可以产出相关的分析数据。

  SPECViewperf 9.0项目考查系统的硬件能力,这里不同平台的差距看起来缩小了很多。除了sw-01、maya-02等项目之外,三款平台的成绩呈规则的阶梯状排列,其中Intel至强5500无疑是优胜者,在各个项目中都有明显的领先优势。而对于AMD来说,HP xw9400工作站(双路Opteron 2431)也要领先Opteron 8354很多,幅度约为30%以上。

  SPECviewperf 10是一款测试专业显卡在多个CAD/DCC应用程序中的OpenGL性能的软件,包括3ds max、CATIA、EnSight、Maya、Pro/ENGINEER、SolidWorks等。最新推出的SPECviewperf 10可以告知你在多少倍抗锯齿下显卡性能表现会低于无抗锯齿情况下的10%,并提供截图比较。 


DELL Precision T5500工作站抗锯齿能力测试
 HP xw9400工作站(双路Opteron 8354)抗锯齿能力测试
HP xw9400工作站(双路Opteron 2431)抗锯齿能力测试

  SPECviewperf 10的抗锯齿能力测试,对于Quadro FX4800显卡来说,最多可以支持到32倍抗锯齿,测试结果所表现出的趋势与之前几个项目没有大的区别。


DELL Precision T5500工作站多线程能力测试
HP xw9400工作站(双路Opteron 8354)多线程能力测试
HP xw9400工作站(双路Opteron 2431)多线程能力测试 

  相比抗锯齿来说,多线程的测试结果差距并不是很大,特别是HP xw9400工作站(双路Opteron 2431)的成绩已经与Intel至强5500平台相当接近。而相比巴塞罗那来说,HP xw9400工作站(双路Opteron 2431)在抗锯齿测试中的提升约为30%,在多线程的性能提升为20%。

  Alias Maya是一款功能强大的软件,集3D建模、动画和渲染等功能于一身,被广泛应用于电影、电视、游戏开发、视觉设计等领域。SPECapc for Maya 6.5测试包括5个部分,总共采用了4种模型(狼人、手、蚂蚁和鱿鱼),分别测试了wireframe、Gouraud-shaded、texture、texture highlighted with a wireframe mesh、texture with wireframe mesh and control points模式下的性能。SPECapc for Maya 6.5相对于上一代的测试软件的最大改进是用glDrawElements取代了glArrayElement,具有更高的效率。

  为什么在诸多测试项目中,AMD平台一直落后,无论是之前的Opteron巴塞罗那还是最新的Opteron伊斯坦布尔?看看总成绩的CPU项目,答案就很明显了,这个项目也是Maya 2008测试中差距最大的一项。对于基于同样显卡的系统,处理器性能在很大程度上限制了性能的发挥。最终,我们测试的HP xw9400工作站(双路Opteron 2431)的实际得分为2.88分,相比Intel至强5500平台差了许多,不过相比自家的巴塞罗那平台还有25%的优势。

  【IT168 评测中心】今年六月,AMD发布了代号为伊斯坦布尔(Istanbul)的六核心皓龙处理器,经过半年的推广,目前这款处理器已经广泛应用于服务器和工作站中。本次,我们测试的惠普xw9400工作站就是基于双路Opteron 2431处理器的AMD工作站。之前,我们对于同属伊斯坦布尔系列的多路工作站Opteron 8431进行过简单的测试,而这次则给了我们更多了解这一系列处理器的机会。


惠普xw9400工作站

  就本次测试的惠普xw9400工作站来说,这是惠普今天推出的优异AMD平台工作站,也是为数不多的基于伊斯坦布尔平台的新产品。相比之前惠普同样定位高端的Z800工作站来说,xw9400工作站的造型只是沿用了xw8400的设计,包括内部的布局也没有太大的变化,由此看出它与Z800还有不小的差距(Z800的全模块化设计非常出色)。

  从配置来看,xw9400工作站可谓是非常强劲,双路Opteron 2431处理器提供了12个物理核心,搭配16GB的内存和Quadro FX4800显卡使得工作站的性能得到充分发挥。为了提升磁盘性能,xw9400工作站还使用了15000rpm的SAS硬盘,通过板载的LSI SAS 1068E芯片进行控制。

  既然有如此强悍的配置,xw9400工作站的性能自然也值得我们期待。通过与近似规格皓龙Opteron 8354工作站的对比,我们发现6核心伊斯坦布尔的性能相比以往的巴塞罗那系列的确有不错的提升,测试中工作站的性能要高了20%-40%,提升幅度明显。


伊斯坦布尔(Istanbul)处理器核心

  不过测试中表现出的问题也同样突出。受限于处理器规格的影响,AMD平台下系统的很多性能没有得到充分的发挥,这直接导致了惠普xw9400工作站在与至强5500平台的对比中落败。同样的显卡,同样的测试项目,6核心对4核心,依然在所有项目中大大落后于竞争对手,很明显是AMD处理器的问题。这个问题包括了处理器主频、三通道内存、超线程技术、处理器指令集等一系列的影响,是AMD与Intel的差异,不能完全归咎于惠普xw9400工作站本身。

  如上,对于AMD平台来说,惠普xw9400工作站堪称优异。我们相信,如果AMD能够在处理器开发上多花点心思,如果AMD能够多思考如何将经费投入到产品研发而不是拿去给高管加薪,AMD还会不断进步。

0
相关文章