【IT168评测中心】在Intel推出崭新的处理器架构Nehalem之后,很快工作站厂商们推出了基于新处理器的工作站平台。虽然Nehalem的桌面版本Core i7以及服务器版本Xeon 5500系列都可以用在工作站上,然而,这一次Intel特别推出了用于工作站的Nehalem处理器系列:Nehalem-WS,WS就是Workstation(工作站)的意思。
Nehalem-WS仍然使用了Xeon的名号,和Core i7相比,Nehalem-WS支持ECC内存和Registered内存,和Nehalem-EP相比,Nehalem-WS具有较高的默认频率,这让其浮点性能比Nehalem-EP更高,关于工作站版本的Nehalem-EP,可以参看这里:
前日,我们收到了HP(惠普)送来的Z400工作站,这是一台单路工作站,不过配置并不低:优异的Nehalem-WS 1S Xeon W3570处理器和,NVIDIA Quadro FX4800专业图形卡。Xeon W3570是单路处理器当中的最强者,默认频率3.2GHz,在Turbo Boost模式下可以最高达到3.466GHz,下面我们就来看看HP Z400工作站的性能。
2GB的DDR3 1333内存;Xeon W3570支持三通道R-ECC DDR3 1333内存,Unbuffered情况下最多24GB容量,使用Registered则可以达到48GB,前提是有人造出单条8GB的Registered内存模组
Realtek ALC262:虽然型号不太像,不过它确实是一个HDA Codec
3.2GHz的Xeon W3570,在一个或者两个核心满负荷的情况下这两个核心会被Turbo Boost到3.466GHz(理论值),在所有核心都满负荷的情况下则可以Turbo Boost到3.333GHz,当然,需要开启Turbo Boost功能
标为HP 0AE4H的主板
三通道DDR3 1333内存
Elpida尔必达的内存
顺便提一下: Everest有珠穆朗玛峰的意思。
Quadro FX 4800具有192个Unified Shader(统一渲染单元,或者用通俗的说法:流处理器),频率为1200MHz,此外它还具有384bit的显存位宽,频率800MHz,带宽达到了76.8GB/s,容量则达到了1536MB,价格不菲
FX4800属于第十代Quadro系列产品
关于Quadro FX4800的SLI能力还是一个谜:一些资料说它支持SLI Frame Rendering(如上图),一些则不然,此外,FX4800支持在Gsync和SDI功能,这些特性在低档次的显卡上可能不被支持
测试平台、测试环境 | |||||
测试分组 | |||||
类别 | HP Z400工作站 单路Intel Gainestown Xeon W3570 | DELL Precision T5500工作站 双路Intel Gainestown Xeon X5550 | |||
处理器子系统 | |||||
处理器 | 单路Intel Xeon W3570 | 双路Intel Xeon X5550 | |||
处理器架构 | Intel 45nm Nehalem | Intel 45nm Nehalem | |||
处理器代号 | Gainestown (Nehalem-WS 1S) | Gainestown (Nehalem-EP) | |||
处理器封装 | Socket 1366 LGA | Socket 1366 LGA | |||
处理器规格 | 四核 | 四核 | |||
处理器指令集 | MMX,SSE,SSE2,SSE3,SSSE3, SSE4.1,SSE4.2,EM64T,VT | MMX,SSE,SSE2,SSE3,SSSE3, SSE4.1,SSE4.2,EM64T,VT | |||
主频 | 3.2GHz | 2.66GHz | |||
Turbo Boost主频 (四核心) | 3.333GHz(+133MHz) | 2.93GHz(+266MHz) | |||
Turbo Boost 主频 (单/双核) | 3.466GHz(+266MHz) | 3.06GHz(+400MHz) | |||
处理器外部总线 | 1x QPI 3200MHz 6.40GT/s 单向12.8GB/s(每QPI) 双向25.6GB/s(每QPI) | 2x QPI 3200MHz 6.40GT/s 单向12.8GB/s(每QPI) 双向25.6GB/s(每QPI) | |||
L1 D-Cache | 4x 32KB 8路集合关联 | 4x 32KB 8路集合关联 | |||
L1 I-Cache | 4x 32KB 4路集合关联 | 4x 32KB 4路集合关联 | |||
L2 Cache | 4x 256KB 8路集合关联 | 4x 256KB 8路集合关联 | |||
L3 Cache | 8MB @ 2668.7MHz 16路集合关联 | 8MB @ 2668.7MHz 16路集合关联 | |||
主板 | |||||
主板型号 | HP Z400 | DELL Precision T5500 | |||
芯片组 | Intel Tylersburg IOH:Intel X58(Tylersburg-36S) ICH:Intel 82801JR(ICH10R) | Intel Tylersburg-EP IOH:Intel 5500(Tylersburg-24D) ICH:Intel 82801JR(ICH10R) | |||
芯片特性 | 1x QPI 36 PCI Express Gen2 Lanes VT-d Gen 2 | 2x QPI 24 PCI Express Gen2 Lanes VT-d Gen 2 | |||
内存控制器 | 每CPU集成三通道R-ECC DDR3 1333 | 每CPU集成三通道R-ECC DDR3 1333 | |||
内存 | 4GB R-ECC DDR3 1333 SDRAM x6 | 4GB R-ECC DDR3 1333 SDRAM x6 | |||
系统磁盘子系统 | |||||
磁盘控制器 | Intel ICH10R SATA AHCI Controller | Intel ICH10R SATA AHCI Controller | |||
磁盘控制器规格 | 6x SAS 3Gb/s AHCI w/ NCQ RAID 0/1/3/5 | 6x SAS 3Gb/s AHCI w/ NCQ RAID 0/1/3/5 | |||
磁盘控制器设置 | AHCI w/ NCQ | AHCI w/ NCQ | |||
磁盘控制器驱动 | Intel Matrix Storage Manager 8.8.0.1009 | Intel Matrix Storage Manager 8.8.0.1009 | |||
磁盘 | Seagate Barracuda 7200.10 ST3250310AS | WesternDigital VelociRaptor WD1600HLFS | |||
磁盘规格 | 7200RPM 250GB SATA 3Gb/s NCQ 16MB Cache | 10000RPM 160GB SATA 3Gb/s NCQ 16MB Cache | |||
磁盘设置 | SATA 3Gb/s NCQ 50GB系统分区 | SATA 3Gb/s NCQ 50GB系统分区 | |||
软件环境 | |||||
操作系统 | Microsoft Windows XP Professional x64 Edition SP2 | Microsoft Windows XP Professional x64 Edition SP2 |
测试结果与一台双路Nehalem-EP工作站作对比。
根据被测工作站的情况,我们选择以下列表中的部分测试软件进行测试。
Cinbench R10
CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,我们的平台偏向于服务器多一些,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。
POV-Ray 3.6
POV-Ray是由名为Persistence OF Vision Devlopmentteam的开发小组在DKBTrace2.12的基础上编写而成的一个场景渲染软件。它为了减少了编制算法程序的时间而使用专用的场景描述语言来绘制三维场景。POV-Ray同时支持32位和64位,提供了Windows、Linux等多个平台下的运行版本。
SPECapc for SolidWorks 2007
SPECapc for SolidWorks 2007是由SolidWorks开发的,用于帮助SolidWorks 2007用户快速评估自己的工作站系统的一个工具。它由VB和C语言编写而成,可运行在Windows XP 32/64bi操作系统上。测试过程中使用了大小不一的CAD/CAM solid模型,最大的模型是一个由313万个顶点组成的引擎。
SPECviewperf 10
SPECviewperf 10是一款测试专业显卡在多个CAD/DCC应用程序中的OpenGL性能的软件,包括3ds max、CATIA、EnSight、Maya、Pro/ENGINEER、SolidWorks等。最新推出的SPECviewperf 10可以告知你在多少倍抗锯齿下显卡性能表现会低于无抗锯齿情况下的10%,并提供截图比较。
SPECapc for 3ds Max 9
SPECapc for 3ds Max 9是基于典型用户的使用情况设定的负载,在测试过程中会涉及到wireframe modeling、shading、texturing、lighting、blending、inverse kinematics、object creation and manipulation、editing、scene creation、particle tracing、animation 和 rendering。3ds Max 8支持OpenGL和DirectX 8.0/9.0 API。
CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,我们的平台偏向于服务器多一些,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。
CineBench R10 64bit | ||
处理器 | HP Z400工作站 单路Intel Gainestown Xeon W3570 | DELL Precision T5500工作站 双路Intel Gainestown Xeon X5550 |
显卡 | NVIDIA Quadro FX4800 | NVIDIA Quadro FX3800 |
CPU Benchmark | ||
Rendering (1 CPU) | 4587 CB-CPU | 4070 CB-CPU |
Rendering (x CPU) | 19236 CB-CPU | 24739 CB-CPU |
Multiprocessor Speedup | 4.19x | 6.08x |
OpenGL Benchmark | ||
OpenGL Standard | 6836 CB-GFX | 7574 CB-GFX |
可以看出,最强的单路Nehalem处理器还是和双路有差距,性能上和价格上都是。不过,W3570和FX4800的高规格让这个差距显得不是很大。
POV-Ray是由名为Persistence OF Vision Devlopmentteam的开发小组在DKBTrace2.12的基础上编写而成的一个场景渲染软件。它为了减少了编制算法程序的时间而使用专用的场景描述语言来绘制三维场景。POV-Ray同时支持32位和64位,提供了Windows、Linux等多个平台下的运行版本,最新的稳定版是3.6。
SPECapc for SolidWorks 2007是由SolidWorks开发的,用于帮助SolidWorks 2007用户快速评估自己的工作站系统的一个工具。它由VB和C语言编写而成,可运行在Windows XP 32/64bi操作系统上。测试过程中使用了大小不一的CAD/CAM solid模型,最大的模型是一个由313万个顶点组成的引擎。
戴尔Precision T5500测试成绩
在处理器性能上,双路显然要比单路要好,不过Z400的显卡性能更高。最后,Z400的普通酷鱼硬盘比T5500的变异版猛禽弱不少。当然,工作站的部件是可以定制的。
SPECapc for 3ds Max 9是基于典型用户的使用情况设定的负载,在测试过程中会涉及到wireframe modeling、shading、texturing、lighting、blending、inverse kinematics、object creation and manipulation、editing、scene creation、particle tracing、animation 和 rendering。3ds Max 9提供了32位/64位两种版本,我们使用的是32位版本。
和上一个SolidWorks 2007测试相比,3ds Max 9更依赖于显卡一些,因此这个测试上Z400表现更好:FX4800比FX3800更强,虽然后者使用的处理器总体性能比较好一些。
SPECViewperf 9.0是专业级、符合工业标准的 OpenGL 图形显示卡效能测试分析软件,其测试项目有六项:3dsmax、DRV、DX、Light、ProE、Ugs,包括软件执行效能仿真(3dsmax、ProE)、以及动画公园场景仿真(Light)..等等,可以产出相关的分析数据。
各个项目互有上下,一方面,Z400的显卡FX4800要好一些,另一方面T5500的双路处理器相对又更强一些。
SPECviewperf 10是一款测试专业显卡在多个CAD/DCC应用程序中的OpenGL性能的软件,包括3ds max、CATIA、EnSight、Maya、Pro/ENGINEER、SolidWorks等。最新推出的SPECviewperf 10可以告知你在多少倍抗锯齿下显卡性能表现会低于无抗锯齿情况下的10%,并提供截图比较。
fill in config.txt fill in config.txt | ||||||||
---|---|---|---|---|---|---|---|---|
Viewset | Composite | Mulitsample Performance | ||||||
3dsmax-04 | 54.05 | no result | ||||||
catia-02 | 67.34 | no result | ||||||
ensight-03 | 55.91 | no result | ||||||
maya-02 | 236.25 | no result | ||||||
proe-04 | 69.31 | no result | ||||||
sw-01 | 150.65 | no result | ||||||
tcvis-01 | 39.68 | no result | ||||||
ugnx-01 | 33.58 | no result |
标准测试
fill in config.txt fill in config.txt | ||||||||
---|---|---|---|---|---|---|---|---|
Viewset | Composite | Mulitsample Performance | ||||||
3dsmax-04 | 54.05 | up to 16x | ||||||
catia-02 | 68.53 | up to 4x | ||||||
maya-02 | 254.08 | up to 0x | ||||||
proe-04 | 71.47 | up to 0x | ||||||
sw-01 | 152.83 | up to 2x | ||||||
tcvis-01 | 40.18 | up to 2x |
多重采样能力测试
fill in config.txt fill in config.txt | ||||||||
---|---|---|---|---|---|---|---|---|
Viewset | Composite 1 thread | Composite 2 thread | Composite 4 thread | |||||
3dsmax-04 | 54.05 | 106.84 | 137.27 | |||||
catia-02 | 68.53 | 69.06 | 88.73 | |||||
maya-02 | 254.08 | 156.95 | 155.79 | |||||
proe-04 | 71.47 | 63.87 | 73.74 | |||||
sw-01 | 152.83 | 152.29 | 171.56 | |||||
tcvis-01 | 40.18 | 27.51 | 27.43 |
多线程性能测试
fill in config.txt fill in config.txt | ||||||||
---|---|---|---|---|---|---|---|---|
Viewset | Composite no AA | Composite 2X | Composite 4X | Composite 8X | Composite 16X | Composite 32X | ||
3dsmax-04 | 54.05 | 55.24 | 55.24 | 51.04 | 50.05 | 35.66 | ||
catia-02 | 67.34 | 65.78 | 63.82 | 54.13 | 51.23 | 29.08 | ||
ensight-03 | 55.91 | 55.87 | 52.38 | 46.84 | 39.16 | 27.74 | ||
maya-02 | 236.25 | 187.59 | 164.24 | 123.19 | 95.47 | 48.72 | ||
proe-04 | 69.31 | 62.80 | 60.43 | 50.69 | 48.84 | 28.22 | ||
sw-01 | 150.65 | 142.10 | 132.97 | 112.69 | 91.51 | 47.26 | ||
tcvis-01 | 39.68 | 38.00 | 35.82 | 28.56 | 25.76 | 15.73 | ||
ugnx-01 | 33.58 | 38.22 | 34.44 | 24.21 | 24.75 | 14.70 |
FSAA: Full Scene Antialiasing全屏抗锯齿性能测试
DELL T5500测试:全屏抗锯齿
DELL T5500测试:多线程性能
测试可以看出,在主要依赖于显卡的全屏抗锯齿性能测试当中,使用FX4800的Z400性能要好一点(一些项目互有高低),多线程性能测试也是如此,不过我们需要注意到SPECViewperf的多线程测试只测试到4个线程,而Z400和T5500分别具有8和16个硬件线程能力,因此要注意这个测试成绩实际上只是单个处理器的对比。
【IT168评测中心】用于高性能计算或者三位图形制作的工作站需要强大的浮点处理能力,为了这类应用,Intel特别推出了专门的Nehalem处理器系列:Nehalem-WS,WS就是Workstation(工作站)的意思,和通常的Core i7/Nehalem-EP相比,这类处理器默认频率较高,可以在各种情况下都保证充足的浮点运算能力。
HP Z400图形工作站采用了Xeon W3570处理器,属于Nehalem-WS 1S系列的最高型号,默认频率3.2GHz,在Turbo Boost状态下可以达到3.46GHz(一或二个核心满负荷)或者3.333GHz(所有核心都满负荷),比一般的Core i7和Nehalem-EP都要强。HPZ400还采用了NVIDIA Quadro FX4800高端图形卡,具有192个流处理器,并具有1.5GB 384bit 800MHz DDR3(1.6GT/s)显存,提供了非常强大的图形生成能力,比较适合注重图形卡能力的应用如3DS Max等。主要依赖处理器能力的应用选用双路Nehalem系统更为合适。