服务器 频道

升级佳品 华硕Z8PE-D12X服务器主板评测

  【IT168评测中心】无论是台式机还是服务器,很多人购买的时候都很注重主板的选购。作为系统的基础平台,主板的品质关系到电脑整体的运行状况,也对性能发挥产生重要的影响。不过看看各个厂商,同芯片组的产品肯定不止一款,即便是服务器主板,也有各种型号可供选择。那么这些主板之间究竟性能存在怎样的差别?如何才能选购到合适的主板呢?今天我们要测试一款来自华硕的双路服务器主板,相信会给大家一个明确的产品定位。


华硕Z8PE-D12X服务器主板

  华硕为Nehalem-EP处理器提供了七款不同规格的平台,分别是:Z8NA-D6C、Z8NA-D6、Z8NH-D12、Z8PE-D18、Z8PE-D12、Z8PE-D12X、Z8NR-D12(这还仅仅是大陆地区的零售版本,不包括海外版本及OEM版本)。本次,我们测试的Z8PE-D12X是一款为机架服务器设计的产品,通过与自家同芯片组其他型号的对比,看看这款主板的用途所在。 


华硕Z8PE-D12X主板外观

处理器插槽位置,完善的供电系统


橙、黑两色的DDR3内存插槽,共12根,最大支持96GB DDR3 1333MHz内存


板载4条PCI-E插槽

外部接口部分

板载的NEC D720404F1芯片,提供2个PCI-X总线
ASPEED芯片,这是一颗显示芯片,同时也具备了远程管理功能 

  华硕Z8PE-D12X服务器主板扩展插槽非常丰富,提供了4个PCI-E X16接口。考虑到老用户的升级,华硕Z8PE-D12X主板还有2条PCI-X接口。我们看到的最下面的接口是PIKE Slot插槽,用来连接华硕存储扩展卡(选配件)。 

 


显卡PWM控制芯片L6713A

奇梦达HYB18T512161B2F显存颗粒,容量64MB

RTL8201N百兆网络芯片

国产服务器中常见的Intel WG82574L千兆网络芯片 

  SPEC CPU 2006 v1.0.1

  SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。

  SPEC CPU 2006是SPEC组织推出的CPU子系统评估软件最新版,我们之前使用的是SPEC CPU 2000。和上一个版本一样,SPEC CPU 2006包括了CINT2006和CFP2006两个子项目,前者用于测量和对比整数性能,而后者则用于测量和对比浮点性能,SPEC CPU 2006中对SPEC CPU 2000中的一些测试进行了升级,并抛弃/加入了一些测试,因此两个版本测试得分并没有可比较性。

  SPEC CPU测试中,测试系统的处理器、内存子系统和使用到的编译器(SPEC CPU提供的是源代码,并且允许测试用户进行一定的编译优化)都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2006的影响非常的小。

  SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、DCC以及科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。

  我们在被测服务器中安装了当前最新版本的Intel C++ 10.1.025 Compiler、Intel Fortran 10.1.025 Compiler这两款SPEC CPU 2006必需的编译器,通过最新出现的QxS编译参数,Intel Compiler 10版本开始支持对Intel SSE4指令集进行优化(假如只支持SSE3,则使用QxT编译参数)。我们另外安装了Microsoft Visual Studio 2003 SP1提供必要的库文件。按照SPEC的要求我们根据自己的情况编辑了新的Config文件,使用了较多的编译选项。我们根据被测系统选择实际可同时处理的线程数量,最后得到SPEC rate base测试结果(基于base标准编译,SPEC base rate测试代表系统同时处理多个任务的能力)。

  和其它测试部件不同,SPEC CPU 2006需要大量的系统物理内存,我们的SPEC测试在64bit Windows Server 2008 Enterprise下完成,对于每个运算核心,配置1.5GB内存。

  • Iometer 2006.7.27

  Iometer是一款功能非常强大的IO测试软件,它除了可以在本机运行测试本机的IO(磁盘)性能之外,还提供了模拟网络应用的能力。在这次的测试中,我们仅仅让它在本机运行测试服务器的磁盘性能。为了全面测试被测服务器的IO性能,我们分别选择了不同的测试脚本。

  • Max_throughput(read):文件尺寸为64KB,100%读取操作,随机率为0%,用于检测磁盘系统的最大读取吞吐量

  • Max_IO(read):文件尺寸为512B,100%读取操作,随机率为0%,用于检测磁盘系统的最大读取操作IO处理能力

  • Max_throughput(write):文件尺寸为64KB,0%读取操作,随机率为0%,用于检测磁盘系统的最大写入吞吐量

  • Max_IO(write):文件尺寸为512B,0%读取操作,随机率为0%,用于检测磁盘系统的最大写入操作IO处理能力

  • SiSoftware Sandra v2009

  SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。从2007开始,Sandra的Arithmetic benchmarks增加了对SSE3 & SSE4 SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,另外还升级了File System benchmark和Removable Storage benchmark两个子项目。对于新的硬件的支持当然也是该软件每次升级的重要内容之一。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台,这也是我们选择这款软件的原因之一。

  • CineBench R10

  CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,在服务器测试平台中显示子系统不重要,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。

  • ScienceMark 2.0

  ScienceMark 2.0可以用来评估测试对象在执行科学计算时的运算效能,这部分效能主要和处理器子系统和内存子系统相关。我们主要用来评估测试对象的内存子系统的性能。

测试平台、测试环境
测试分组
类别
华硕Z8PS-D12华硕Z8PE-D12X
处理器子系统
处理器
双路Intel Xeon X5570
双路Intel Xeon X5570
处理器架构
Intel 45nm NehalemIntel 45nm Nehalem
处理器代号
GainestownGainestown
处理器封装
Socket 1366 LGASocket 1366 LGA
处理器规格
四核四核
处理器指令集
MMX,SSE,SSE2,SSE3,SSSE3,
SSE4.1,SSE4.2,EM64T,VT
MMX,SSE,SSE2,SSE3,SSSE3,
SSE4.1,SSE4.2,EM64T,VT
主频2.93GHz2.93GHz
处理器外部总线2x QPI
3200MHz
6.40GT/s
单向12.8GB/s(每QPI)
双向25.6GB/s(每QPI)
2x QPI
3200MHz
6.40GT/s
单向12.8GB/s(每QPI)
双向25.6GB/s(每QPI)
L1 D-Cache
4x 32KB
8路集合关联
4x 32KB
8路集合关联
L1 I-Cache
4x 32KB
4路集合关联
4x 32KB
4路集合关联
L2 Cache
4x 256KB
8路集合关联
4x 256KB
8路集合关联
L3 Cache
8MB
16路集合关联
8MB
16路集合关联
主板型号
ASUS Z8PS-D12-1U
ASUS Z8PE-D12X
芯片组
Intel Tylersburg-EP
IOH:Intel 5520(Tylersburg-36D)
ICH:Intel 82801JR(ICH10R)
Intel Tylersburg-EP
IOH:Intel 5520(Tylersburg-36D)
ICH:Intel 82801JR(ICH10R)
芯片特性2xQPI
VT-d Gen 2
2xQPI
VT-d Gen 2
内存控制器
CPU集成三通道R-ECC DDR3 1333CPU集成三通道R-ECC DDR3 1333
内存
4GB R-ECC DDR3 1333 SDRAM x64GB R-ECC DDR3 1333 SDRAM x6
系统磁盘子系统
磁盘控制器
LSI Embedded MegaRAID SAS RAID Controller
Intel ICH10R AHCI Controller
磁盘控制器规格
8x SAS 3GbpsAHCI /w NCQ
SATA 3Gbps
磁盘控制器设置
RAID 0
AHCI /w NCQ
SATA 3Gbps
磁盘控制器驱动
LSI MegaSR
13.06.0212.2009
Intel Matrix Storage Manager 8.8.0.1009
磁盘
Fujitsu
MBA3300RC x2
Seagate Barracuda 7200.11
磁盘规格
15000RPM
300GB
SAS 3Gbps
16MB Cache
7200RPM
320GB
SATA  3Gbps
NCQ
16MB Cache
磁盘设置
SAS 3Gbps
50GB系统分区
SATA 3Gbps
NCQ 50GB系统分区
软件环境
操作系统Microsoft
Windows Server 2008 Enterprise Edition SP1 x64
Microsoft
Windows Server 2008 Enterprise Edition SP1 x64

  本次测试我们使用了华硕RS700-E4服务器进行对比。服务器由Intel提供,使用的是华硕Z8PS-D12主板,搭配的处理器为双路Intel  Xeon X5570,6条4GB DDR3 1333MHz内存组成三通道,性能非常强悍。

  两套测试平台的基本配置相同,除了磁盘有所差异之外,在处理器、内存等配置方面两者都没什么区别。测试平台软件使用的是WIndows Server 2008 64位操作系统。

 

测试平台使用的至强X5570处理器

 
Intel 5520芯片(Tylersburg-36D)搭配ICH10R南桥

内存设置为三通道

 


Intel 5520芯片组

已经开启Triple(三通道)模式


和X58平台一样,5520芯片组搭配的也是ICH10R南桥

 

  SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,它可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台。我们利用了其中多个性能测试模块对于被测系统的性能进行了快速的测试。

SiSoftware Sandra Pro Business 2009
测试对象
华硕Z8PS-D12
华硕Z8PE-D12X
Processor Arithmetic Benchmark
处理器架构测试
Dhrystone ALU
142977MIPS
145374MIPS
Dhrystone ALU vs SPEED
48.75MIPS/MHz
49.56MIPS/MHz
Whetstone iSSE3
124035MFLOPS
125910MFLOPS
Dhrystone iSSE3 vs SPEED
42.29MFLOPS/MHz
42.93MFLOPS/MHz
Processor Multi-Media Benchmark
处理器多媒体测试
Multi-Media Int x16 iSSE4.1
296.85MPixel/s
297.84MPixel/s
Multi-Media Int x16 iSSE4.1 vs SPEED
101.21MPixel/s/MHz
101.55kPixels/s/MHz
Multi-Media Float x8 iSSE2
228.24MPixel/s
228.99MPixel/s
Multi-Media Float x8 iSSE2 vs SPEED
77.82kPixels/s/MHz
78.08kPixels/s/MHz
Multi-Media Double x4 iSSE2
125.88MPixel/s
125.93MPixel/s
Multi-Media Double x4 iSSE2 vs SPEED
42.92kPixels/s/MHz
42.94kPixels/s/MHz 
Multi-Core Efficiency Benchmark
Inter-Core Bandwidth
75.61GB/s
72.62GB/s
Inter-Core Bandwidth vs SPEED
26.40MB/s/MHz
25.35MB/s/MHz
Inter-Core Latency
(越小越好)
16ns
17ns
Inter-Core Latency vs SPEED
(越小越好)
0.01ns/MHz
0.01ns/MHz
.NET Arithmetic Benchmark
.NET架构测试
Dhrystone .NET
32904MIPS
25714MIPS
Dhrystone .NET vs SPEED
11.22MIPS/MHz
8.77MIPS/MHz
Whetstone .NET
78286MFLOPS
71056MFLOPS
Whetstone .NET vs SPEED
26.69MFLOPS/MHz
24.23MFLOPS/MHz
.NET Multi-Media Benchmark
.NET多媒体测试
Multi-Media Int x1 .NET
62.28MPixel/s
60.55MPixel/s
Multi-Media Int x1 .NET vs SPEED
21.23kPixels/s/MHz
20.64kPixels/s/MHz
Multi-Media Float x1 .NET
26.19MPixel/s
24.69MPixel/s
Multi-Media Float x1 .NET vs SPEED
8.93kPixels/s/MHz
8.42kPixels/s/MHz
Multi-Media Double x1 .NET
51.45MPixel/s
47.79MPixel/s
Multi-Media Double x1 .NET vs SPEED
17.54kPixels/s/MHz
16.29kPixels/s/MHz

   处理器架构性能测试分为整数和浮点两个部分。我们看到在处理器架构和多媒体测试中,Z8PE-D12X略微领先;而在.NET架构和多媒体测试中,Z8PS-D12的成绩要更好一些。总体来讲两款主板互有优劣,差距不大。

  SiSoftware Sandra缓存内存测试主要包括内存带宽、内存延迟等性能的测试。

SiSoftware Sandra Pro Business 2009
测试对象
华硕Z8PS-D12
华硕Z8PE-D12X
Memory Bandwidth Benchmark
内存带宽测试
Int Buff'd iSSE2 Memory Bandwidth
16.93GB/s
16.75GB/s
Float Buff'd iSSE2 Memory Bandwidth
16.90GB/s
16.77GB/s
Memory Latency Benchmark
内存延迟测试
Memory(Random Access) Latency
(越小越好)
81ns
82ns
Speed Factor
(越小越好)
61.40
61.50
Internal Data Cache
4clocks
4clocks
L2 On-board Cache
10clocks
10clocks
L3 On-board Cache
48clocks
48clocks
Cache and Memory Benchmark
缓存及内存测试
Cache/Memory Bandwidth
143.24GB/s
140.90GB/s
Cache/Memory Bandwidth vs SPEED
50.01MB/s/MHz
49.19MB/s/MHz
Speed Factor
(越小越好)
20.90
21.10
Internal Data Cache
448.46GB/s
439.23GB/s
L2 On-board Cache
421.42GB/s
410.49GB/s

   和上面的结果类似,华硕Z8PE-D12X的测试成绩较Z8PS-D12来说略显落后,对于内存的支持稍逊一些。

  SPEC CPU 2006整数运算主要包含编译、压缩、人工智能、视频压缩转换、XML处理等,此外,各种日常操作也主要是基于整数操作。SPEC CPU 2006的整数运算包含了400.perlbench PERL编程语言、401.bzip2 压缩、403.gcc C编译器、429.mcf 组合优化、445.gobmk 人工智能:围棋、456.hmmer 基因序列搜索、458.sjeng 人工智能:国际象棋、462.libquantum 物理:量子计算、464.h264ref 视频压缩、471.omnetpp 离散事件仿真、473.astar 寻路算法、483.xalancbmk XML处理共12项。

  从SPEC 2006上看出了一些对于处理器的支持情况。从整数性能的测试结果来看,被测的华硕Z8PE-D12X主板成绩大多数项目中落后Z8PS-D12约10%,虽然462.libquantum 物理:量子计算这个项目中有略微的领先优势,不过最终的整体得分只有172分,落后对比平台11分(约6%)。

  SPEC CPU 2006的浮点运算测试包括的全部都是科学运算,科学运算需要用到大量的高精度浮点数据,如410.bwaves 流体力学、416.gamess 量子化学、433.milc 量子力学、434.zeusmp 物理:计算流体力学、435.gromacs 生物化学/分子力学、436.cactusADM 物理:广义相对论、437.leslie3d 流体力学、444.namd 生物/分子、447.dealII 有限元分析、450.soplex 线形编程、优化、453.povray 影像光线追踪、454.calculix 结构力学、459.GemsFDTD 计算电磁学、465.tonto 量子化学、470.lbm 流体力学、481.wrf 天气预报、482.sphinx3 语音识别共17项测试。

  相比之前的整数运算来说,华硕Z8PE-D12X主板在浮点运算中的表现要稍微好一些,两款平台出现了互有胜负的情况,其中433.milc 量子力学、436.cactusADM 物理:广义相对论两个项目的成绩大幅度领先,最终的得分为154分,略高于对比平台。

  通过SPEC2006整数和浮点运算的对比,我们认为被测的华硕Z8PE-D12X主板更适合浮点运算,整数运算则要逊色一些。

  ScienceMark v2.0是一款用于测试系统特别是处理器在科学计算应用中的性能的软件,MemBenchmark是其中针对处理器缓存、系统内存而设计的功能模块,它可以测试系统内存带宽、L1 Cache延迟、L2 Cache延迟和系统内存延迟,另外还可以测试不同指令集的性能差异。



ScienceMark Membench
厂商ASUSASUS
产品型号华硕Z8PS-D12华硕Z8PE-D12X
内存技术参数4GB R-ECC DDR3-1333 SDRAM x64GB R-ECC DDR3-1333 SDRAM x6
L1带宽(MB/s)47880.4847880.48
L2带宽(MB/s)19604.6419353.08
内存带宽(MB/s)10116.619879.55
L1 Cache Latency(ns)
32 Bytes Stride0.68 ns0.68 ns
L1 Algorithm Bandwidth(MB/s)
Compiler43072.2539023.47
REP MOVSD43467.2543453.73
ALU Reg Copy11949.0912070.74
MMX Reg Copy22537.3624174.62
SSE PAlign47773.1347834.41
SSE2 PAlign47880.4847880.48
L2 Cache Latency(ns)
4 Bytes Stride3 cycles
1.02 ns
3 cycles
1.02 ns
16 Bytes Stride3 cycles
1.02 ns
3 cycles
1.02 ns
64 Bytes Stride8 cycles
2.73 ns
8 cycles
2.73 ns
256 Bytes Stride8 cycles
2.73 ns
8 cycles
2.73 ns
512 Bytes Stride7 cycles
2.39 ns
7 cycles
2.39 ns
L2 Algorithm Bandwidth(MB/s)
Compiler18039.6417964.79
REP MOVSD19604.6419353.08
ALU Reg Copy8788.908789.48
MMX Reg Copy14083.8314067.59
SSE PAlign18731.9218705.82
SSE2 PAlign5833.9318768.59
Memory Latency(ns)
4 Bytes Stride3 cycles
1.02 ns
3 cycles
1.02 ns
16 Bytes Stride5 cycles
1.70 ns
5 cycles
1.70 ns
64 Bytes Stride22 cycles
7.50 ns
22 cycles
7.50 ns
256 Bytes Stride102 cycles
34.77 ns
102 cycles
35.45 ns
512 Bytes Stride117 cycles
39.88 ns
117 cycles
42.61 ns
Memory Algorithm Bandwidth(MB/s)
Compiler9210.179068.58
REP MOVSD10116.619865.91
ALU Reg Copy8156.007812.55
MMX Reg Copy9306.189052.87
MMX Reg 3dNow--
MMX Reg SSE8781.268954.25
SSE PAlign8580.249460.06
SSE PAlign SSE9524.079879.55
SSE2 PAlign8560.838979.72
SSE2 PAlign SSE9555.139446.93
MMX Block 4kb7743.827639.83
MMX Block 16kb8321.358154.87
SSE Block 4kb7890.107836.27
SSE Block 16kb8355.868207.77

  ScienceMark是一款内存测试软件,它的测试成绩绝大多数取决于被测内存的品质。也就是说,如果我们使用同样的内存,那么两款平台的成绩差别不会太大。事实上,L1和L2的测试主要取决于处理器,而这里两者微小的差距看来是主板不同造成的。在接下来的内存带宽测试中,Z8PE-D12X所提供的带宽比Z8PS-D12要低一些,差距在5%左右。对于同样适用三通道内存的两款平台来说,我们认为这个差距是主板本身导致的。

  CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,我们的平台偏向于服务器多一些,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。


华硕Z8PE-D12X主板测试成绩
CineBench R10
处理器
华硕Z8PS-D12华硕Z8PE-D12X
显卡--
CPU Benchmark
Rendering (1 CPU)4410 CB-CPU4394 CB-CPU
Rendering (x CPU)
28172 CB-CPU
26607 CB-CPU
Multiprocessor Speedup
6.39x
6.06x
OpenGL Benchmark
OpenGL Standard
224 CB-GFX
225 CB-GFX

  华硕Z8PE-D12X在这个项目中的测试结果较之前并没有多大的变化,落后对比平台一些,单处理器的情况下两者差距并不明显,多处理器中这个结果被放大了。事实上,从Multiprocessor Speedup结果我们看到,它的成绩只有6.06,而Z8PS-D12的成绩为6.39。从这里我们也看出,华硕Z8PE-D12X对于处理器的支持能力不如Z8PS-D12。

  本次我们测试的华硕Z8PE-D12X服务器主板没有提供独立的阵列卡,也没有华硕专用的PIKE卡,所以这里我们只是通过单磁盘简单测试了一下它的磁盘性能。测试硬盘选用的是希捷酷鱼7200.11 320GB产品,传输速率为3Gbps,缓存为16MB。

 

  从测试结果来看,被测磁盘的随机读取速度在100MB/s-120MB/s之间,随机写入速度在110MB/s以上。在单磁盘的情况下,这样的成绩可以接受。

  【IT168评测中心】本次我们测试的华硕Z8PE-D12X服务器主板是一款应用于双路服务器的产品。它使用的是Intel 5520(Tylersburg-36D)加ICH10R的芯片组搭配,这也是当今主流服务器的标准配置。

 
华硕Z8PE-D12X服务器主板

  测试中,我们使用了华硕自家的Z8PS-D12作为对比平台,通过搭配同样规格的处理器和内存,了解这款产品的基准性能。经过测试我们发现,Z8PE-D12X相比Z8PS-D12来说略显落后,除了在个别测试项目中有所领先之外,多数测试成绩低于Z8PS-D12平台5%左右(对于同样芯片组的同品牌主板,性能本来就不会有明显的差别)。

  虽然成绩略微落后,但是Z8PE-D12X却有一个值得称道的优点,就是它提供了2条PCI-X插槽。对于用户来说,如果将这款平台用作升级服务器的话,那么之前许多PCI-X接口的阵列卡等设备都可以正常使用,节省了部分升级费用(目前好多Intel 5520芯片组的产品已经取消了PCI-X插槽,全面转向PCI-E插槽)。

   因此,我们认为Z8PE-D12X的出现对于老用户升级来说比较适合,想必这也是华硕为什么在推出了Z8PE-D12之后,更进一步推出Z8PE-D12X的原因所在。

0
相关文章