【IT168评测中心】无论是台式机还是服务器,很多人购买的时候都很注重主板的选购。作为系统的基础平台,主板的品质关系到电脑整体的运行状况,也对性能发挥产生重要的影响。不过看看各个厂商,同芯片组的产品肯定不止一款,即便是服务器主板,也有各种型号可供选择。那么这些主板之间究竟性能存在怎样的差别?如何才能选购到合适的主板呢?今天我们要测试一款来自华硕的双路服务器主板,相信会给大家一个明确的产品定位。
华硕为Nehalem-EP处理器提供了七款不同规格的平台,分别是:Z8NA-D6C、Z8NA-D6、Z8NH-D12、Z8PE-D18、Z8PE-D12、Z8PE-D12X、Z8NR-D12(这还仅仅是大陆地区的零售版本,不包括海外版本及OEM版本)。本次,我们测试的Z8PE-D12X是一款为机架服务器设计的产品,通过与自家同芯片组其他型号的对比,看看这款主板的用途所在。
华硕Z8PE-D12X主板外观
处理器插槽位置,完善的供电系统
板载4条PCI-E插槽
外部接口部分
板载的NEC D720404F1芯片,提供2个PCI-X总线
ASPEED芯片,这是一颗显示芯片,同时也具备了远程管理功能
华硕Z8PE-D12X服务器主板扩展插槽非常丰富,提供了4个PCI-E X16接口。考虑到老用户的升级,华硕Z8PE-D12X主板还有2条PCI-X接口。我们看到的最下面的接口是PIKE Slot插槽,用来连接华硕存储扩展卡(选配件)。
SPEC CPU 2006 v1.0.1
SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。
SPEC CPU 2006是SPEC组织推出的CPU子系统评估软件最新版,我们之前使用的是SPEC CPU 2000。和上一个版本一样,SPEC CPU 2006包括了CINT2006和CFP2006两个子项目,前者用于测量和对比整数性能,而后者则用于测量和对比浮点性能,SPEC CPU 2006中对SPEC CPU 2000中的一些测试进行了升级,并抛弃/加入了一些测试,因此两个版本测试得分并没有可比较性。
SPEC CPU测试中,测试系统的处理器、内存子系统和使用到的编译器(SPEC CPU提供的是源代码,并且允许测试用户进行一定的编译优化)都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2006的影响非常的小。
SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、DCC以及科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。
我们在被测服务器中安装了当前最新版本的Intel C++ 10.1.025 Compiler、Intel Fortran 10.1.025 Compiler这两款SPEC CPU 2006必需的编译器,通过最新出现的QxS编译参数,Intel Compiler 10版本开始支持对Intel SSE4指令集进行优化(假如只支持SSE3,则使用QxT编译参数)。我们另外安装了Microsoft Visual Studio 2003 SP1提供必要的库文件。按照SPEC的要求我们根据自己的情况编辑了新的Config文件,使用了较多的编译选项。我们根据被测系统选择实际可同时处理的线程数量,最后得到SPEC rate base测试结果(基于base标准编译,SPEC base rate测试代表系统同时处理多个任务的能力)。
和其它测试部件不同,SPEC CPU 2006需要大量的系统物理内存,我们的SPEC测试在64bit Windows Server 2008 Enterprise下完成,对于每个运算核心,配置1.5GB内存。
Iometer 2006.7.27
Iometer是一款功能非常强大的IO测试软件,它除了可以在本机运行测试本机的IO(磁盘)性能之外,还提供了模拟网络应用的能力。在这次的测试中,我们仅仅让它在本机运行测试服务器的磁盘性能。为了全面测试被测服务器的IO性能,我们分别选择了不同的测试脚本。
Max_throughput(read):文件尺寸为64KB,100%读取操作,随机率为0%,用于检测磁盘系统的最大读取吞吐量
Max_IO(read):文件尺寸为512B,100%读取操作,随机率为0%,用于检测磁盘系统的最大读取操作IO处理能力
Max_throughput(write):文件尺寸为64KB,0%读取操作,随机率为0%,用于检测磁盘系统的最大写入吞吐量
Max_IO(write):文件尺寸为512B,0%读取操作,随机率为0%,用于检测磁盘系统的最大写入操作IO处理能力
SiSoftware Sandra v2009
SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。从2007开始,Sandra的Arithmetic benchmarks增加了对SSE3 & SSE4 SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,另外还升级了File System benchmark和Removable Storage benchmark两个子项目。对于新的硬件的支持当然也是该软件每次升级的重要内容之一。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台,这也是我们选择这款软件的原因之一。
CineBench R10
CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,在服务器测试平台中显示子系统不重要,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。
ScienceMark 2.0
ScienceMark 2.0可以用来评估测试对象在执行科学计算时的运算效能,这部分效能主要和处理器子系统和内存子系统相关。我们主要用来评估测试对象的内存子系统的性能。
测试平台、测试环境 | ||
测试分组 | ||
类别 | 华硕Z8PS-D12 | 华硕Z8PE-D12X |
处理器子系统 | ||
处理器 | 双路Intel Xeon X5570 | 双路Intel Xeon X5570 |
处理器架构 | Intel 45nm Nehalem | Intel 45nm Nehalem |
处理器代号 | Gainestown | Gainestown |
处理器封装 | Socket 1366 LGA | Socket 1366 LGA |
处理器规格 | 四核 | 四核 |
处理器指令集 | MMX,SSE,SSE2,SSE3,SSSE3, SSE4.1,SSE4.2,EM64T,VT | MMX,SSE,SSE2,SSE3,SSSE3, SSE4.1,SSE4.2,EM64T,VT |
主频 | 2.93GHz | 2.93GHz |
处理器外部总线 | 2x QPI 3200MHz 6.40GT/s 单向12.8GB/s(每QPI) 双向25.6GB/s(每QPI) | 2x QPI 3200MHz 6.40GT/s 单向12.8GB/s(每QPI) 双向25.6GB/s(每QPI) |
L1 D-Cache | 4x 32KB 8路集合关联 | 4x 32KB 8路集合关联 |
L1 I-Cache | 4x 32KB 4路集合关联 | 4x 32KB 4路集合关联 |
L2 Cache | 4x 256KB 8路集合关联 | 4x 256KB 8路集合关联 |
L3 Cache | 8MB 16路集合关联 | 8MB 16路集合关联 |
主板型号 | ASUS Z8PS-D12-1U | ASUS Z8PE-D12X |
芯片组 | Intel Tylersburg-EP IOH:Intel 5520(Tylersburg-36D) ICH:Intel 82801JR(ICH10R) | Intel Tylersburg-EP IOH:Intel 5520(Tylersburg-36D) ICH:Intel 82801JR(ICH10R) |
芯片特性 | 2xQPI VT-d Gen 2 | 2xQPI VT-d Gen 2 |
内存控制器 | 每CPU集成三通道R-ECC DDR3 1333 | 每CPU集成三通道R-ECC DDR3 1333 |
内存 | 4GB R-ECC DDR3 1333 SDRAM x6 | 4GB R-ECC DDR3 1333 SDRAM x6 |
系统磁盘子系统 | ||
磁盘控制器 | LSI Embedded MegaRAID SAS RAID Controller | Intel ICH10R AHCI Controller |
磁盘控制器规格 | 8x SAS 3Gbps | AHCI /w NCQ SATA 3Gbps |
磁盘控制器设置 | RAID 0 | AHCI /w NCQ SATA 3Gbps |
磁盘控制器驱动 | LSI MegaSR 13.06.0212.2009 | Intel Matrix Storage Manager 8.8.0.1009 |
磁盘 | Fujitsu MBA3300RC x2 | Seagate Barracuda 7200.11 |
磁盘规格 | 15000RPM 300GB SAS 3Gbps 16MB Cache | 7200RPM 320GB SATA 3Gbps NCQ 16MB Cache |
磁盘设置 | SAS 3Gbps 50GB系统分区 | SATA 3Gbps NCQ 50GB系统分区 |
软件环境 | ||
操作系统 | Microsoft Windows Server 2008 Enterprise Edition SP1 x64 | Microsoft Windows Server 2008 Enterprise Edition SP1 x64 |
本次测试我们使用了华硕RS700-E4服务器进行对比。服务器由Intel提供,使用的是华硕Z8PS-D12主板,搭配的处理器为双路Intel Xeon X5570,6条4GB DDR3 1333MHz内存组成三通道,性能非常强悍。
两套测试平台的基本配置相同,除了磁盘有所差异之外,在处理器、内存等配置方面两者都没什么区别。测试平台软件使用的是WIndows Server 2008 64位操作系统。
Intel 5520芯片(Tylersburg-36D)搭配ICH10R南桥
内存设置为三通道
SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,它可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台。我们利用了其中多个性能测试模块对于被测系统的性能进行了快速的测试。
SiSoftware Sandra Pro Business 2009 | ||
---|---|---|
测试对象 | 华硕Z8PS-D12 | 华硕Z8PE-D12X |
Processor Arithmetic Benchmark 处理器架构测试 | ||
Dhrystone ALU | 142977MIPS | 145374MIPS |
Dhrystone ALU vs SPEED | 48.75MIPS/MHz | 49.56MIPS/MHz |
Whetstone iSSE3 | 124035MFLOPS | 125910MFLOPS |
Dhrystone iSSE3 vs SPEED | 42.29MFLOPS/MHz | 42.93MFLOPS/MHz |
Processor Multi-Media Benchmark 处理器多媒体测试 | ||
Multi-Media Int x16 iSSE4.1 | 296.85MPixel/s | 297.84MPixel/s |
Multi-Media Int x16 iSSE4.1 vs SPEED | 101.21MPixel/s/MHz | 101.55kPixels/s/MHz |
Multi-Media Float x8 iSSE2 | 228.24MPixel/s | 228.99MPixel/s |
Multi-Media Float x8 iSSE2 vs SPEED | 77.82kPixels/s/MHz | 78.08kPixels/s/MHz |
Multi-Media Double x4 iSSE2 | 125.88MPixel/s | 125.93MPixel/s |
Multi-Media Double x4 iSSE2 vs SPEED | 42.92kPixels/s/MHz | 42.94kPixels/s/MHz |
Multi-Core Efficiency Benchmark | ||
Inter-Core Bandwidth | 75.61GB/s | 72.62GB/s |
Inter-Core Bandwidth vs SPEED | 26.40MB/s/MHz | 25.35MB/s/MHz |
Inter-Core Latency (越小越好) | 16ns | 17ns |
Inter-Core Latency vs SPEED (越小越好) | 0.01ns/MHz | 0.01ns/MHz |
.NET Arithmetic Benchmark .NET架构测试 | ||
Dhrystone .NET | 32904MIPS | 25714MIPS |
Dhrystone .NET vs SPEED | 11.22MIPS/MHz | 8.77MIPS/MHz |
Whetstone .NET | 78286MFLOPS | 71056MFLOPS |
Whetstone .NET vs SPEED | 26.69MFLOPS/MHz | 24.23MFLOPS/MHz |
.NET Multi-Media Benchmark .NET多媒体测试 | ||
Multi-Media Int x1 .NET | 62.28MPixel/s | 60.55MPixel/s |
Multi-Media Int x1 .NET vs SPEED | 21.23kPixels/s/MHz | 20.64kPixels/s/MHz |
Multi-Media Float x1 .NET | 26.19MPixel/s | 24.69MPixel/s |
Multi-Media Float x1 .NET vs SPEED | 8.93kPixels/s/MHz | 8.42kPixels/s/MHz |
Multi-Media Double x1 .NET | 51.45MPixel/s | 47.79MPixel/s |
Multi-Media Double x1 .NET vs SPEED | 17.54kPixels/s/MHz | 16.29kPixels/s/MHz |
处理器架构性能测试分为整数和浮点两个部分。我们看到在处理器架构和多媒体测试中,Z8PE-D12X略微领先;而在.NET架构和多媒体测试中,Z8PS-D12的成绩要更好一些。总体来讲两款主板互有优劣,差距不大。
SiSoftware Sandra缓存内存测试主要包括内存带宽、内存延迟等性能的测试。
SiSoftware Sandra Pro Business 2009 | ||
---|---|---|
测试对象 | 华硕Z8PS-D12 | 华硕Z8PE-D12X |
Memory Bandwidth Benchmark 内存带宽测试 | ||
Int Buff'd iSSE2 Memory Bandwidth | 16.93GB/s | 16.75GB/s |
Float Buff'd iSSE2 Memory Bandwidth | 16.90GB/s | 16.77GB/s |
Memory Latency Benchmark 内存延迟测试 | ||
Memory(Random Access) Latency (越小越好) | 81ns | 82ns |
Speed Factor (越小越好) | 61.40 | 61.50 |
Internal Data Cache | 4clocks | 4clocks |
L2 On-board Cache | 10clocks | 10clocks |
L3 On-board Cache | 48clocks | 48clocks |
Cache and Memory Benchmark 缓存及内存测试 | ||
Cache/Memory Bandwidth | 143.24GB/s | 140.90GB/s |
Cache/Memory Bandwidth vs SPEED | 50.01MB/s/MHz | 49.19MB/s/MHz |
Speed Factor (越小越好) | 20.90 | 21.10 |
Internal Data Cache | 448.46GB/s | 439.23GB/s |
L2 On-board Cache | 421.42GB/s | 410.49GB/s |
和上面的结果类似,华硕Z8PE-D12X的测试成绩较Z8PS-D12来说略显落后,对于内存的支持稍逊一些。
SPEC CPU 2006整数运算主要包含编译、压缩、人工智能、视频压缩转换、XML处理等,此外,各种日常操作也主要是基于整数操作。SPEC CPU 2006的整数运算包含了400.perlbench PERL编程语言、401.bzip2 压缩、403.gcc C编译器、429.mcf 组合优化、445.gobmk 人工智能:围棋、456.hmmer 基因序列搜索、458.sjeng 人工智能:国际象棋、462.libquantum 物理:量子计算、464.h264ref 视频压缩、471.omnetpp 离散事件仿真、473.astar 寻路算法、483.xalancbmk XML处理共12项。
从SPEC 2006上看出了一些对于处理器的支持情况。从整数性能的测试结果来看,被测的华硕Z8PE-D12X主板成绩大多数项目中落后Z8PS-D12约10%,虽然462.libquantum 物理:量子计算这个项目中有略微的领先优势,不过最终的整体得分只有172分,落后对比平台11分(约6%)。
SPEC CPU 2006的浮点运算测试包括的全部都是科学运算,科学运算需要用到大量的高精度浮点数据,如410.bwaves 流体力学、416.gamess 量子化学、433.milc 量子力学、434.zeusmp 物理:计算流体力学、435.gromacs 生物化学/分子力学、436.cactusADM 物理:广义相对论、437.leslie3d 流体力学、444.namd 生物/分子、447.dealII 有限元分析、450.soplex 线形编程、优化、453.povray 影像光线追踪、454.calculix 结构力学、459.GemsFDTD 计算电磁学、465.tonto 量子化学、470.lbm 流体力学、481.wrf 天气预报、482.sphinx3 语音识别共17项测试。
相比之前的整数运算来说,华硕Z8PE-D12X主板在浮点运算中的表现要稍微好一些,两款平台出现了互有胜负的情况,其中433.milc 量子力学、436.cactusADM 物理:广义相对论两个项目的成绩大幅度领先,最终的得分为154分,略高于对比平台。
通过SPEC2006整数和浮点运算的对比,我们认为被测的华硕Z8PE-D12X主板更适合浮点运算,整数运算则要逊色一些。
ScienceMark v2.0是一款用于测试系统特别是处理器在科学计算应用中的性能的软件,MemBenchmark是其中针对处理器缓存、系统内存而设计的功能模块,它可以测试系统内存带宽、L1 Cache延迟、L2 Cache延迟和系统内存延迟,另外还可以测试不同指令集的性能差异。
ScienceMark Membench | ||
---|---|---|
厂商 | ASUS | ASUS |
产品型号 | 华硕Z8PS-D12 | 华硕Z8PE-D12X |
内存技术参数 | 4GB R-ECC DDR3-1333 SDRAM x6 | 4GB R-ECC DDR3-1333 SDRAM x6 |
L1带宽(MB/s) | 47880.48 | 47880.48 |
L2带宽(MB/s) | 19604.64 | 19353.08 |
内存带宽(MB/s) | 10116.61 | 9879.55 |
L1 Cache Latency(ns) | ||
32 Bytes Stride | 0.68 ns | 0.68 ns |
L1 Algorithm Bandwidth(MB/s) | ||
Compiler | 43072.25 | 39023.47 |
REP MOVSD | 43467.25 | 43453.73 |
ALU Reg Copy | 11949.09 | 12070.74 |
MMX Reg Copy | 22537.36 | 24174.62 |
SSE PAlign | 47773.13 | 47834.41 |
SSE2 PAlign | 47880.48 | 47880.48 |
L2 Cache Latency(ns) | ||
4 Bytes Stride | 3 cycles 1.02 ns | 3 cycles 1.02 ns |
16 Bytes Stride | 3 cycles 1.02 ns | 3 cycles 1.02 ns |
64 Bytes Stride | 8 cycles 2.73 ns | 8 cycles 2.73 ns |
256 Bytes Stride | 8 cycles 2.73 ns | 8 cycles 2.73 ns |
512 Bytes Stride | 7 cycles 2.39 ns | 7 cycles 2.39 ns |
L2 Algorithm Bandwidth(MB/s) | ||
Compiler | 18039.64 | 17964.79 |
REP MOVSD | 19604.64 | 19353.08 |
ALU Reg Copy | 8788.90 | 8789.48 |
MMX Reg Copy | 14083.83 | 14067.59 |
SSE PAlign | 18731.92 | 18705.82 |
SSE2 PAlign | 5833.93 | 18768.59 |
Memory Latency(ns) | ||
4 Bytes Stride | 3 cycles 1.02 ns | 3 cycles 1.02 ns |
16 Bytes Stride | 5 cycles 1.70 ns | 5 cycles 1.70 ns |
64 Bytes Stride | 22 cycles 7.50 ns | 22 cycles 7.50 ns |
256 Bytes Stride | 102 cycles 34.77 ns | 102 cycles 35.45 ns |
512 Bytes Stride | 117 cycles 39.88 ns | 117 cycles 42.61 ns |
Memory Algorithm Bandwidth(MB/s) | ||
Compiler | 9210.17 | 9068.58 |
REP MOVSD | 10116.61 | 9865.91 |
ALU Reg Copy | 8156.00 | 7812.55 |
MMX Reg Copy | 9306.18 | 9052.87 |
MMX Reg 3dNow | - | - |
MMX Reg SSE | 8781.26 | 8954.25 |
SSE PAlign | 8580.24 | 9460.06 |
SSE PAlign SSE | 9524.07 | 9879.55 |
SSE2 PAlign | 8560.83 | 8979.72 |
SSE2 PAlign SSE | 9555.13 | 9446.93 |
MMX Block 4kb | 7743.82 | 7639.83 |
MMX Block 16kb | 8321.35 | 8154.87 |
SSE Block 4kb | 7890.10 | 7836.27 |
SSE Block 16kb | 8355.86 | 8207.77 |
ScienceMark是一款内存测试软件,它的测试成绩绝大多数取决于被测内存的品质。也就是说,如果我们使用同样的内存,那么两款平台的成绩差别不会太大。事实上,L1和L2的测试主要取决于处理器,而这里两者微小的差距看来是主板不同造成的。在接下来的内存带宽测试中,Z8PE-D12X所提供的带宽比Z8PS-D12要低一些,差距在5%左右。对于同样适用三通道内存的两款平台来说,我们认为这个差距是主板本身导致的。
CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,我们的平台偏向于服务器多一些,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。
CineBench R10 | ||
处理器 | 华硕Z8PS-D12 | 华硕Z8PE-D12X |
显卡 | - | - |
CPU Benchmark | ||
Rendering (1 CPU) | 4410 CB-CPU | 4394 CB-CPU |
Rendering (x CPU) | 28172 CB-CPU | 26607 CB-CPU |
Multiprocessor Speedup | 6.39x | 6.06x |
OpenGL Benchmark | ||
OpenGL Standard | 224 CB-GFX | 225 CB-GFX |
华硕Z8PE-D12X在这个项目中的测试结果较之前并没有多大的变化,落后对比平台一些,单处理器的情况下两者差距并不明显,多处理器中这个结果被放大了。事实上,从Multiprocessor Speedup结果我们看到,它的成绩只有6.06,而Z8PS-D12的成绩为6.39。从这里我们也看出,华硕Z8PE-D12X对于处理器的支持能力不如Z8PS-D12。
本次我们测试的华硕Z8PE-D12X服务器主板没有提供独立的阵列卡,也没有华硕专用的PIKE卡,所以这里我们只是通过单磁盘简单测试了一下它的磁盘性能。测试硬盘选用的是希捷酷鱼7200.11 320GB产品,传输速率为3Gbps,缓存为16MB。
从测试结果来看,被测磁盘的随机读取速度在100MB/s-120MB/s之间,随机写入速度在110MB/s以上。在单磁盘的情况下,这样的成绩可以接受。
【IT168评测中心】本次我们测试的华硕Z8PE-D12X服务器主板是一款应用于双路服务器的产品。它使用的是Intel 5520(Tylersburg-36D)加ICH10R的芯片组搭配,这也是当今主流服务器的标准配置。
华硕Z8PE-D12X服务器主板
测试中,我们使用了华硕自家的Z8PS-D12作为对比平台,通过搭配同样规格的处理器和内存,了解这款产品的基准性能。经过测试我们发现,Z8PE-D12X相比Z8PS-D12来说略显落后,除了在个别测试项目中有所领先之外,多数测试成绩低于Z8PS-D12平台5%左右(对于同样芯片组的同品牌主板,性能本来就不会有明显的差别)。
虽然成绩略微落后,但是Z8PE-D12X却有一个值得称道的优点,就是它提供了2条PCI-X插槽。对于用户来说,如果将这款平台用作升级服务器的话,那么之前许多PCI-X接口的阵列卡等设备都可以正常使用,节省了部分升级费用(目前好多Intel 5520芯片组的产品已经取消了PCI-X插槽,全面转向PCI-E插槽)。
因此,我们认为Z8PE-D12X的出现对于老用户升级来说比较适合,想必这也是华硕为什么在推出了Z8PE-D12之后,更进一步推出Z8PE-D12X的原因所在。