【IT168评测中心】作为专业的主板生产厂商,ASUS华硕在主板市场占据着较大的市场份额。除了其桌面主板为人熟知之外,华硕也有不少服务器/工作站主板产品。
这块主板就是华硕的最新产品:Z8NA-D6C,它有什么特别呢?它是在第一块在标准ATX架构上实现双Socket 1366 LGA的主板,在和桌面主板一样的大小内,可以支持两个Nehalem处理器,提供非常好的计算性能。
ASUS Z8NA-D6C主板基于Intel Tylersburg-24D芯片组,24是指它提供了24 PCI Expres Lanes,D是指它支持双处理器。在扩展性上,ASUS Z8NA-D6C提供了共6条DDR3 DIMM,可以支持最多48GB的Registered内存或24GB的Unbuffered内存;ASUS Z8NA-D6C提供了一条PCI Express x16 Gen2插槽和两条PCI Express x8插槽(不过,实际速度是PCI Express x4 Gen2),此外还有一条专门用于连接声卡的MIO插槽核普通的32bit PCI插槽。ASUS Z8NA-D6C采用了ICH10R南桥芯片,支持6个SATA 3Gb/s接口和Intel Matrix RAID功能。
ASUS Z8NA-D6C主板每个处理器使用了四相供电,听起来并不豪华,特别是对比于华硕的桌面板动辄8相12相供电的情况下。不过考虑到服务器版本Nehalem处理器功耗都不高的情况下,采用4相供电其实足够了。
ASPEED AST 2050,既是显示芯片,又是一个支持IPMI 2.0的iKVM模块芯片,集成200MHz的ARM926EJ处理器和32KB L1缓存(16K+16K),其下方的8MB Qimonda芯片是其运行内存
可以说,ASUS Z8NA-D6C是非常有特色的,在标准ATX板型上可以使用两个高频率的Nehalem-EP/Nehalem-WS处理器(样板原配俩3.2GHz的Xeon W5580),可以提供非常高的计算密度,可以在桌面体积内就能提供一个强力的服务器平台。当然提供了PCI Express x16 Gen2插槽的Z8NA-D6C不仅仅能做服务器,它也能做工作站(虽然Xeon W5580被定位为工作站处理器,然而定位是一回事,实际上又是另外一回事了。
在2005年度服务器横评之后,我们认为当时的网络实验室无法满足今后继续发展的服务器测试的需要。所以,2006年我们IT168评测中心又斥资几十万对于IT168网络实验室的服务器测试平台进行了大幅度的升级,为思科Catalyst4500千兆交换机(WS-X4013+ Supervisor Engine II-Plus和WS-X4548-GB-RJ45)增加了一个思科全千兆24口模块WS-X4424-GB-RJ45,可同时连接72个千兆铜缆设备和2个光缆设备。另外,我们还购置了29台Dell PowerEdge SC430塔式服务器和原来的32台主流配置PC一起为服务器测试平台的提供负载。2007年,我们又采购性能更强的部分客户端,来确保为新一代的服务器提供足够的测试负载。2009年初,我们又对所有客户端的内存子系统进行了全面的升级。
Catalyst4500千兆交换机
部分Dell PowerEdge SC430服务器
在新的测试环境下,我们进一步完善了服务器性能测试方案:
SiSoftware Sandra v2009
SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。从2007开始,Sandra的Arithmetic benchmarks增加了对SSE3 & SSE4 SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,另外还升级了File System benchmark和Removable Storage benchmark两个子项目。对于新的硬件的支持当然也是该软件每次升级的重要内容之一。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台,这也是我们选择这款软件的原因之一。
Benchmark Factory 4.6
大部分的服务器应用都同数据库有着密切的联系,因此我们今年开始着手在在服务器测试中加入对于数据库性能的测试。我们选择了Benchmark Factory 4.6软件和Microsoft SQL2005 SP3来测试不同的硬件平台在数据库应用中的表现。
我们选择了Benchmark Factory内置的标准测试脚本AS3AP,这项测试可用于对于ANSI结构化查询语言(SQL)关系型数据库进行测试,它可用于测试DBMS(单用户微机数据库管理系统),也可用于测试高性能并行或者分布式数据库。
CineBench R10
CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,在服务器测试平台中显示子系统不重要,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。
ScienceMark 2.0
ScienceMark 2.0可以用来评估测试对象在执行科学计算时的运算效能,这部分效能主要和处理器子系统和内存子系统相关。我们主要用来评估测试对象的内存子系统的性能。
测试对比平台的详细参数如下:
测试平台、测试环境 | ||||||
测试分组 | ||||||
类别 | ASUS Z8NA-D6C 双路Intel Gainestown 至强 X5570 | ASUS RS700-E4服务器 双路Intel Gainestown 至强 X5570 | 双路至强 E5430基准平台 | |||
处理器子系统 | ||||||
处理器 | 双路Intel 至强 X5570 | 双路Intel 至强 X5570 | 双路Intel 至强 E5430 | |||
处理器架构 | Intel 45nm Nehalem | Intel 45nm Nehalem | Intel 45nm Penryn | |||
处理器代号 | Gainestown | Gainestown | Harpertown | |||
处理器封装 | Socket 1366 LGA | Socket 1366 LGA | Socke 771 LGA | |||
处理器规格 | 四核 | 四核 | 四核 | |||
处理器指令集 | MMX,SSE,SSE2,SSE3,SSSE3, SSE4.1,SSE4.2,EM64T,VT | MMX,SSE,SSE2,SSE3,SSSE3, SSE4.1,SSE4.2,EM64T,VT | MMX,SSE,SSE2,SSE3,SSSE3, SSE4.1,EM64T,VT | |||
主频 | 2.93GHz | 2.93GHz | 2.66GHz | |||
处理器外部总线 | 2x QPI 3200MHz 6.40GT/s 单向12.8GB/s(每QPI) 双向25.6GB/s(每QPI) | 2x QPI 3200MHz 6.40GT/s 单向12.8GB/s(每QPI) 双向25.6GB/s(每QPI) | FSB 333MHz 1333MT/s 10.6GB/s | |||
L1 D-Cache | 4x 32KB 8路集合关联 | 4x 32KB 8路集合关联 | 4x 32KB 8路集合关联 | |||
L1 I-Cache | 4x 32KB 4路集合关联 | 4x 32KB 4路集合关联 | 4x 32KB 8路集合关联 | |||
L2 Cache | 4x 256KB 8路集合关联 | 4x 256KB 8路集合关联 | 2x 6144KB 16路集合关联 | |||
L3 Cache | 8MB @ 2668.7MHz 16路集合关联 | 8MB @ 2668.7MHz 16路集合关联 | ||||
主板 | ||||||
主板型号 | ASUS Z8NA-D6C | DASUS Z8PS-D12-1U | DELL PE 2900 III | |||
芯片组 | Intel Tylersburg-EP IOH:Intel 5500(Tylersburg-24D) ICH:Intel 82801JR(ICH10R) | Intel Tylersburg-EP IOH:Intel 5520(Tylersburg-36D) ICH:Intel 82801JR(ICH10R) | MCH:Intel 5000X ICH:Intel ESB6321 | |||
芯片特性 | 2x QPI 24 PCI Express Gen2 Lanes VT-d Gen 2 | 2x QPI 36 PCI Express Gen2 Lanes VT-d Gen 2 | 2x FSB1333 PCI Express Gen1 Lanes 12MB Snoop Filter VT-d Gen 1 | |||
内存控制器 | 每CPU集成三通道R-ECC DDR3 1333 | 每CPU集成三通道R-ECC DDR3 1333 | 北桥集成四通道FBD DDR2 667 | |||
内存 | 2GB R-ECC DDR3 1066 SDRAM x6 | 4GB R-ECC DDR3 1333 SDRAM x6 | 2GB FBD DDR2 667 SDRAM x4 | |||
系统磁盘子系统 | ||||||
磁盘控制器 | LSI MegaRAID SAS 8408E RAID Controller | LSI Embedded MegaRAID SAS RAID Controller | DELL Perc 5/i RAID Controller | |||
磁盘控制器规格 | Intel IOP333 500MHz ARM 512MB RAM LSI1068E 8x SAS 3Gbps RAID 0/1/3/5 | 8x SAS 3Gbps RAID 0/1 | LSI 1068 SAS Intel IOP333 500MHz ARM 256MB RAM 8x SAS 3Gbps RAID 0/1/3/5 | |||
磁盘控制器设置 | RAID 5 | RAID 0 | RAID 5 | |||
磁盘控制器驱动 | LSI SAS 3.9.0.64 | LSI MegaSR 13.06.0212.2009 | LSI SAS 3.8.0.64 | |||
磁盘 | Seagate Cheetah 15K.4 ST373454SS x4 | Fujitsu MBA3300RC x2 | Seagate Cheetah 15K.5 ST314655SS x3 | |||
磁盘规格 | 15000RPM 73.4GB SAS 3Gbps 16MB Cache | 15000RPM 300GB SAS 3Gbps 16MB Cache | 15000RPM 146GB SAS 3Gbps 16MB Cache | |||
磁盘设置 | SAS 3Gbps 50GB系统分区 | SAS 3Gbps 50GB系统分区 | SAS 3Gbps 20GB系统分区 | |||
网络子系统 | ||||||
网卡 | Intel 82574L Gigabit Network Controller x2 | Intel 82574 Gigabit Network Controller x2 | Broadcom BCM5708C PCI-E千兆网卡 x2 | |||
网卡设置 | PCI Express x1 @ ICH10R Intel NIC Teaming Load Balancing | PCI Express x1 @ ICH10R I/O AT Intel NIC Teaming Load Balancing | PCI Express x1 @ ESB6321 Broadcom NIC Teaming Load Balancing | |||
网卡驱动 | Intel PRO Set 14.0 | Intel PRO Set 13.5 | Broadcom NetXtreme 2 11.04.01 | |||
软件环境 | ||||||
操作系统 | Microsoft Windows Server 2008 Enterprise Edition SP1 x64 | Microsoft Windows Server 2008 Enterprise Edition SP1 x64 | Microsoft Windows Server 2008 Enterprise Edition SP1 x64 |
为了完全ASUS Z8NA-D6C主板,我们使用了最高端的Nehalem-EP处理器:Xeon X5570,下一页将会简单介绍其特性。为了体现新架构的实力,我们使用了Windows Server 2008 Enterprise Edition SP1 x64操作系统,可以更好地支持至强5500处理器的ccNUMA架构。
Nehalem-EP:Xeon X5570,主频2.93GHz,QPI频率3.2GHz
Nehalem-EP/Gainestown Xeon X5570处理器,主频2.93GHz。QPI总线频率3.2GHz,传输速率是6.4GT/s
64KB L1,256KBL2,8MB共享L3
ASUS Z8NA-D6C,采用Intel 5500 + ICH10R芯片组,也就是Intel Tylersburg-24D芯片组
D6就是具备6个DIMM的意思,后面的C是一个子版本号:不带C的兄弟型号具备SAS控制芯片
Intel 5520/Tylersburg-36D结构图,5500/Tylersburg-24D就是少了8条PCI Express Gen2信道
12GB R-ECC DDR3 1066,NB Frequency是Nehalem-EP处理器Uncore部分的频率(实际上就是L3的频率),而不是Tylersburg芯片组的频率:这个Xeon X5570的Uncore频率(也就是L3频率)是2.67GHz
每条内存2GB,总共6条DDR3-1066内存
北桥:Tylersburg 5500,也就是Tylersburg-24D,它支持两个Nehalem处理器和24条PCIE Gen2 Lanes;在PCI Express控制器里面的显示有些混乱:现在还没有PCI-E 2.0 x32这种东西
SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,它可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台。我们利用了其中多个性能测试模块对于被测系统的性能进行了快速的测试。
有一点需要说明的是,Sandra的处理器架构性能测试是根据处理器所能支持的所有指令集中选择进行的,不同的处理器支持的指令集不同,测试使用到的指令集也就不同。例如,Nehalem在这个测试当中就可以使用SSE4.2,而Penryn就只能使用SSE4.1,而用Opteron可能就只能到SSE3了。一般而言,由于可以使用SSE4,Intel的处理器理论性能会比较好。
SiSoftware Sandra Pro Business 2009 | |||
---|---|---|---|
测试对象 | ASUS Z8NA-D6C 双路Intel Gainestown Xeon X5570 2.93GHz | Intel Nehalem-EP 双路Intel Gainestown Xeon X5570 2.93GHz | DELL PE2900 III 双路Intel Harpertown Xeon E5430 2.66GHz |
Processor Arithmetic Benchmark 处理器架构测试 | |||
Dhrystone ALU | 155859MIPS | 142977MIPS | 91006MIPS |
Dhrystone ALU vs SPEED | 53.14MIPS/MHz | 48.75MIPS/MHz | 34.21MIPS/MHz |
Whetstone iSSE3 | 133738MFLOPS | 124035MFLOPS | 78385MFLOPS |
Dhrystone iSSE3 vs SPEED | 45.60MFLOPS/MHz | 42.29MFLOPS/MHz | 29.47MFLOPS/MHz |
Processor Multi-Media Benchmark 处理器多媒体测试 | |||
Multi-Media Int x16 iSSE4.1 | 323.98MPixel/s | 296.85MPixel/s | |
Multi-Media Int x8 iSSE4.1 | 199.33MPixel/s | ||
Multi-Media Int x16 iSSE4.1 vs SPEED | 110.46MPixel/s/MHz | 101.21MPixel/s/MHz | |
Multi-Media Int x8 iSSE4.1 vs SPEED | 74.94MPixel/s/MHz | ||
Multi-Media Float x8 iSSE2 | 248.12MPixel/s | 228.24MPixel/s | |
Multi-Media Float x4 iSSE2 | 108.69MPixel/s | ||
Multi-Media Float x8 iSSE2 vs SPEED | 84.59kPixels/s/MHz | 77.82kPixels/s/MHz | |
Multi-Media Float x4 iSSE2 vs SPEED | 40.86kPixels/s/MHz | ||
Multi-Media Double x4 iSSE2 | 137.22MPixel/s | 125.88MPixel/s | |
Multi-Media Double x2 iSSE2 | 55.75MPixel/s | ||
Multi-Media Double x4 iSSE2 vs SPEED | 46.79kPixels/s/MHz | 42.92kPixels/s/MHz | |
Multi-Media Double x2 iSSE2 vs SPEED | 20.96kPixels/s/MHz | ||
Multi-Core Efficiency Benchmark | |||
Inter-Core Bandwidth | 80.49GB/s | 75.61GB/s | 20.54GB/s |
Inter-Core Bandwidth vs SPEED | 28.10MB/s/MHz | 26.40MB/s/MHz | 7.91MB/s/MHz |
Inter-Core Latency (越小越好) | 14ns | 16ns | 90ns |
Inter-Core Latency vs SPEED (越小越好) | 0.00ns/MHz | 0.01ns/MHz | 0.03ns/MHz |
.NET Arithmetic Benchmark .NET架构测试 | |||
Dhrystone .NET | 35720MIPS | 32904MIPS | 10562MIPS |
Dhrystone .NET vs SPEED | 12.18MIPS/MHz | 11.22MIPS/MHz | 3.97MIPS/MHz |
Whetstone .NET | 80455MFLOPS | 78286MFLOPS | 45399MFLOPS |
Whetstone .NET vs SPEED | 27.43MFLOPS/MHz | 26.69MFLOPS/MHz | 17.07MFLOPS/MHz |
.NET Multi-Media Benchmark .NET多媒体测试 | |||
Multi-Media Int x1 .NET | 64.23MPixel/s | 62.28MPixel/s | 31.28MPixel/s |
Multi-Media Int x1 .NET vs SPEED | 21.90kPixels/s/MHz | 21.23kPixels/s/MHz | 11.76kPixels/s/MHz |
Multi-Media Float x1 .NET | 27.93MPixel/s | 26.19MPixel/s | 8.68MPixel/s |
Multi-Media Float x1 .NET vs SPEED | 9.52kPixels/s/MHz | 8.93kPixels/s/MHz | 3.26kPixels/s/MHz |
Multi-Media Double x1 .NET | 54.35MPixel/s | 51.45MPixel/s | 24.75MPixel/s |
Multi-Media Double x1 .NET vs SPEED | 18.53kPixels/s/MHz | 17.54kPixels/s/MHz | 9.30kPixels/s/MHz |
SiSoftware Sandra对比
尽管采用了略慢的内存(DDR3-1066),然而ASUS Z8NA-D6C的成绩仍然超过了同样采用了ASUS主板(Z8PS-D12-1U)的测试样机。测试样机是在Nehalem-EP发布前送到我们IT168评测中心的,可以理解为,时过境迁,新的系统得到了微调。
SiSoftware Sandra缓存内存测试主要包括内存带宽、内存延迟等性能的测试。
SiSoftware Sandra Pro Business 2009 | |||
---|---|---|---|
测试对象 | ASUS Z8NA-D6C 双路Intel Gainestown Xeon X5570 2.93GHz | Intel Nehalem-EP 双路Intel Gainestown Xeon X5570 2.93GHz | DELL PE2900 III 双路Intel Harpertown Xeon E5430 2.66GHz |
Memory Bandwidth Benchmark 内存带宽测试 | |||
Int Buff'd iSSE2 Memory Bandwidth | 14.98GB/s | 16.93GB/s | 6.13GB/s |
Int Buff'd iSSE2 Memory Bandwidth vs SPEED | 9.43MB/s/MHz | ||
Float Buff'd iSSE2 Memory Bandwidth | 15.02GB/s | 16.90GB/s | 6.13GB/s |
Float Buff'd iSSE2 Memory Bandwidth vs SPEED | 9.43MB/s/MHz | ||
Memory Latency Benchmark(Random) 内存延迟测试(随机) | |||
Memory(Random Access) Latency (越小越好) | 81ns | 81ns | 108ns |
Speed Factor (越小越好) | 61.50 | 61.40 | 95.20 |
Internal Data Cache | 4clocks | 4clocks | 3clocks |
L2 On-board Cache | 10clocks | 10clocks | 18clocks |
L3 On-board Cache | 48clocks | 48clocks | |
Memory Latency Benchmark(Linear) 内存延迟测试(线性) | |||
Memory(Linear Access) Latency (越小越好) | 9ns | 8ns | 20ns |
Speed Factor (越小越好) | 6.60 | 6.30 | 17.30 |
Internal Data Cache | 4clocks | 4clocks | 3clocks |
L2 On-board Cache | 10clocks | 10clocks | 13clocks |
L3 On-board Cache | 11clocks | 41clocks | |
Cache and Memory Benchmark 缓存及内存测试 | |||
Cache/Memory Bandwidth | 144.39GB/s | 143.24GB/s | 68.88GB/s |
Cache/Memory Bandwidth vs SPEED | 50.41MB/s/MHz | 50.01MB/s/MHz | 26.52MB/s/MHz |
Speed Factor (越小越好) | 25.50 | 20.90 | 111.90 |
Internal Data Cache | 487.02GB/s | 448.46GB/s | 421.23GB/s |
L2 On-board Cache | 447.80GB/s | 421.42GB/s | 122.68GB/s |
SiSoftware Sandra对比
由于内存规格略低(DDR3-1066 vs DDR3-1333),因此内存带宽测试略有不及,缓存性能则略高。
ScienceMark v2.0 Membench
ScienceMark v2.0是一款用于测试系统特别是处理器在科学计算应用中的性能的软件,MemBenchmark是其中针对处理器缓存、系统内存而设计的功能模块,它可以测试系统内存带宽、L1 Cache延迟、L2 Cache延迟和系统内存延迟,另外还可以测试不同指令集的性能差异。
ScienceMark v2.0 Membench L1测试成绩
ScienceMark v2.0 Membench L2测试成绩
ScienceMark v2.0 Membench 内存测试成绩
首先我们进行的是ScienceMark的测试,主要考察系统的缓存和内存子系统情况。L1/L2 Cache的成绩主要是跟处理器频率相关,因为目前的处理器当中L1 Cache都是和处理器核心同频率的,而L2 Cache基本上也是——当前的处理器L2都是全速的(放置在处理器内但不在同一个芯片上的Pentium II为半速L2,而Pentium之前的处理器L2则和处理器分离,速度更低)。越快的频率,L1/L2性能就越好。而内存带宽主要由两部分相关:比较大的部分是内存架构,小部分是内存操作指令(集),例如使用最新的SSE指令集比通常的ALU指令集会得到更大的吞吐量,而不同的SSE版本性能也有不同。
ScienceMark Membench | |||
---|---|---|---|
厂商 | Intel | Intel | Intel |
产品型号 | ASUS Z8NA-D6C Intel Gainestown Xeon X5570 2.93GHz | Nehalem-EP Intel Gainestown Xeon X5570 2.93GHz | PowerEdge 2900 III Intel Harpertown Xeon E5430 2.66GHz |
内存技术参数 | 2GB R-ECC DDR3-1333 SDRAM x6 | 4GB R-ECC DDR3-1333 SDRAM x6 | 4GB R-ECC DDR3-1333 SDRAM x6 |
L1带宽(MB/s) | 47818.05 | 47880.48 | 55376.16 |
L2带宽(MB/s) | 19664.95 | 19604.64 | 16757.55 |
内存带宽(MB/s) | 9991.92 | 10116.61 | 4485.09 |
L1 Cache Latency(ns) | |||
32 Bytes Stride | 2 cycles 0.68 ns | 2 cycles 0.68 ns | 1.13 ns |
L1 Algorithm Bandwidth(MB/s) | |||
Compiler | 43215.35 | 43072.25 | 25201.96 |
REP MOVSD | 43511.21 | 43467.25 | 25467.15 |
ALU Reg Copy | 12047.41 | 11949.09 | 13093.65 |
MMX Reg Copy | 24174.09 | 22537.36 | 25242.19 |
SSE PAlign | 45382.39 | 47773.13 | 52826.21 |
SSE2 PAlign | 47818.05 | 47880.48 | 55376.16 |
L2 Cache Latency(ns) | |||
4 Bytes Stride | 3 cycles 1.02 ns | 3 cycles 1.02 ns | 1.13 ns |
16 Bytes Stride | 3 cycles 1.02 ns | 3 cycles 1.02 ns | 1.50 ns |
64 Bytes Stride | 8 cycles 2.73 ns | 8 cycles 2.73 ns | 4.51 ns |
256 Bytes Stride | 8 cycles 2.73 ns | 8 cycles 2.73 ns | 4.51 ns |
512 Bytes Stride | 8 cycles 2.73 ns | 7 cycles 2.39 ns | 4.89 ns |
L2 Algorithm Bandwidth(MB/s) | |||
Compiler | 18066.34 | 18039.64 | 11880.48 |
REP MOVSD | 19664.95 | 19604.64 | 12536.88 |
ALU Reg Copy | 8782.00 | 8788.90 | 8577.86 |
MMX Reg Copy | 14046.98 | 14083.83 | 13408.31 |
SSE PAlign | 18726.69 | 18731.92 | 16719.97 |
SSE2 PAlign | 18240.65 | 5833.93 | 16757.55 |
Memory Latency(ns) | |||
4 Bytes Stride | 3 cycles 1.02 ns | 3 cycles 1.02 ns | 1.13 ns |
16 Bytes Stride | 5 cycles 1.70 ns | 5 cycles 1.70 ns | 4.89 ns |
64 Bytes Stride | 23 cycles 7.84 ns | 22 cycles 7.50 ns | 19.17 ns |
256 Bytes Stride | 104 cycles 35.45 ns | 102 cycles 34.77 ns | 59.77 ns |
512 Bytes Stride | 119 cycles 40.57 ns | 117 cycles 39.88 ns | 68.04 ns |
Memory Algorithm Bandwidth(MB/s) | |||
Compiler | 9075.41 | 9210.17 | 3178.45 |
REP MOVSD | 9991.92 | 10116.61 | 3220.23 |
ALU Reg Copy | 7965.79 | 8156.00 | 2789.34 |
MMX Reg Copy | 8945.01 | 9306.18 | 2972.91 |
MMX Reg 3dNow | - | - | - |
MMX Reg SSE | 8801.02 | 8781.26 | 3978.53 |
SSE PAlign | 8568.30 | 8580.24 | 4128.59 |
SSE PAlign SSE | 9505.51 | 9524.07 | 4390.48 |
SSE2 PAlign | 8543.69 | 8560.83 | 4326.42 |
SSE2 PAlign SSE | 9541.90 | 9555.13 | 4441.71 |
MMX Block 4kb | 7804.15 | 7743.82 | 4063.30 |
MMX Block 16kb | 8314.60 | 8321.35 | 4479.88 |
SSE Block 4kb | 7895.35 | 7890.10 | 4074.79 |
SSE Block 16kb | 8255.85 | 8355.86 | 4485.09 |
基于同样的处理器,Z8NA-D6C缓存性能和Z8PS-D12-1U相近,而仍然是内存规格上的缘故,内存性能要低一点,这些都是很合理的现象。在老的Z8PS-D12-1U上,L2 Algorithm Bandwidth测试中的SSE2 PAlign得分有些异常,在Z8NA-D6C上则不再出现这个问题。
CineBench R10
CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,我们的平台偏向于服务器多一些,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。
CineBench R10 64bit | |||
处理器 | ASUS Z8NA-D6C 双路Intel Gainestown Xeon X5570 | 双路Intel Gainestown Xeon X5570 | 双路Intel Harpertown Xeon E5430 |
显卡 | - | - | - |
CPU Benchmark | |||
Rendering (1 CPU) | 4425 CB-CPU | 4410 CB-CPU | 2931 CB-CPU |
Rendering (x CPU) | 29836 CB-CPU | 28172 CB-CPU | 16806 CB-CPU |
Multiprocessor Speedup | 6.74x | 6.39x | 5.73x |
OpenGL Benchmark | |||
OpenGL Standard | 248 CB-GFX | 224 CB-GFX | 176 CB-GFX |
CineBench R10 64bit测试成绩对比
显然,Z8NA-D6C的效率比老平台要高一些。成绩也更高一点。
Benchmark Factory 4.6
我们在被测服务器上安装了Microsoft SQL 2005 SP1,按照测试要求建立了数据库。BF在测试之前会在数据库中生成9个表,其中包括4个500万行的表格,每行包括100字节的数据,因此每个表格容量大约是476MB,整个数据库容量为1.86GB。我们用60个客户端模拟1000个用户,在这个数据库中进行查询、添加、删除、修改等操作。
SQL2005数据库性能测试
数据库测试是一个综合性的测试,Z8NA-D6C符合正常的Nehalem-EP平台的表现。
【IT168评测中心】ASUS Z8NA-D6系列是第一个在标准ATX架构上实现双Nehalem处理器支持的主板,Z8NA-D6C则是该系列中不带SAS控制芯片的版本。
ASUS Z8NA-D6C采用了Tylersbug-24D芯片(也就是5500芯片),可以提供24条PCI Express Gen2信道,每信道单向带宽达到了500MB/s(双向带宽1GB/s),Z8NA-D6C提供了一个PCIE x16插槽和两个PCIE x8插槽,它们均为x8的速率。由于x16插槽实际上是x8速率,因此Z8NA-D6C不太适合工作站应用(虽然问题也不大),这点显得比较遗憾。
在测试中,Z8NA-D6C表现也非常好,它很适合服务器应用,在和桌面主板一样的大小内,可以支持两个Nehalem处理器以及6个DDR3内存通道,提供非常好的计算密度。