服务器 频道

近乎完美 DELL最新一代R610服务器评测

  ScienceMark v2.0 Membench

  ScienceMark v2.0是一款用于测试系统特别是处理器在科学计算应用中的性能的软件,MemBenchmark是其中针对处理器缓存、系统内存而设计的功能模块,它可以测试系统内存带宽、L1 Cache延迟、L2 Cache延迟和系统内存延迟,另外还可以测试不同指令集的性能差异。

  首先我们进行的是ScienceMark的测试,主要考察系统的缓存和内存子系统情况。L1/L2 Cache的成绩主要是跟处理器频率相关,因为目前的处理器当中L1 Cache都是和处理器核心同频率的,而L2 Cache基本上也是——当前的处理器L2都是全速的(放置在处理器内但不在同一个芯片上的Pentium II为半速L2,而Pentium之前的处理器L2则和处理器分离,速度更低)。越快的频率,L1/L2性能就越好。而内存带宽主要由两部分相关:比较大的部分是内存架构,小部分是内存操作指令(集),例如使用最新的SSE指令集比通常的ALU指令集会得到更大的吞吐量,而不同的SSE版本性能也有不同。

ScienceMark Membench
厂商DELLDELL
产品型号PowerEdge R610
Intel Gainestown
Xeon E5520 2.26GHz
PowerEdge 2900 III
Intel Harpertown
Xeon E5430 2.66GHz
内存技术参数4GB R-ECC DDR3-1333 SDRAM x6 @ DDR3-1066 2GB FBD-DDR2 667 SDRAM x8
L1带宽(MB/s)47758.8555376.16
L2带宽(MB/s)19541.8516757.55
内存带宽(MB/s)6959.604485.09
L1 Cache Latency(ns)
32 Bytes Stride2 cycles
0.88 ns
1.13 ns
L1 Algorithm Bandwidth(MB/s)
Compiler42521.3025201.96
REP MOVSD43383.8025467.15
ALU Reg Copy12029.6613093.65
MMX Reg Copy24112.8725242.19
SSE PAlign46354.6752826.21
SSE2 PAlign47758.8555376.16
L2 Cache Latency(ns)
4 Bytes Stride3 cycles
1.33 ns
1.13 ns
16 Bytes Stride3 cycles
1.33 ns
1.50 ns
64 Bytes Stride9 cycles
3.98 ns
4.51 ns
256 Bytes Stride8 cycles
3.54 ns
4.51 ns
512 Bytes Stride8 cycles
3.54 ns
4.89 ns
L2 Algorithm Bandwidth(MB/s)
Compiler17883.4211880.48
REP MOVSD19541.8512536.88
ALU Reg Copy8764.808577.86
MMX Reg Copy14103.0613408.31
SSE PAlign18620.1916719.97
SSE2 PAlign18630.5316757.55
Memory Latency(ns)
4 Bytes Stride3 cycles
1.33 ns
1.13 ns
16 Bytes Stride8 cycles
3.54 ns
4.89 ns
64 Bytes Stride32 cycles
14.15 ns
19.17 ns
256 Bytes Stride174 cycles
76.96 ns
59.77 ns
512 Bytes Stride191 cycles
84.48 ns
68.04 ns
Memory Algorithm Bandwidth(MB/s)
Compiler6900.373178.45
REP MOVSD6959.603220.23
ALU Reg Copy5189.152789.34
MMX Reg Copy5997.482972.91
MMX Reg 3dNow--
MMX Reg SSE5709.783978.53
SSE PAlign5568.934128.59
SSE PAlign SSE6350.834390.48
SSE2 PAlign5546.164326.42
SSE2 PAlign SSE6364.574441.71
MMX Block 4kb4893.724063.30
MMX Block 16kb5120.234479.88
SSE Block 4kb4866.764074.79
SSE Block 16kb5138.864485.09

  除了和主频紧密相关的L1性能之外,Nehalem-EP的表现远比Harpertown好,这主要是IMC的功劳。

0
相关文章