服务器 频道

大家风范 DELL PE R805机架服务器评测

  ScienceMark v2.0 Membench

  ScienceMark v2.0是一款用于测试系统特别是处理器在科学计算应用中的性能的软件,MemBenchmark是其中针对处理器缓存、系统内存而设计的功能模块,它可以测试系统内存带宽、L1 Cache延迟、L2 Cache延迟和系统内存延迟,另外还可以测试不同指令集的性能差异。


ScienceMark v2.0 Membench L1测试成绩


ScienceMark v2.0 Membench L2测试成绩


ScienceMark v2.0 Membench 内存测试成绩

  首先我们进行的是ScienceMark的测试,主要考察系统的缓存和内存子系统情况。L1/L2 Cache的成绩主要是跟处理器频率相关,因为目前的处理器当中L1 Cache都是和处理器核心同频率的,而L2 Cache基本上也是——当前的处理器L2都是全速的(放置在处理器内但不在同一个芯片上的Pentium II为半速L2,而Pentium之前的处理器L2则和处理器分离,速度更低)。越快的频率,L1/L2性能就越好。而内存带宽主要由两部分相关:比较大的部分是内存架构,小部分是内存操作指令(集),例如使用最新的SSE指令集比通常的ALU指令集会得到更大的吞吐量,而不同的SSE版本性能也有不同。

ScienceMark Membench

厂商DELLDELL
产品型号PowerEdge R805
AMD Barcelona
Opteron 2354
2.2GHz
PowerEdge 2900 III
Intel Harptown
Xeon E5430
2.66GHz
内存技术参数2GB R-ECC DDR2-667 SDRAM x82GB FBD-ECC DDR2-667 SDRAM x4
L1带宽(MB/s)20359.4255376.16
L2带宽(MB/s)12671.8516757.55
内存带宽(MB/s)5554.494485.09
L1 Cache Latency(ns)
32 Bytes Stride1.361.13
L1 Algorithm Bandwidth(MB/s)
Compiler15590.5725201.968
REP MOVSD15882.5525467.15
ALU Reg Copy5938.3213093.65
MMX Reg Copy11171.6725242.19
SSE PAlign20359.4252826.21
SSE2 PAlign20334.2655376.16
L2 Cache Latency(ns)
4 Bytes Stride1.361.13
16 Bytes Stride1.361.50
64 Bytes Stride4.094.51
256 Bytes Stride6.824.51
512 Bytes Stride6.824.89
L2 Algorithm Bandwidth(MB/s)
Compiler5093.55118800.48
REP MOVSD5463.2912536.88
ALU Reg Copy4200.958577.86
MMX Reg Copy7532.0813408.31
SSE PAlign12552.7616719.97
SSE2 PAlign12671.8516757.55
Memory Latency(ns)
4 Bytes Stride2.271.13
16 Bytes Stride8.184.89
64 Bytes Stride32.7319.17
256 Bytes Stride102.7259.77
512 Bytes Stride111.8168.04
Memory Algorithm Bandwidth(MB/s)
Compiler1877.703178.45
REP MOVSD1901.813220.23
ALU Reg Copy1609.942789.34
MMX Reg Copy1917.392972.91
MMX Reg 3dNow5374.10-
MMX Reg SSE5478.603978.53
SSE PAlign4894.524128.59
SSE PAlign SSE5554.494390.48
SSE2 PAlign4895.074326.42
SSE2 PAlign SSE5554.144441.71
MMX Block 4kb3034.724063.30
MMX Block 16kb3355.634479.88
SSE Block 4kb3176.994074.79
SSE Block 16kb3395.194485.09
 
 

AMD 45nm Shanghai Opteron 2350的缓存架构,L3基于32路集合关联,并且容量只有2MB

Intel 45nm Harptertown Xeon E5430的缓存架构,L3基于24路集合关联

  不得不说,直联架构的内存带宽是要高一些,而基本上,与处理器结合最紧密的L1,或L2(在有L3的情况下)的延迟总是跟处理器频率密集相关的,因此频率较高的Xeon平台在缓存方面就强一些。大容量的缓存在进行多任务处理器的时候会具有更高的效率。

0
相关文章