服务器 频道

平滑过渡上海 曙光A650服务器性能评测

  ScienceMark v2.0 Membench

  ScienceMark v2.0是一款用于测试系统特别是处理器在科学计算应用中的性能的软件,MemBenchmark是其中针对处理器缓存、系统内存而设计的功能模块,它可以测试系统内存带宽、L1 Cache延迟、L2 Cache延迟和系统内存延迟,另外还可以测试不同指令集的性能差异。


ScienceMark v2.0 Membench L1测试成绩


ScienceMark v2.0 Membench L2测试成绩


ScienceMark v2.0 Membench 内存测试成绩

  首先我们进行的是ScienceMark的测试,主要考察系统的缓存和内存子系统情况。L1/L2 Cache的成绩主要是跟处理器频率相关,因为目前的处理器当中L1 Cache都是和处理器核心同频率的,而L2 Cache基本上也是——当前的处理器L2都是全速的(放置在处理器内但不在同一个芯片上的Pentium II为半速L2,而Pentium之前的处理器L2则和处理器分离,速度更低)。越快的频率,L1/L2性能就越好。而内存带宽主要由两部分相关:比较大的部分是内存架构,小部分是内存操作指令(集),例如使用最新的SSE指令集比通常的ALU指令集会得到更大的吞吐量,而不同的SSE版本性能也有不同。

ScienceMark Membench

厂商DawningDELL
产品型号AS650
AMD Barcelona
Opteron 2350
2.0GHz
PowerEdge 2900 III
Intel Harptown
Xeon E5430
2.66GHz
内存技术参数2GB R-ECC DDR2-667 SDRAM x42GB FBD-ECC DDR2-667 SDRAM x4
L1带宽(MB/s)37069.9755376.16
L2带宽(MB/s)11523.4616757.55
内存带宽(MB/s)5144.714485.09
L1 Cache Latency(ns)
32 Bytes Stride1.501.13
L1 Algorithm Bandwidth(MB/s)
Compiler28354.5825201.968
REP MOVSD28986.1425467.15
ALU Reg Copy10804.2613093.65
MMX Reg Copy20285.3725242.19
SSE PAlign37003.9952826.21
SSE2 PAlign37069.9755376.16
L2 Cache Latency(ns)
4 Bytes Stride1.131.13
16 Bytes Stride1.501.50
64 Bytes Stride4.514.51
256 Bytes Stride4.514.51
512 Bytes Stride4.894.89
L2 Algorithm Bandwidth(MB/s)
Compiler8830.23118800.48
REP MOVSD9964.3412536.88
ALU Reg Copy7660.438577.86
MMX Reg Copy9754.6113408.31
SSE PAlign11523.4616719.97
SSE2 PAlign11502.3816757.55
Memory Latency(ns)
4 Bytes Stride2.001.13
16 Bytes Stride8.004.89
64 Bytes Stride31.0019.17
256 Bytes Stride97.4959.77
512 Bytes Stride107.9968.04
Memory Algorithm Bandwidth(MB/s)
Compiler1826.243178.45
REP MOVSD1851.433220.23
ALU Reg Copy1606.582789.34
MMX Reg Copy1882.102972.91
MMX Reg 3dNow5028.88-
MMX Reg SSE5106.973978.53
SSE PAlign4720.154128.59
SSE PAlign SSE5144.714390.48
SSE2 PAlign4721.734326.42
SSE2 PAlign SSE5144.154441.71
MMX Block 4kb2940.434063.30
MMX Block 16kb3201.034479.88
SSE Block 4kb3087.784074.79
SSE Block 16kb3245.744485.09
 
 

AMD 45nm Shanghai Opteron 2350的缓存架构,L3基于32路集合关联,并且容量只有2MB

Intel 45nm Harptertown Xeon E5430的缓存架构,L3基于24路集合关联

  不得不说,直联架构的内存带宽是要高一些,而基本上,与处理器结合最紧密的L1,或L2(在有L3的情况下)的延迟总是跟处理器频率密集相关的,因此频率较高的Xeon平台在缓存方面就强一些。大容量的缓存在进行多任务处理器的时候会具有更高的效率。

0
相关文章