服务器 频道

短兵相接 皓龙至强新双核全面对比

  缓存内存性能测试

ScienceMark Membench

  Opteron 2210 Xeon 5120
L1带宽 29794.86 52358.39
L2带宽 9440.91 15683.28

内存带宽(MB/s)

4532.81 2918.25

L1 Cache Latency (ns)

32 Bytes Stride

1.67 1.61

L2 Cache Latency(ns)

4 Bytes Stride

1.67 1.61

16 Bytes Stride

2.78 2.14

64 Bytes Stride

9.47 5.89

256 Bytes Stride

6.68 6.43

512 Bytes Stride

7.24 6.43

Memory Latency(ns)

4 Bytes Stride

2.23 1.61

16 Bytes Stride

7.24 2.14

64 Bytes Stride

30.07 6.96

256 Bytes Stride

72.96 7.50

512 Bytes Stride

76.3 8.04

Algorithm Bandwidth(MB/s)

Compiler

2150.32 2068.71

REP MOVSD

2210.95 2086.7

ALU Reg Copy

2247.43 2019.78

MMX Reg Copy

2321.01 2046.38

MMX Reg 3dNow

4080.22 -

MMX Reg SSE

4532.81 2906.74

SSE PAlign

3455.83 2897.37

SSE PAlign SSE

4530.49 2918.25

SSE2 PAlign

3456.07 2888.73

SSE2 PAlign SSE

4529.26 2917.67

MMX Block 4kb

3729.19 2460.69

MMX Block 16kb

4003.97 2663.69

SSE Block 4kb

3825.39 2452.03

SSE Block 16kb

4093.81 2668.89

  ScicenMark v2.0 Membench的测试结果显示Opteron 2210平台的内存带宽为4532 MB/s,而Xeon 5120平台的内存带宽为2918 MB/s,差异相当的明显。在Algorithm Bandwidth测试中,不同算法应用下的带宽测试结果也是Opteron 2210占据明显的优势。

  Xeon 5120的L1缓存延迟和L2缓存延迟都比Opteron 2210的短,这主要是Xeon 5100系列开始采用Core微架构的结果。更令人意想不到的时候,以前在内存延迟方面占据明显的优势的Opteron 2210明显落后于Xeon 5120。虽然Opteron 2000系列采用延迟较长的DDR2内存是一个方面的因素,但是总体来说其延迟增加并不多(该文的对比了Opteron 2000和Opteron 200的内存延迟)。

  从上面的数据来看,Intel Xeon 5120内存延迟的测试结果依然保持在L2缓存的数量级上,因此我们认为Xeon 5120处理器更加适用于ScienceMark的算法(或者说此时测试所采用的数据没有能真正的调用缓存以外的数据,随后的测试中能进一步解释这个问题)。

SiSoftware.Sandra.Enterprise.v2007.5.10.98

  Opteron 2210 Xeon 5120
Memory Bandwidth
RAM Int Buff iSSE2(MB/s) 10764 4152
RAM Float Buff iSSE2(MB/s) 10722 4158
Memory Latency
Random Access    
1kB 1.7 1.6
4kB 1.7 1.6
16kB 1.7 1.6
64kB 1.7 7.6
256kB 9.6 8.4
1MB 12.2 8.6
4MB 112.3 14.4
16MB 119.3 118.5
64MB 127.1 134.9
Linear Access    
1kB 1.7 1.6
4kB 1.7 1.6
16kB 1.7 1.6
64kB 1.7 6.6
256kB 9.6 6.6
1MB 9.6 6.6
4MB 30.6 7.3
16MB 30.8 25.5
64MB 30.7 25.6
Cache and Memory(MB/s)
2KB 73233 169224 
4KB 70565 212754
8KB 69892 226392
16KB 72724 236478
32KB 73363 234714
64KB 71060 222290
128KB 62404 173958
256KB 56193 69226
512KB 43541 68656
1MB 35921 65802
4MB 23093 54043
16MB 9272 7008
64MB 9177 4703
256MB 8740 4430
1GB 6990 3544

  Sisoft Sandra 2007内存带宽测试结果显示Opteron 2210平台的内存带宽是Xeon 5120平台的2.5倍,而两者的理论内存带宽基本是相同的。需要注意的是,这个数字也不能说明FB-DIMM是如此的不堪,我们依然认为这是不同的测试软件所采用的算法不同所导致的。

  在内存延迟方面,无论是随机测试还是线性测试,当测试数据块小于4MB(也就是Xeon 5120的L2缓存的容量的时候),Xeon 5120平台都占据着明显的优势。而当测试数据块容量超过L2缓存容量的时候,Xeon 5120只有在线性测试中领先了,Opteron 2210则在随机测试中具有优势。

  Cache and Memory带宽测试中也表现出来同样的趋势,当测试数据块容量小于4MB时,Xeon 5120均明显的优于Opteron 2210(这一点同,ScienceMark Membench的L1/L2测试结果是相符的)。当测试数据块容量大于4MB时,Opteron 2210立刻赶超了上来。

0
相关文章