缓存内存性能测试
|
ScienceMark Membench | ||
| Opteron 2210 | Xeon 5120 | |
| L1带宽 | 29794.86 | 52358.39 |
| L2带宽 | 9440.91 | 15683.28 |
|
内存带宽(MB/s) |
4532.81 | 2918.25 |
|
L1 Cache Latency (ns) | ||
|
32 Bytes Stride |
1.67 | 1.61 |
|
L2 Cache Latency(ns) | ||
|
4 Bytes Stride |
1.67 | 1.61 |
|
16 Bytes Stride |
2.78 | 2.14 |
|
64 Bytes Stride |
9.47 | 5.89 |
|
256 Bytes Stride |
6.68 | 6.43 |
|
512 Bytes Stride |
7.24 | 6.43 |
|
Memory Latency(ns) | ||
|
4 Bytes Stride |
2.23 | 1.61 |
|
16 Bytes Stride |
7.24 | 2.14 |
|
64 Bytes Stride |
30.07 | 6.96 |
|
256 Bytes Stride |
72.96 | 7.50 |
|
512 Bytes Stride |
76.3 | 8.04 |
|
Algorithm Bandwidth(MB/s) | ||
|
Compiler |
2150.32 | 2068.71 |
|
REP MOVSD |
2210.95 | 2086.7 |
|
ALU Reg Copy |
2247.43 | 2019.78 |
|
MMX Reg Copy |
2321.01 | 2046.38 |
|
MMX Reg 3dNow |
4080.22 | - |
|
MMX Reg SSE |
4532.81 | 2906.74 |
|
SSE PAlign |
3455.83 | 2897.37 |
|
SSE PAlign SSE |
4530.49 | 2918.25 |
|
SSE2 PAlign |
3456.07 | 2888.73 |
|
SSE2 PAlign SSE |
4529.26 | 2917.67 |
|
MMX Block 4kb |
3729.19 | 2460.69 |
|
MMX Block 16kb |
4003.97 | 2663.69 |
|
SSE Block 4kb |
3825.39 | 2452.03 |
|
SSE Block 16kb |
4093.81 | 2668.89 |
ScicenMark v2.0 Membench的测试结果显示Opteron 2210平台的内存带宽为4532 MB/s,而Xeon 5120平台的内存带宽为2918 MB/s,差异相当的明显。在Algorithm Bandwidth测试中,不同算法应用下的带宽测试结果也是Opteron 2210占据明显的优势。
Xeon 5120的L1缓存延迟和L2缓存延迟都比Opteron 2210的短,这主要是Xeon 5100系列开始采用Core微架构的结果。更令人意想不到的时候,以前在内存延迟方面占据明显的优势的Opteron 2210明显落后于Xeon 5120。虽然Opteron 2000系列采用延迟较长的DDR2内存是一个方面的因素,但是总体来说其延迟增加并不多(该文的对比了Opteron 2000和Opteron 200的内存延迟)。
从上面的数据来看,Intel Xeon 5120内存延迟的测试结果依然保持在L2缓存的数量级上,因此我们认为Xeon 5120处理器更加适用于ScienceMark的算法(或者说此时测试所采用的数据没有能真正的调用缓存以外的数据,随后的测试中能进一步解释这个问题)。
|
SiSoftware.Sandra.Enterprise.v2007.5.10.98 | ||
| Opteron 2210 | Xeon 5120 | |
| Memory Bandwidth | ||
| RAM Int Buff iSSE2(MB/s) | 10764 | 4152 |
| RAM Float Buff iSSE2(MB/s) | 10722 | 4158 |
| Memory Latency | ||
| Random Access | ||
| 1kB | 1.7 | 1.6 |
| 4kB | 1.7 | 1.6 |
| 16kB | 1.7 | 1.6 |
| 64kB | 1.7 | 7.6 |
| 256kB | 9.6 | 8.4 |
| 1MB | 12.2 | 8.6 |
| 4MB | 112.3 | 14.4 |
| 16MB | 119.3 | 118.5 |
| 64MB | 127.1 | 134.9 |
| Linear Access | ||
| 1kB | 1.7 | 1.6 |
| 4kB | 1.7 | 1.6 |
| 16kB | 1.7 | 1.6 |
| 64kB | 1.7 | 6.6 |
| 256kB | 9.6 | 6.6 |
| 1MB | 9.6 | 6.6 |
| 4MB | 30.6 | 7.3 |
| 16MB | 30.8 | 25.5 |
| 64MB | 30.7 | 25.6 |
| Cache and Memory(MB/s) | ||
| 2KB | 73233 | 169224 |
| 4KB | 70565 | 212754 |
| 8KB | 69892 | 226392 |
| 16KB | 72724 | 236478 |
| 32KB | 73363 | 234714 |
| 64KB | 71060 | 222290 |
| 128KB | 62404 | 173958 |
| 256KB | 56193 | 69226 |
| 512KB | 43541 | 68656 |
| 1MB | 35921 | 65802 |
| 4MB | 23093 | 54043 |
| 16MB | 9272 | 7008 |
| 64MB | 9177 | 4703 |
| 256MB | 8740 | 4430 |
| 1GB | 6990 | 3544 |
Sisoft Sandra 2007内存带宽测试结果显示Opteron 2210平台的内存带宽是Xeon 5120平台的2.5倍,而两者的理论内存带宽基本是相同的。需要注意的是,这个数字也不能说明FB-DIMM是如此的不堪,我们依然认为这是不同的测试软件所采用的算法不同所导致的。
在内存延迟方面,无论是随机测试还是线性测试,当测试数据块小于4MB(也就是Xeon 5120的L2缓存的容量的时候),Xeon 5120平台都占据着明显的优势。而当测试数据块容量超过L2缓存容量的时候,Xeon 5120只有在线性测试中领先了,Opteron 2210则在随机测试中具有优势。
Cache and Memory带宽测试中也表现出来同样的趋势,当测试数据块容量小于4MB时,Xeon 5120均明显的优于Opteron 2210(这一点同,ScienceMark Membench的L1/L2测试结果是相符的)。当测试数据块容量大于4MB时,Opteron 2210立刻赶超了上来。