缓存内存性能测试
|
ScienceMark Membench | |
| L1带宽 | 22929.81 |
| L2带宽 | 7260.15 |
|
内存带宽(MB/s) |
4295.38 |
|
L1 Cache Latency (ns) | |
|
32 Bytes Stride |
1.50 |
|
L2 Cache Latency(ns) | |
|
4 Bytes Stride |
1.50 |
|
16 Bytes Stride |
2.51 |
|
64 Bytes Stride |
8.52 |
|
256 Bytes Stride |
6.02 |
|
512 Bytes Stride |
6.52 |
|
Memory Latency(ns) | |
|
4 Bytes Stride |
2.01 |
|
16 Bytes Stride |
7.52 |
|
64 Bytes Stride |
30.08 |
|
256 Bytes Stride |
74.19 |
|
512 Bytes Stride |
77.69 |
|
Algorithm Bandwidth(MB/s) | |
|
Compiler |
1899.46 |
|
REP MOVSD |
1920.74 |
|
ALU Reg Copy |
1950.16 |
|
MMX Reg Copy |
2062.14 |
|
MMX Reg 3dNow |
3948.13 |
|
MMX Reg SSE |
4292.58 |
|
SSE PAlign |
3389.02 |
|
SSE PAlign SSE |
4293.64 |
|
SSE2 PAlign |
3389.12 |
|
SSE2 PAlign SSE |
4295.38 |
|
MMX Block 4kb |
3829.08 |
|
MMX Block 16kb |
4195.49 |
|
SSE Block 4kb |
3901.32 |
|
SSE Block 16kb |
4228.2 |
由于AMD Opteron 2000系列处理器同Intel Xeon 5100系列处理器在微架构上有了很大的不同,因此其L1、L2带宽有着很大的区别,ScicenMark v2.0 Membench测试结果显示一般的双路Xeon 5120处理器的L1带宽为52000 MB/s左右,L2带宽为15000 MB/s左右。虽然这样,但是Opteron系列的L1延迟和L2延迟还是具有明显优势的。
曙光A620r-F服务器每颗Opteron 2112处理器配置了双通道DDR2-400内存,ScicenMark v2.0 Membench测试结果显示其内存带宽为4300 MB/s左右,高于Xeon系统在这个测试项目的得分。
|
SiSoftware.Sandra.Enterprise.SP1 v2007 | |
| Memory Bandwidth | |
| RAM IntBuff iSSE2(MB/s) | 9512 |
| Assignment | 9401 |
| Scaling | 9392 |
| Addition | 9635 |
| Triad | 9623 |
| RAM FloatBuff iSSE2(MB/s) | 9470 |
| Assignment | 9358 |
| Scaling | 9347 |
| Addition | 9583 |
| Triad | 9595 |
![]() |
![]() |
Sisoftware Sandra SP1 2007 Memory Bandwith测试可以很好的反应出来Opteron内存子系统架构上的特性——每个Opteron 2000处理器配置了双通道DDR2内存,因此结果几乎是一个内存控制器的2倍。因此,回头看ScicenMark v2.0 Membench测试结果,它应该是测试了一个内存控制器的效能。
在线性内存延迟方面和随机内存延迟方面,我们发现配置了双路Xeon 5120处理器的系统优于配置了双路Opteron 2112处理器的曙光A620r-F服务器。在缓存内存带宽测试方面,当测试数据块小于4MB时,测试结果依然是Xeon 5100系统占据优势,当测试数据块大约4MB时,测试结果则是配置了双路Opteron 2112处理器的曙光A620r-F服务器占据优势,这说明基于AMD Optereon 2000系列处理器的系统在内存性能上是具有优势的。
