缓存内存性能测试
|
ScienceMark Membench | |
| L1带宽 | 44446.48 |
| L2带宽 | 13330.29 |
|
内存带宽(MB/s) |
3083.95 |
|
L1 Cache Latency (ns) | |
|
32 Bytes Stride |
1.88 |
|
L2 Cache Latency(ns) | |
|
4 Bytes Stride |
1.88 |
|
16 Bytes Stride |
2.51 |
|
64 Bytes Stride |
7.52 |
|
256 Bytes Stride |
7.52 |
|
512 Bytes Stride |
7.52 |
|
Memory Latency(ns) | |
|
4 Bytes Stride |
1.88 |
|
16 Bytes Stride |
2.51 |
|
64 Bytes Stride |
7.52 |
|
256 Bytes Stride |
8.77 |
|
512 Bytes Stride |
9.4 |
|
Algorithm Bandwidth(MB/s) | |
|
Compiler |
2308.04 |
|
REP MOVSD |
2334.38 |
|
ALU Reg Copy |
2192.87 |
|
MMX Reg Copy |
2254.39 |
|
MMX Reg 3dNow |
- |
|
MMX Reg SSE |
3067.99 |
|
SSE PAlign |
3036.04 |
|
SSE PAlign SSE |
3083.95 |
|
SSE2 PAlign |
3023.02 |
|
SSE2 PAlign SSE |
3072.07 |
|
MMX Block 4kb |
2539.84 |
|
MMX Block 16kb |
2703.70 |
|
SSE Block 4kb |
2500.15 |
|
SSE Block 16kb |
2707.09 |
虽然同方TP320 5110采用了4通道FB-DIMM内存,但是ScicenMark v2.0 Membench的测试结果并不能很好的体现其带宽优势,测试结果显示其内存带宽为3083MB/s。在Algorithm Bandwidth测试中,不同算法应用下的带宽测试结果也比较平均。
从ScicenMark v2.0 Membench延迟测试数据上来看,新的Bensley平台的内存延迟有了飞跃式的改进,从4Bytes Stride到512Bytes Stride测试的内存延迟都在10ns一下,而之前的E7520/7320平台的内存延迟100ns以上。
|
SiSoftware.Sandra.Enterprise.SP1 v2007 | |
| Memory Bandwidth | |
| RAM IntBuff iSSE2(MB/s) | 4042 |
| Assignment | 3729 |
| Scaling | 3737 |
| Addition | 4353 |
| Triad | 4351 |
| RAM FloatBuff iSSE2(MB/s) | 4047 |
| Assignment | 3753 |
| Scaling | 3739 |
| Addition | 4346 |
| Triad | 4352 |
Sisoft Sandra 2007内存带宽测试结果显示整数应用带宽和浮点应用带宽都在4000MB/s以上。
![]() |
SiSoftwaren Sandra 2007可以测试缓存内存子系统的随机访问延迟时间和线性访问延迟时间,从上图来看当测试数据块小于32KB的时候(大约小于L1缓存容量),无论是随机还是线性测试其延迟都在2ns左右;当测试数据块小于4MB的时候(大约小于L2缓存容量),其延迟时间也非常的接近,在7-9ns之间;当数据块容量超过4MB之后,随机访问延迟时间明显的提升,达到了120-140ns之间,而现象访问延迟时间还能维持在较为理想的26ns左右。
![]() |
Cache and Memory测试结果以带宽为单位显示了缓存和内存的性能。当测试数据块小于等于64KB时,带宽维持在150000-200000MB/s之间,此值可认为是L1带宽;当测试数据块小于4MB大于256KB时,带宽维持在50000MB/s以上,此值相当于L2带宽;当测试数据块大于16MB时,测试带宽在3500-4700MB/s之间,同之前的内存带宽测试结果是相符的。
