缓存内存性能测试
|
ScienceMark Membench | ||||
| Dual Xeon LV | Dual Xeon 5050 | Dual Paxville | Dual Xeon | |
|
内存带宽(MB/s) |
3202.20 |
2283.58 |
3703.52 |
4091.74 |
|
L1 Cache Latency (ns) 数值越低越好 | ||||
|
32 Bytes Stride |
1.50 |
1.34 |
1.43 |
1.03 |
|
L2 Cache Latency(ns) 数值越低越好 | ||||
|
4 Bytes Stride |
1.50 | 1.34 |
2.21 |
2.00 |
|
16 Bytes Stride |
2.50 | 2.67 |
4.64 |
4.67 |
|
64 Bytes Stride |
7.00 | 9.02 |
10.36 |
9.00 |
|
256 Bytes Stride |
7.00 | 8.69 |
10.36 |
8.67 |
|
512 Bytes Stride |
7.00 | 8.35 |
10.00 |
8.33 |
|
Memory Latency(ns) 数值越低越好 | ||||
|
4 Bytes Stride |
2.00 | 1.67 |
3.21 |
2.00 |
|
16 Bytes Stride |
7.00 | 6.68 |
5.71 |
5.00 |
|
64 Bytes Stride |
28.50 | 27.07 |
16.78 |
16.33 |
|
256 Bytes Stride |
123.49 | 179.11 |
128.21 |
125.66 |
|
512 Bytes Stride |
122.49 | 189.8 |
134.63 |
131.33 |
|
Algorithm Bandwidth(MB/s) 数值越高越好 | ||||
|
Compiler |
1603.90 | 1771.21 |
1914.36 |
2113.73 |
|
REP MOVSD |
1621.81 | 1796.07 |
1950.86 |
2140.7 |
|
ALU Reg Copy |
1321.41 | 1751.59 |
1746.1 |
1885.35 |
|
MMX Reg Copy |
1364.01 | 1794.26 |
1903.61 |
2031.39 |
|
MMX Reg 3dNow |
- | - |
- |
- |
|
MMX Reg SSE |
2695.34 | 2283.58 |
2712.14 |
3396.47 |
|
SSE PAlign |
2834.36 | 2272.72 |
3066.42 |
3537.47 |
|
SSE PAlign SSE |
2624.56 | 2281.81 |
3012.8 |
3525.52 |
|
SSE2 PAlign |
2807.56 | 2271.43 |
3066.15 |
3539.02 |
|
SSE2 PAlign SSE |
2641.72 | 2280.69 |
3010.93 |
3527.03 |
|
MMX Block 4kb |
2889.96 | 3163.14 |
3098.21 |
3770.11 |
|
MMX Block 16kb |
3176.61 | 2212.04 |
3622.71 |
4091.74 |
|
SSE Block 4kb |
2910.25 | 2174.46 |
3292.47 |
3800.00 |
|
SSE Block 16kb |
3202.20 | 2204.89 |
3703.52 |
4078.21 |
ScienceMark v2.0是一款用于测试系统特别是处理器在科学计算应用中的性能的软件,MemBenchmark是其中针对处理器缓存、系统内存而设计的功能模块,它可以测试系统内存带宽、L1 Cache延迟、L2 Cache延迟和系统内存延迟,另外还可以测试不同指令集的性能差异。
我们已经了解到Xeon LV的L1缓存设计走了“复古路线”,配置了32KB L1指令缓存和32KB L1数据缓存,而另外三个对比平台的处理器依然采用的是Netburst微架构,是利用12k追踪缓存+16KB数据缓存。L1缓存延迟测试结果显示它们之间的差异不大。
Xeon LV采用共享L2缓存的设计,而目前Intel已经发布的其它双核处理器(比如Pentium D、Xeon 5050、Paxville)均是非共享L2缓存。从测试结果来看,Xeon LV L2缓存的性能优势非常的明显,即使同AMD Opteron处理器相比也不逊色。
除了Xeon5050平台上采用了Intel 5000V芯片组之外,其余的三个测试平台均采用了Intel 7520芯片组,前者支持双通道FB-DIMM内存,后三者均支持双通道DDR2内存。从测试结果看,256/512 Bytes Stride时,FB-DIMM内存的延迟略长,其余三个平台的性能相近。
![]() |
我们还使用了Sisoft Sandra 2005 Pro程序中的Cache & Memory Benchmark测试子项目进行了测试。这个程序的算法同ScienceMark的非常不同,以前在单核心Xeon平台的测试结果显示它会明显的受到处理器数量或者可并行处理线程数量的影响。
测试结果显示双Xeon 5050平台和双Paxville平台的表现有些“异常”,而双Xeon平台显得非常适应Sisosft Sandra 2005 Pro,而Xeon LV平台在这项测试中的优势更加明显,特别是测试数据小于64KB的部分。
