Sciencemark v2.0 Membench
ScienceMark v2.0是一款用于测试系统特别是处理器在科学计算应用中的性能的软件,MemBenchmark是其中针对处理器缓存、系统内存而设计的功能模块,它可以测试系统内存带宽、L1 Cache延迟、L2 Cache延迟和系统内存延迟,另外还可以测试不同指令集的性能差异。
| ScienceMark Membench | ||||
| AMD Opteron 265 | Intel Pentium D 830 | Intel Petium M T2600 | Dual Xeon 3.0GHz | |
| 内存带宽(MB/s) | 4817.58 | 4429.8 | 3444.99 | 4073.71 |
| L1 Cache Latency | ||||
| 32 Bytes Stride | 3 cycles/1.67ns | 4 cycles/1.33ns | 3 cycles/1.38ns | 3 cycles/1.00ns |
| L2 Cache Latency | ||||
| 4 Bytes Stride | 3 cycles/1.67 ns | 6 cycles/2.00 ns | 3 cycles/1.38 ns | 6 cycles/2.00 ns |
| 16 Bytes Stride | 5 cycles/2.79 ns | 13 cycles/4.33 ns | 5 cycles/2.31 ns | 13 cycles/4.33 ns |
| 64 Bytes Stride | 17 cycles/9.47 ns | 29 cycles/9.67 ns | 14 cycles/6.46 ns | 27 cycles/9.00 ns |
| 256 Bytes Stride | 12 cycles/6.69 ns | 28 cycles/9.33 ns | 14 cycles/6.46 ns | 26 cycles/8.67 ns |
| 512 Bytes Stride | 13 cycles/7.24 ns | 26 cycles/8.67 ns | 14 cycles/6.46 ns | 25 cycles/8.33 ns |
| Memory Latency | ||||
| 4 Bytes Stride | 3 cycles/1.67 ns | 7 cycles/2.33 ns | 4 cycles/1.85 ns | 6 cycles/ 2.00 ns |
| 16 Bytes Stride | 12 cycles/6.69 ns | 15 cycles/5.00 ns | 13 cycles/6.00 ns | 15 cycles/5.00 ns |
| 64 Bytes Stride | 48 cycles/26.75 ns | 43 cycles/14.33 ns | 53 cycles/24.46 ns | 49 cycles/16.33 ns |
| 256 Bytes Stride | 103 cycles/57.40 ns | 270 cycles/90.00 ns | 202 cycles/93.22 ns | 376 cycles/125.33 ns |
| 512 Bytes Stride | 106 cycles/59.07 ns | 284 cycles/94.66 ns | 205 cycles/94.61 ns | 395 cycles/131.66 ns |
这四个服务器所使用的内存并不完全一样,AMD Opteron 265配置两条1GB DDR400内存模组,Pentium D 830配置了两条256MB DDRII 533MHz内存模组,Pentium M T2600配置了两条256MB DDR2 533MHz内存模组,Dual Xeon 3.0配置了4条512MB DDRII 400MHz内存模组。不同的内存类型、时序、容量对于内存带宽和延迟都会有明显的影响。
AMD Opteron 265平台的内存带宽最高,主要得益于大容量DDR内存的低延迟,Pentium M T2600平台的内存带宽最低,不过它的内存延迟并不是造成这种结果的主要原因,从内存配置上看它同Pentium D 830非常的近似,但是结果有如此大的差异出乎预料。
4个平台的L1延迟均为3-4个周期,但是由于处理器的时钟总线频率不同,因此实际的延迟时间差距明显,Dual Xeon平台最短为1ns,Pentium D和Pentium M均为1.33ns,AMD Opteron 265最长为1.67ns。
L2延迟测试显示Pentium D 830平台和Dual Xeon平台的测试结果非常的近似,而Pentium M T2600平台和AMD Opteron 265平台的测试结果近似——它们所采用的架构显然具有更高的效能。