ScienceMark v2.0是一款用于测试系统特别是处理器在科学计算应用中的性能的软件,MemBenchmark是其中针对处理器缓存、系统内存而设计的功能模块,它可以测试系统内存带宽、L1 Cache延迟、L2 Cache延迟和系统内存延迟,另外还可以测试不同指令集的性能差异。
ScienceMark Membench | ||
---|---|---|
厂商 | 惠普 | Intel |
产品型号 | 惠普ProLiant DL4x170h G6 单路Intel Gainestown Xeon E5504 2.0GHz | 单路Intel Gainestown Xeon E5504 |
内存技术参数 | 2GB R-ECC DDR3-800 SDRAM x8 三通道 | 2GB R-ECC DDR3-800 SDRAM x4 双通道 |
L1带宽(MB/s) | 59785.03 | 47877.41 |
L2带宽(MB/s) | 24392.68 | 19561.78 |
内存带宽(MB/s) | 9753.54 | 8833.57 |
L1 Cache Latency(ns) | ||
32 Bytes Stride | 3 cycles 1.50 ns | 3 cycles 1.50 ns |
L1 Algorithm Bandwidth(MB/s) | ||
Compiler | 52980.69 | 42198.88 |
REP MOVSD | 54366.01 | 43498.52 |
ALU Reg Copy | 15060.05 | 12067.10 |
MMX Reg Copy | 30215.90 | 24173.05 |
SSE PAlign | 59785.03 | 47830.32 |
SSE2 PAlign | 58639.54 | 47877.41 |
L2 Cache Latency(ns) | ||
4 Bytes Stride | 4 cycles 2.00 ns | 4 cycles 2 ns |
16 Bytes Stride | 4 cycles 2.00 ns | 4 cycles 2 ns |
64 Bytes Stride | 10 cycles 5.00 ns | 10 cycles 5 ns |
256 Bytes Stride | 9 cycles 4.50 ns | 9 cycles 4.50 ns |
512 Bytes Stride | 8 cycles 4.00 ns | 8 cycles 4 ns |
L2 Algorithm Bandwidth(MB/s) | ||
Compiler | 22624.80 | 17957.58 |
REP MOVSD | 24392.68 | 19596.05 |
ALU Reg Copy | 10970.33 | 8778.56 |
MMX Reg Copy | 17562.86 | 14063.17 |
SSE PAlign | 23344.86 | 18656.42 |
SSE2 PAlign | 23361.11 | 18677.19 |
Memory Latency(ns) | ||
4 Bytes Stride | 4 cycles 2.00 ns | 4 cycles 2 ns |
16 Bytes Stride | 5 cycles 2.50 ns | 5 cycles 2.50 ns |
64 Bytes Stride | 17 cycles 8.50 ns | 17 cycles 8.50 ns |
256 Bytes Stride | 94 cycles 47.00 ns | 92 cycles 46.00 ns |
512 Bytes Stride | 110 cycles 55.00 ns | 104 cycles 52.00 ns |
Memory Algorithm Bandwidth(MB/s) | ||
Compiler | 9293.20 | 7918.04 |
REP MOVSD | 9753.54 | 8833.57 |
ALU Reg Copy | 6376.50 | 5631.16 |
MMX Reg Copy | 6985.65 | 5880.52 |
MMX Reg 3dNow | - | - |
MMX Reg SSE | 8560.05 | 8398.25 |
SSE PAlign | 9150.80 | 8750.74 |
SSE PAlign SSE | 8996.74 | 8715.17 |
SSE2 PAlign | 9160.76 | 8749.69 |
SSE2 PAlign SSE | 9001.75 | 8724.84 |
MMX Block 4kb | 7748.20 | 7648.23 |
MMX Block 16kb | 8636.91 | 8515.20 |
SSE Block 4kb | 7838.92 | 7731.28 |
SSE Block 16kb | 8753.36 | 8620.84 |
得益于三通道,这个项目中惠普DL4x170h G6服务器的内存带宽高出了对比服务器近1000MB/s,由此看到两者的差异非常明显。在内存指令(集)中,除了部分项目结果较为接近之外,差距还是非常大的。同样,这个项目的测试结果与内存容量并没有直接的关系。