CPU和内存性能测试
在以往的服务器评测中,我们一般是采用SPEC CPU2000对于处理器的浮点性能和整数性能进行评估。不过,由于我们缺乏支持AMD平台运行SPEC cpu2000的必要的编译器,因此这个部分我们不得不放弃这个软件,采用了更加易用的Sisoft Sandra 2005 Pro。
| 220X | 220A | |
| CPU Arithmetic Benchmark | ||
| Dhrystone ALU | 17668 MIPS | 16765 MIPS |
| Whetstone FPU | 7385 MFLOPS | 6231 MFLOPS |
| Whetstone iSSE2 | 12394 MFLOPS | 8245 MFLOPS |
| CPU Multi-media Benchmark | ||
| Integer x8 iSSE2 | 43292 it/s | 37868 it/s |
| Floating-Point x4 | 57118 it/s | 40686 it/s |
在算术运算基准测试和多媒体基准测试中,基于双Xeon的平台的性能都高于基于双Opteron的平台。因为Sisoft Sandra 2005是一款对于多线程提供了良好支持的测试软件,因此在处理器测试中支持超线程技术的双Xeon平台领先是非常正常的。
| 220X | 220A | |
| 内存带宽 | 4031.20 MB/s | 1928 MB/s |
| L1 Cache Latency | ||
| 32 Bytes Stride | 3 cycles/1.00ns | 3 cycles/1.00ns |
| L2 Cache Latency | ||
| 4 Bytes Stride | 6 cycles/2.00 ns | 3 cycles/1.00 ns |
| 16 Bytes Stride | 11 cycles/3.67 ns | 5 cycles/1.67 ns |
| 64 Bytes Stride | 27 cycles/9.00 ns | 17 cycles/5.67 ns |
| 256 Bytes Stride | 26 cycles/8.67 ns | 12 cycles/4.00 ns |
| 512 Bytes Stride | 25 cycles/8.33 ns | 13 cycles/4.33 ns |
| Memory Latency | ||
| 4 Bytes Stride | 6 cycles/ 2.00 ns | 5 cycles/ 1.67 ns |
| 16 Bytes Stride | 15 cycles/5.00 ns | 19 cycles/6.33 ns |
| 64 Bytes Stride | 49 cycles/16.33 ns | 73 cycles/24.33 ns |
| 256 Bytes Stride | 379 cycles/126.33 ns | 147 cycles/49.00 ns |
| 512 Bytes Stride | 398 cycles/132.67 ns | 158 cycles/52.67 ns |
| Algorithm Bandwidth | ||
| Compiler | 2023.26 MB/s | 13973.56 MB/s |
| REP MOVSD | 2066.17 MB/s | 14561.53 MB/s |
| ALU Reg Copy | 1807.30 MB/s | 8247.49 MB/s |
| MMX Reg Copy | 1934.88 MB/s | 20032.86 MB/s |
| MMX Reg 3dNow | - | - |
| MMX Reg SSE | 3166.06 MB/s | - |
| SSE PAlign | 3438.64 MB/s | 15964.52 MB/s |
| SSE PAlign SSE | 3360.15 MB/s | - |
| SSE2 PAlign | 3427.43 MB/s | 14139.8 MB/s |
| SSE2 PAlign SSE | 3357.33 MB/s | - |
| MMX Block 4kb | 3574.19 MB/s | - |
| MMX Block 16kb | 4031.20 MB/s | - |
| SSE Block 4kb | 3522.50 MB/s | - |
| SSE Block 16kb | 4020.42 MB/s | - |
ScienceMark v2.0是一款用于测试系统特别是处理器在科学计算应用中的性能的软件,MemBenchmark是其中针对处理器缓存、系统内存而设计的功能模块,它可以测试系统内存带宽、L1 Cache延迟、L2 Cache延迟和系统内存延迟,另外还可以测试不同指令集的性能差异。
超毅2806VS服务器采用了E7520芯片组,其内存控制器支持双通道DDRII内存,测试配置中使用了DDRII 400(3-3-3-8)内存,而超毅2806T服务器的内存控制器整合在处理器中,测试结果显示L2缓存延迟和内存延迟,都是AMD平台占据明显优势。AMD可以运行的Algorithm Bandwidth测试项目不多,但是有测试结果的性能都是大幅度领先的。
可见不同的测试软件对于不同的平台提供了不同程度的优化,因此我们只有从后面的实际应用测试才能看出到底那个平台的整体性能更加优秀一些。