处理器性能测试和内存性能测试
SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。
SPEC CPU2000是SPEC组织推出的一套CPU子系统评估软件,它包括CINT2000和CFP2000两个子项目,前者用于测量和对比整数性能,而后者则用于测量和对比浮点性能。计算系统中的处理器、内存和编译器都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2000的影响非常的小。
我们在被测服务器中安装了Intel C++ 8.1 Compiler、Intel Fortran 8.1 Compiler这两款SPEC CPU2000必需的编译器,另外安装了Microsoft Visual Studio 2003.net提供必要的库文件。按照SPEC的要求我们根据自己的情况编辑了新的Config文件,可以满足Base测试,下面的测试成绩是在PowerEdge 830平台上开启2个用户线程,而在Xeon平台上开启4用户线程得到的。
| PowerEdge 830 | 2Xeon | |
|---|---|---|
| 开启线程数量 | 2 | 4 |
| 168.wupwise | 2328 | 2473 |
| 171.swim | 2271 | 2314 |
| 172.mgrid | 1269 | 1336 |
| 173.applu | 1388 | 1426 |
| 177.mesa | 1248 | 1333 |
| 178.galgel | 2362 | 2464 |
| 179.art | 2843 | 2975 |
| 183.equake | 2027 | 2066 |
| 187.facerec | 1669 | 1745 |
| 188.ammp | 901 | 925 |
| 189.lucas | 1894 | 1789 |
| 191.fma3d | 1308 | 1383 |
| 200.sixtrack | 559 | 595 |
| 301.apsi | 1096 | 1035 |
| SPECfp_base2000 | 1523 | 1568 |
| Benchmark | PowerEdge 830 | 2Xeon |
|---|---|---|
| 开启线程数量 | 2 | 4 |
| 164.gzip | 927 | 1003 |
| 175.vpr | 848 | 902 |
| 176.gcc | 1582 | 1643 |
| 181.mcf | 1285 | 1297 |
| 186.crafty | 1028 | 1118 |
| 197.parser | 1115 | 1184 |
| 252.eon | 1737 | 1862 |
| 253.perlbmk | 1526 | 1626 |
| 254.gap | 1544 | 1645 |
| 255.vortex | 2246 | 2372 |
| 256.bzip2 | 931 | 957 |
| 300.twolf | 1063 | 1119 |
| SPECint_base2000 | 1264 |
1336 |
SPEC CPU2000 v1.2的测试结果显示,采用双核处理器Pentium D 830处理器的Dell PowerEdge 830服务器的浮点性能同采用两颗Xeon 3.0GHz处理器的服务器的浮点性能差异在3%以内,可以说相差无几。两者之间的整数性能差异在6%左右,比浮点性能差异多一些。需要说明的是我们进行的是SPECCPU_base测试,从我们已经测试过的几十个系统来看,主频相近的处理器之间的得分差异不会很大。
| PowerEdge 830 | 2Xeon | |
| 内存带宽 | 4378 MB/s | 4330 MB/s |
| L1 Cache Latency | ||
| 32 Bytes Stride | 4 cycles/1.33ns | 3 cycles/1.00ns |
| L2 Cache Latency | ||
| 4 Bytes Stride | 6 cycles/2.00 ns | 6 cycles/2.00 ns |
| 16 Bytes Stride | 13 cycles/4.33 ns | 12 cycles/4.00 ns |
| 64 Bytes Stride | 29 cycles/9.67 ns | 27 cycles/9.00 ns |
| 256 Bytes Stride | 28 cycles/9.33 ns | 25 cycles/8.33 ns |
| 512 Bytes Stride | 26 cycles/8.67 ns | 24 cycles/8.00 ns |
| Memory Latency | ||
| 4 Bytes Stride | 7 cycles/ 2.33 ns | 6 cycles/2.00 ns |
| 16 Bytes Stride | 15 cycles/5.00 ns | 14 cycles/4.67 ns |
| 64 Bytes Stride | 43 cycles/14.33 ns | 41 cycles/13.673 ns |
| 256 Bytes Stride | 270 cycles/90.00 ns | 278 cycles/92.66 ns |
| 512 Bytes Stride | 284 cycles/94.66 ns | 298 cycles/99.33 ns |
| Algorithm Bandwidth | ||
| Compiler | 2392.56 MB/s | 2242.61 MB/s |
| REP MOVSD | 2424.43 MB/s | 2274.28 MB/s |
| ALU Reg Copy | 2461.68 MB/s | 2583.43 MB/s |
| MMX Reg Copy | 2453.70 MB/s | 2556.59 MB/s |
| MMX Reg 3dNow | - | - |
| MMX Reg SSE | 3722.17 MB/s | 3892.34 MB/s |
| SSE PAlign | 3713.27 MB/s | 3897.02 MB/s |
| SSE PAlign SSE | 3739.77 MB/s | 3911.29 MB/s |
| SSE2 PAlign | 3711.68 MB/s | 3890.28 MB/s |
| SSE2 PAlign SSE | 3734.78 MB/s | 3908.80 MB/s |
| MMX Block 4kb | 3948.64 MB/s | 4034.14 MB/s |
| MMX Block 16kb | 4377.91 MB/s | 4330.14 MB/s |
| SSE Block 4kb | 3941.44 MB/s | 4023.71 MB/s |
| SSE Block 16kb | 4361.10 MB/s | 4328.25 MB/s |
ScienceMark v2.0是一款用于测试系统特别是处理器在科学计算应用中的性能的软件,MemBenchmark是其中针对处理器缓存、系统内存而设计的功能模块,它可以测试系统内存带宽、L1 Cache延迟、L2 Cache延迟和系统内存延迟,另外还可以测试不同指令集的性能差异。从测试结果来看,无论是L1缓存延迟、L2缓存延迟还是内存延迟,都是采用了DDR2内存的PowerEdge 830平台略为长一些。