CPU和内存性能
SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。
SPEC CPU2000是SPEC组织推出的一套CPU子系统评估软件,它包括CINT2000和CFP2000两个子项目,前者用于测量和对比整数性能,而后者则用于测量和对比浮点性能。计算系统中的处理器、内存和编译器都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2000的影响非常的小。
我们在被测服务器中安装了Intel C++ 8.1 Compiler、Intel Fortran 8.1 Compiler这两款SPEC CPU2000必需的编译器,另外安装了Microsoft Visual Studio 2003.net提供必要的库文件。按照SPEC的要求我们根据自己的情况编辑了新的Config文件,可以满足Base测试,下面的测试成绩是在开启双Xeon处理器超线程条件下,4用户,SPECint_rate_base2000和SPECfp_rate_base2000。
SPECfp rate_base2000 |
SPECint rate_base2000 | ||||
---|---|---|---|---|---|
X346 | X336 | X346 | X336 | ||
开启线程数量 | 2 | 2 | 开启线程数量 | 2 | 2 |
168.wupwise | 27.8 | 28.6 | 164.gzip | 15.4 | 15.5 |
171.swim | 25.0 | 26.1 | 175.vpr | 12.8 | 12.8 |
172.mgrid | 16.4 | 17.0 | 176.gcc | 23.2 | 23.4 |
173.applu | 15.5 | 14.6 | 181.mcf | 18.4 | 18.4 |
177.mesa | 15.5 | 15.8 | 186.crafty | 13.5 | 13.6 |
178.galgel | 32.0 | 33.1 | 197.parser | 18.0 | 18.0 |
179.art | 32.6 | 33.7 | 252.eon | 21.9 | 22.0 |
183.equake | 24.8 | 25.9 | 253.perlbmk | 18.4 | 18.3 |
187.facerec | 21.9 | 22.9 | 254.gap | 21.2 | 21.2 |
188.ammp | 13.0 | 13.2 | 255.vortex | 29.6 | 29.5 |
189.lucas | 19.0 | 19.7 | 256.bzip2 | 16.1 | 15.8 |
191.fma3d | 15.7 | 15.7 | 300.twolf | 16.6 | 16.4 |
200.sixtrack | 8.35 | 8.64 | 总分 | 18.3 | 18.2 |
301.apsi | 15.4 | 15.3 | |||
总分 |
18.9 | 19.4 |
由于的价格的限制,IBM X346 8840I05只能配置单颗Intel Xeon 3.0GHz处理器,因此在SPECCPU2000的测试中同我们之前测试的双处理器配置的服务器相比性能落后很多,比如整数性能只是双处理器服务器的76%,浮点性能则是双处理器配置的服务器的55%。
IBM X336 883715C同X346 8840I05的配置基本上完全一样,都是基于Intel E7520芯片组,单颗Xeon 3.0Ghz处理器,2GB内存。从测试结果结果上看,X336的浮点性能领先不足3%,两者的整数性能基本上一样。
IBM X346 8840 | X336 8837 | |
内存带宽 | 4021.47 MB/s | 3979.47 MB/s |
L1 Cache Latency | ||
32 Bytes Stride | 3 cycles/1.00ns | 3 cycles/1.00ns |
L2 Cache Latency | ||
4 Bytes Stride | 6 cycles/2.00 ns | 6 cycles/2.00 ns |
16 Bytes Stride | 13 cycles/4.33 ns | 13 cycles/4.33 ns |
64 Bytes Stride | 27 cycles/9.00 ns | 27 cycles/9.00 ns |
256 Bytes Stride | 26 cycles/8.67 ns | 26 cycles/8.67 ns |
512 Bytes Stride | 25 cycles/8.33 ns | 25 cycles/8.33 ns |
Memory Latency | ||
4 Bytes Stride | 6 cycles/ 2.00 ns | 6 cycles/ 2.00 ns |
16 Bytes Stride | 15 cycles/5.00 ns | 16 cycles/5.33 ns |
64 Bytes Stride | 52 cycles/17.33 ns | 50 cycles/16.67 ns |
256 Bytes Stride | 376 cycles/125.33 ns | 380 cycles/126.67 ns |
512 Bytes Stride | 397 cycles/132.33 ns | 398 cycles/132.67 ns |
Algorithm Bandwidth | ||
Compiler | 2022.43 MB/s | 1989.97 MB/s |
REP MOVSD | 2063.5 MB/s | 2032.75 MB/s |
ALU Reg Copy | 1811.26 MB/s | 1773.83 MB/s |
MMX Reg Copy | 1940.28 MB/s | 1902.33 MB/s |
MMX Reg 3dNow | - | - |
MMX Reg SSE | 3162.91 MB/s | 3161.17 MB/s |
SSE PAlign | 3427.01 MB/s | 3376.89 MB/s |
SSE PAlign SSE | 3329.21 MB/s | 3263.51 MB/s |
SSE2 PAlign | 3422.46 MB/s | 3395.59 MB/s |
SSE2 PAlign SSE | 3346.46 MB/s | 3257.17 MB/s |
MMX Block 4kb | 3565.25 MB/s | 3543.39 MB/s |
MMX Block 16kb | 4021.47 MB/s | 3983.53 MB/s |
SSE Block 4kb | 3510.77 MB/s | 3482.24 MB/s |
SSE Block 16kb | 4014.06 MB/s | 3975.89 MB/s |
ScienceMark v2.0是一款用于测试系统特别是处理器在科学计算应用中的性能的软件,MemBenchmark是其中针对处理器缓存、系统内存而设计的功能模块,它可以测试系统内存带宽、L1 Cache延迟、L2 Cache延迟和系统内存延迟,另外还可以测试不同指令集的性能差异。
从上面的测试表格可以知道,X336系统的内存带宽略为比X346系统低,对比不同尺寸Stride测试可以发现X336的内存延迟略为的长一点。就我们已经测试完毕的几款基于E7520芯片组的服务器而言,它们的差别(包括L1延迟、L2延迟和内存延迟)非常的小。