SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。
SPEC CPU2000是SPEC组织推出的一套CPU子系统评估软件,它包括CINT2000和CFP2000两个子项目,前者用于测量和对比整数性能,而后者则用于测量和对比浮点性能。计算系统中的处理器、内存和编译器都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2000的影响非常的小。
我们在被测服务器中安装了Intel C++ 8.1 Compiler、Intel Fortran 8.1 Compiler这两款SPEC CPU2000必需的编译器,另外安装了Microsoft Visual Studio 2003.net提供必要的库文件。按照SPEC的要求我们根据自己的情况编辑了新的Config文件,可以满足Base测试,下面的测试成绩是在开启双Xeon处理器超线程条件下,4用户,SPECint_rate_base2000和SPECfp_rate_base2000。
| SPECfp rate_base2000 |
SPECint rate_base2000 | ||
|---|---|---|---|
| 开启线程数量 | 2 | 开启线程数量 | 2 |
| 168.wupwise | 26.6 | 164.gzip | 14.5 |
| 171.swim | 23.1 | 175.vpr | 12.1 |
| 172.mgrid | 15.5 | 176.gcc | 22.0 |
| 173.applu | 13.9 | 181.mcf | 17.8 |
| 177.mesa | 14.5 | 186.crafty | 12.7 |
| 178.galgel | 30.7 | 197.parser | 16.9 |
| 179.art | 30.3 | 252.eon | 20.5 |
| 183.equake | 23.8 | 253.perlbmk | 17.0 |
| 187.facerec | 21.0 | 254.gap | 19.9 |
| 188.ammp | 12.4 | 255.vortex | 27.7 |
| 189.lucas | 18.1 | 256.bzip2 | 14.9 |
| 191.fma3d | 14.7 | 300.twolf | 15.5 |
| 200.sixtrack | 8.11 | 总分 | 17.0 |
| 301.apsi | 14.3 | ||
|
总分 |
17.9 | ||
SPECfp_rate2000测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、DCC以及科学计算等方面应用可以参考这个结果。SPECint_rate 2000测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。宝德PR1700G2服务器的整数得分和浮点得分分别为17.9和17.0,比之前测试过的配置了Xeon 3.0GHz处理器的产品的得分略低,但在正常范围之内。
| ScienceMark Membench | |
| 内存带宽 | 4001.25 MB/s |
| L1 Cache Latency | |
| 32 Bytes Stride | 3 cycles/1.07ns |
| L2 Cache Latency | |
| 4 Bytes Stride | 6 cycles/2.15 ns |
| 16 Bytes Stride | 13 cycles/4.65 ns |
| 64 Bytes Stride | 27 cycles/9.67 ns |
| 256 Bytes Stride | 26 cycles/9.31 ns |
| 512 Bytes Stride | 24 cycles/8.59 ns |
| Memory Latency | |
| 4 Bytes Stride | 6 cycles/ 2.15 ns |
| 16 Bytes Stride | 14 cycles/5.01 ns |
| 64 Bytes Stride | 46 cycles/16.47 ns |
| 256 Bytes Stride | 353 cycles/126.38 ns |
| 512 Bytes Stride | 369 cycles/132.11 ns |
| Algorithm Bandwidth | |
| Compiler | 2014.13 MB/s |
| REP MOVSD | 2082.58 MB/s |
| ALU Reg Copy | 1792.41 MB/s |
| MMX Reg Copy | 1921.68 MB/s |
| MMX Reg 3dNow | - |
| MMX Reg SSE | 3155.6 MB/s |
| SSE PAlign | 3421.91 MB/s |
| SSE PAlign SSE | 3335.88 MB/s |
| SSE2 PAlign | 3422.41 MB/s |
| SSE2 PAlign SSE | 3336.91 MB/s |
| MMX Block 4kb | 3545.41 MB/s |
| MMX Block 16kb | 4001.25 MB/s |
| SSE Block 4kb | 3487.58 MB/s |
| SSE Block 16kb | 3996.17 MB/s |
ScienceMark v2.0是一款用于测试系统特别是处理器在科学计算应用中的性能的软件,MemBenchmark是其中针对处理器缓存、系统内存而设计的功能模块,它可以测试系统内存带宽、L1 Cache延迟、L2 Cache延迟和系统内存延迟,另外还可以测试不同指令集的性能差异。
![]() |
在测试中我们发现在BIOS默认状态下,这台服务器的内存带宽比正常的状态低10%以上。经过宝德工程师查找原因发现,BIOS默认Hardware Prefetcher和Adjacent Cache Line Prefetch这两个选项均为Disable状态,启用它们之后,被测服务器的表现终于恢复正常(我们进行了验证,发现主要是Adjacent Cache Line Prefetch选项的影响,我们查看了其它服务器大部分并没有提供这个调节选项。宝德建议用户根据实际应用来决定是否打开这个功能)。从我们的测试结果来看,内存带宽测试结果在被测服务器中处于中上游水平。
