处理器和内存性能测试
SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。
SPEC CPU2000是SPEC组织推出的一套CPU子系统评估软件,它包括CINT2000和CFP2000两个子项目,前者用于测量和对比整数性能,而后者则用于测量和对比浮点性能。计算系统中的处理器、内存和编译器都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2000的影响非常的小。
我们在被测服务器中安装了Intel C++ 8.1 Compiler、Intel Fortran 8.1 Compiler这两款SPEC CPU2000必需的编译器,另外安装了Microsoft Visual Studio 2003.net提供必要的库文件。按照SPEC的要求我们根据自己的情况编辑了新的Config文件,可以满足Base测试,下面的测试成绩是在开启双Xeon处理器超线程条件下,4用户,SPECint_rate_base2000和SPECfp_rate_base2000。
| I610r平台 | |||
|---|---|---|---|
| SPECfp rate_base2000 |
SPECint rate_base2000 | ||
| 开启线程数量 | 4 | 开启线程数量 | 4 |
| 168.wupwise | 52.3 | 164.gzip | 30.7 |
| 171.swim | 26.1 | 175.vpr | 25.1 |
| 172.mgrid | 22.8 | 176.gcc | 46.2 |
| 173.applu | 23.8 | 181.mcf | 24.8 |
| 177.mesa | 31.6 | 186.crafty | 26.5 |
| 178.galgel | 49.3 | 197.parser | 35.7 |
| 179.art | 37.5 | 252.eon | 44.2 |
| 183.equake | 26.5 | 253.perlbmk | 36.6 |
| 187.facerec | 37.5 | 254.gap | 39.7 |
| 188.ammp | 24.5 | 255.vortex | 58.4 |
| 189.lucas | 25.4 | 256.bzip2 | 31.2 |
| 191.fma3d | 27.3 | 300.twolf | 32.3 |
| 200.sixtrack | 17.3 | 总分 | 34.8 |
| 301.apsi | 30.3 | ||
|
总分 |
29.0 | ||
| R210A平台 | |||
|---|---|---|---|
| SPECfp rate_base2000 |
SPECint rate_base2000 | ||
| 开启线程数量 | 4 | 开启线程数量 | 4 |
| 168.wupwise | - | 164.gzip | 45.9 |
| 171.swim | - | 175.vpr | 44.1 |
| 172.mgrid | - | 176.gcc | 59.9 |
| 173.applu | - | 181.mcf | 33.0 |
| 177.mesa | - | 186.crafty | 53.1 |
| 178.galgel | - | 197.parser | 49.9 |
| 179.art | - | 252.eon | 72.3 |
| 183.equake | - | 253.perlbmk | 63.8 |
| 187.facerec | - | 254.gap | 57.6 |
| 188.ammp | - | 255.vortex | 93.5 |
| 189.lucas | - | 256.bzip2 | 41.7 |
| 191.fma3d | - | 300.twolf | 52.6 |
| 200.sixtrack | - | 总分 | 53.7 |
| 301.apsi | - | ||
|
总分 |
|||
SPECfp_rate2000测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、DCC以及科学计算等方面应用可以参考这个结果。SPECint_rate 2000测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。
同以往其它被测服务器的成绩相比,我们发现在处理器数量、主频等情况均相同的情况下,内存容量对于测试结果的影响非常的明显。配置了4GB内存的I610r-1平台SPECint_rate_base2000和SPECfp_rate_base2000得分分别为29.0和34.8。
由于我们尚缺乏必备的编译器,因此无法在AMD平台上正常的运行SPECft测试程序,这里我们仅仅进行了SPECint部分的测试。配置了两颗Opteron 265双核处理器和4GB内存的R210A服务器的整数性能非常的高,达到了53.7分,比双Xeon(开启超线程)的服务器高出了54%。
|
Sisoft Sandra 2005 Pro | ||
| I610r | R210A | |
| CPU Arithmetic Benchmark | ||
| Dhrystone ALU(MIPS) | 17671 | 30368 |
| Whetstone FPU(MFLOPS) | 7388 | 11347 |
| Whetstone iSSE2(MFLOPS) | 12430 | 14847 |
| CPU Multi-media Benchmark | ||
| Integer x8 iSSE2(it/s) | 43298 | 68055 |
| Floating-Point x4(it/s) | 57215 | 73707 |
我们利用了普通读者非常熟悉的Sisoft Sandra 2005 Pro测试了AMD和Intel两个平台的处理器性能,可以看到双Opteron 265平台的优势极为明显,ALU、FPU性能分别比双Xeon处理器高出70%和53%,不过Whetstone iSSE2性能的领先优势并没有那么高,只领先大约20%,CPU Multi-media Benchmark测试显示,双Opteron 265的领先优势也是在28-57%之间,可见Intel Xeon处理器凭借高主频和对于多媒体指令集良好的支持,在多媒体应用方面还是有相当优势的。
| ScienceMark Membench | ||
| 参测平台 | I610r | R210A |
| 内存带宽(MB/s) | 4091.74 | 4225.35 |
| L1 Cache Latency(cycles/ns) | ||
| 32 Bytes Stride | 3/1.00 | 3/1.67 |
| L2 Cache Latency(cycles/ns) | ||
| 4 Bytes Stride | 6/2.00 | 3/1.67 |
| 16 Bytes Stride | 14/4.67 | 5/2.79 |
| 64 Bytes Stride | 27/9.00 | 17/9.47 |
| 256 Bytes Stride | 26/8.67 | 12/6.69 |
| 512 Bytes Stride | 25/8.33 | 13/7.24 |
| Memory Latency(cycles/ns) | ||
| 4 Bytes Stride | 6/2.00 | 3/1.67 |
| 16 Bytes Stride | 15/5.00 | 13/7.24 |
| 64 Bytes Stride | 49/16.33 | 53/29.54 |
| 256 Bytes Stride | 377/125.66 | 131/53.00 |
| 512 Bytes Stride | 394/131.33 | 133/74.13 |
| Algorithm Bandwidth(MB/s) | ||
| Compiler |
2113.73 |
2033.02 |
| REP MOVSD | 2140.7 | 2060.88 |
| ALU Reg Copy | 1885.35 | 2051.71 |
| MMX Reg Copy | 2031.39 | 2137.96 |
| MMX Reg 3dNow |
- |
3836.07 |
| MMX Reg SSE |
3396.47 |
4222.72 |
| SSE PAlign | 3537.47 | 3350.08 |
| SSE PAlign SSE | 3525.52 | 4225.35 |
| SSE2 PAlign | 3539.02 | 3349.9 |
| SSE2 PAlign SSE | 3527.03 | 4222.67 |
| MMX Block 4kb | 3770.11 | 3898.09 |
| MMX Block 16kb | 4091.74 | 4167.31 |
| SSE Block 4kb | 3800.00 | 3769.51 |
| SSE Block 16kb | 4078.21 | 4008.02 |
ScienceMark v2.0是一款用于测试系统特别是处理器在科学计算应用中的性能的软件,MemBenchmark是其中针对处理器缓存、系统内存而设计的功能模块,它可以测试系统内存带宽、L1 Cache延迟、L2 Cache延迟和系统内存延迟,另外还可以测试不同指令集的性能差异。
内存带宽测试显示两个平台的内存带宽相当,都在4000MB/s以上。不过在这同时我们也使用Sisoft Sandra 2005的Memeory Bandwith对于两个平台分别进行了测试,测试结果显示双Opteron平台的内存带宽可达8700MB/s以上,是双Xeon平台的一倍。我们认为这个测试结果更能够体现两个平台设计上的不同。
|
Sisoft Sandra 2005 Memeory Bandwidth | ||
| 参测平台 | I610r | R210A |
| RAM Int Buff(MB/s) | 3946 | 8740 |
| RAM Float Buff(MB/s) | 3939 | 8721 |