处理器性能测试
SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。
SPEC CPU2000是SPEC组织推出的一套CPU子系统评估软件,它包括CINT2000和CFP2000两个子项目,前者用于测量和对比整数性能,而后者则用于测量和对比浮点性能。计算系统中的处理器、内存和编译器都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2000的影响非常的小。
我们在被测服务器中安装了Intel C++ 8.1 Compiler、Intel Fortran 8.1 Compiler这两款SPEC CPU2000必需的编译器,另外安装了Microsoft Visual Studio 2003.net提供必要的库文件。按照SPEC的要求我们根据自己的情况编辑了新的Config文件,可以满足Base测试。
| 双Paxville DP平台 (Throughput) | |||
|---|---|---|---|
|
SPECfp |
SPECint | ||
|
开启线程数量 |
8 |
开启线程数量 |
8 |
|
168.wupwise |
57.6 |
164.gzip |
56.6 |
|
171.swim |
22.6 |
175.vpr |
38.2 |
|
172.mgrid |
21.0 |
176.gcc |
80.1 |
|
173.applu |
21.7 |
181.mcf |
23.1 |
|
177.mesa |
57.7 |
186.crafty |
50.0 |
|
178.galgel |
53.5 |
197.parser |
63.1 |
|
179.art |
34.4 |
252.eon |
81.9 |
|
183.equake |
24.6 |
253.perlbmk |
67.6 |
|
187.facerec |
41.9 |
254.gap |
56.3 |
|
188.ammp |
33.6 |
255.vortex |
105.0 |
|
189.lucas |
22.4 |
256.bzip2 |
49.2 |
|
191.fma3d |
28.5 |
300.twolf |
50.7 |
|
200.sixtrack |
32.3 |
总分 |
56.4 |
|
301.apsi |
45.4 |
||
|
总分 |
33.3 | ||
| 单Paxville DP平台 (Throughput) | |||
|---|---|---|---|
|
SPECfp |
SPECint | ||
|
开启线程数量 |
4 |
开启线程数量 |
4 |
|
168.wupwise |
44.5 |
164.gzip |
28.9 |
|
171.swim |
21.7 |
175.vpr |
23.2 |
|
172.mgrid |
20.3 |
176.gcc |
44.3 |
|
173.applu |
20.6 |
181.mcf |
23.4 |
|
177.mesa |
28.7 |
186.crafty |
25.3 |
|
178.galgel |
43.3 |
197.parser |
33.0 |
|
179.art |
33.9 |
252.eon |
40.9 |
|
183.equake |
23.0 |
253.perlbmk |
35.4 |
|
187.facerec |
34.5 |
254.gap |
37.4 |
|
188.ammp |
21.7 |
255.vortex |
54.6 |
|
189.lucas |
21.6 |
256.bzip2 |
28.8 |
|
191.fma3d |
22.5 |
300.twolf |
29.6 |
|
200.sixtrack |
16.3 |
总分 |
32.6 |
|
301.apsi |
26.2 |
||
|
总分 |
25.9 | ||
| 双路Xeon 3.0GHz平台(Throughput) | |||
|---|---|---|---|
|
SPECfp |
SPECint | ||
|
开启线程数量 |
4 |
开启线程数量 |
4 |
|
168.wupwise |
47.0 |
164.gzip |
30.8 |
|
171.swim |
22.4 |
175.vpr |
21.3 |
|
172.mgrid |
18.5 |
176.gcc |
41.2 |
|
173.applu |
21.9 |
181.mcf |
19.4 |
|
177.mesa |
31.2 |
186.crafty |
27.2 |
|
178.galgel |
41.2 |
197.parser |
33.4 |
|
179.art |
29.8 |
252.eon |
44.3 |
|
183.equake |
23.1 |
253.perlbmk |
36.4 |
|
187.facerec |
35.2 |
254.gap |
38.2 |
|
188.ammp |
19.1 |
255.vortex |
56.4 |
|
189.lucas |
21.9 |
256.bzip2 |
26.9 |
|
191.fma3d |
24.0 |
300.twolf |
25.2 |
|
200.sixtrack |
17.3 |
总分 |
31.9 |
|
301.apsi |
25.7 | ||
| 总分 | 25.8 | ||
SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、DCC以及科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。
从测试int_rate_base结果来看,双核处理器的整数性能有了大幅度的提升,提升幅度达到了76%,这意味着配置双核Xeon处理器的服务器比之前的单核产品具有更强的同时执行多个计算密集型整数操作的能力,数据库应用、邮件服务器、Web服务器等应用的性能均会有明显的提升。密集型浮点运算能力的提升幅度也较大,优势达到了29%。
我们还在华硕PVL-D/SCSI主板上测试了仅仅安装一颗双核Xeon 2.8GHz处理器时的性能,发现此时系统相的性能依然略高于原来双Xeon配置的性能。另外,考虑到双核Xeon 2.8GHz平台的主频是2.8GHz,这说明其效率较双路Xeon有所提升。
| 双Paxville DP平台 (Speed) | |||
|---|---|---|---|
|
SPECfp_base2000 |
SPECint_base2000 | ||
|
开启线程数量 |
8 |
开启线程数量 |
8 |
|
168.wupwise |
1499 |
164.gzip |
738 |
|
171.swim |
2064 |
175.vpr |
777 |
|
172.mgrid |
810 |
176.gcc |
1184 |
|
173.applu |
976 |
181.mcf |
1419 |
|
177.mesa |
854 |
186.crafty |
749 |
|
178.galgel |
1980 |
197.parser |
892 |
|
179.art |
2627 |
252.eon |
1150 |
|
183.equake |
1556 |
253.perlbmk |
971 |
|
187.facerec |
1109 |
254.gap |
1053 |
|
188.ammp |
780 |
255.vortex |
1521 |
|
189.lucas |
1408 |
256.bzip2 |
804 |
|
191.fma3d |
926 |
300.twolf |
1065 |
|
200.sixtrack |
436 |
总分 |
999 |
|
301.apsi |
810 | ||
|
总分 |
1146 | ||
| 单Paxville DP平台 (Speed) | |||
|---|---|---|---|
|
SPECfp_base2000 |
SPECint_base2000 | ||
|
开启线程数量 |
4 |
开启线程数量 |
4 |
|
168.wupwise |
2222 |
164.gzip |
930 |
|
171.swim |
2153 |
175.vpr |
973 |
|
172.mgrid |
1242 |
176.gcc |
1592 |
|
173.applu |
1300 |
181.mcf |
1630 |
|
177.mesa |
1230 |
186.crafty |
1034 |
|
178.galgel |
2932 |
197.parser |
1159 |
|
179.art |
3699 |
252.eon |
1727 |
|
183.equake |
1965 |
253.perlbmk |
1499 |
|
187.facerec |
1603 |
254.gap |
1532 |
|
188.ammp |
1035 |
255.vortex |
2333 |
|
189.lucas |
1790 |
256.bzip2 |
1017 |
|
191.fma3d |
1246 |
300.twolf |
1357 |
|
200.sixtrack |
556 |
总分 |
1348 |
|
301.apsi |
1053 | ||
|
总分 |
1544 | ||
|
双Xeon平台(Speed) | |||
|---|---|---|---|
|
SPECfp_base2000 |
SPECint_base2000 | ||
|
开启线程数量 |
4 |
开启线程数量 |
4 |
|
168.wupwise |
2332 |
164.gzip |
999 |
|
171.swim |
2192 |
175.vpr |
906 |
|
172.mgrid |
1290 |
176.gcc |
1643 |
|
173.applu |
1372 |
181.mcf |
1301 |
|
177.mesa |
1321 |
186.crafty |
1110 |
|
178.galgel |
2401 |
197.parser |
1166 |
|
179.art |
2854 |
252.eon |
1856 |
|
183.equake |
1991 |
253.perlbmk |
1577 |
|
187.facerec |
1665 |
254.gap |
1641 |
|
188.ammp |
910 |
255.vortex |
2299 |
|
189.lucas |
1839 |
256.bzip2 |
969 |
|
191.fma3d |
1310 |
300.twolf |
1139 |
|
200.sixtrack |
593 |
总分 |
1329 |
|
301.apsi |
1012 | ||
| 总分 | 1522 | ||
在“Speed”测试中,我们发现了一个奇怪的现象,在双路双核配置下,无论是整数性能还是浮点性能都有明显的下降,仅是单路双核配置性能的74%。我们采用了多种方法进行了测试,比如采用4线程或者1线程,双路双核配置平台的性能也没有改变,关闭超线程技术对于测试结果也没有影响。通过后面的缓存方面的测试我们初步确认是L1/L2缓存的效率引起了这种问题。
单路双核平台的Speed测试结果同双路Xeon平台的测试结果非常的接近,这说明它们在执行某个任务的时候性能基本一样的。