引领双皓龙平台进入PCI-E时代
处理器性能测试
SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。
SPEC CPU2000是SPEC组织推出的一套CPU子系统评估软件,它包括CINT2000和CFP2000两个子项目,前者用于测量和对比整数性能,而后者则用于测量和对比浮点性能。计算系统中的处理器、内存和编译器都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2000的影响非常的小。
SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、DCC以及科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。
我们在被测服务器中安装了Intel C++ 8.1 Compiler、Intel Fortran 8.1 Compiler这两款SPEC CPU2000必需的编译器,另外安装了Microsoft Visual Studio 2003.net提供必要的库文件。按照SPEC的要求我们根据自己的情况编辑了新的Config文件,可以满足Base测试,下面的测试成绩是2或者4用户条件下,分别运行SPEC base和SPEC rate base测试的结果(其中SPEC base代表系统执行某个任务的速度,而SPEC base rate测试代表系统可以同时处理任务的能力)。
| SPECfp rate_base2000 |
SPECint rate_base2000 | ||||
|---|---|---|---|---|---|
| Xeon | Opteron | Xeon | Opteron | ||
| 开启线程数量 | 4 | 2 | 开启线程数量 | 4 | 2 |
| 168.wupwise | 47 | 32.1 | 164.gzip | 30.8 | 25.4 |
| 171.swim | 22.4 | 33.2 | 175.vpr | 21.3 | 24.3 |
| 172.mgrid | 18.5 | 23.3 | 176.gcc | 41.2 | 32.7 |
| 173.applu | 21.9 | 19.2 | 181.mcf | 19.4 | 20.3 |
| 177.mesa | 31.2 | 32.8 | 186.crafty | 27.2 | 29.8 |
| 178.galgel | 41.2 | 39.7 | 197.parser | 33.4 | 26.0 |
| 179.art | 29.8 | 33.0 | 252.eon | 44.3 | 41.5 |
| 183.equake | 23.1 | 27.6 | 253.perlbmk | 36.4 | 33.1 |
| 187.facerec | 35.2 | 30.5 | 254.gap | 38.2 | 30.2 |
| 188.ammp | 19.1 | 21.8 | 255.vortex | 56.4 | 44.2 |
| 189.lucas | 21.9 | 30.8 | 256.bzip2 | 26.9 | 21.5 |
| 191.fma3d | 24 | 26.5 | 300.twolf | 25.2 | 27.9 |
| 200.sixtrack | 17.3 | 12.8 | 总分 | 31.9 | 29.0 |
| 301.apsi | 25.7 | 24.8 | 注:蓝色粗体代表差别在10%以上 黑色粗体仅代表优势不足10% | ||
|
总分 |
25.8 | 26.8 | |||
我们将华硕TW510-E2服务器的测试结果同双Xeon 3.0GHz的测试结果进行了对比,可以发现Rate测试中,AMD发挥了其在浮点运算中的一贯优势,但是在整数运算中落后于对手10%左右。
在浮点性能测试中包括6个Fortran-77程序,4个Fortran-90程序和4个C程序。Xeon平台在量子色动力学(168)、椭圆偏微分方程(173)、计算机面部特征识别(187)、粒子加速器模型(200)这4个子项目的优势超过了10%,而Opteron平台则在浅水模型(171)、3D电场多栅格解算机(172)、神经网络模拟:自适应共鸣理论(179)、有限元模拟:地址模型(193)、计算化学(188)、数论(189)、有限元碰撞模拟(191)则有10%以上的性能优势。
整数性能测试中包括11个C程序和1个C++程序(252.eon)。Xeon平台在数据压缩(164、256)、C编译器(176)、自然语言处理(197)、计算机群论(254)、面向对象的数据库应用(255)等多个项目中都有10%以上的性能优势。Opteron平台在整数测试中只有4项超过了Xeon平台,而且只有两项程序(175、300)的领先优势超过了10%。
| SPECfp_base2000 | SPECint_base2000 | ||||
|---|---|---|---|---|---|
| Xeon | Opteron | Xeon | Opteron | ||
| 开启线程数量 | 4 | 2 | 开启线程数量 | 4 | 2 |
| 168.wupwise | 2332 | 1360 | 164.gzip | 999 | 1095 |
| 171.swim | 2192 | 1687 | 175.vpr | 906 | 1030 |
| 172.mgrid | 1290 | 990 | 176.gcc | 1643 | 1432 |
| 173.applu | 1372 | 865 | 181.mcf | 1301 | 825 |
| 177.mesa | 1321 | 1407 | 186.crafty | 1110 | 1283 |
| 178.galgel | 2401 | 1622 | 197.parser | 1166 | 1173 |
| 179.art | 2854 | 1367 | 252.eon | 1856 | 1822 |
| 183.equake | 1991 | 1103 | 253.perlbmk | 1577 | 1436 |
| 187.facerec | 1665 | 1214 | 254.gap | 1641 | 1311 |
| 188.ammp | 910 | 913 | 255.vortex | 2299 | 1941 |
| 189.lucas | 1839 | 1294 | 256.bzip2 | 969 | 945 |
| 191.fma3d | 1310 | 1116 | 300.twolf | 1139 | 1290 |
| 200.sixtrack | 593 | 551 | 总分 | 1329 | 1262 |
| 301.apsi | 1012 | 1085 | 注:蓝色粗体代表优势在10%以上 黑色粗体仅代表优势不足10% | ||
|
总分 |
1522 | 1143 | |||
这个部分的测试主要反映的是fp测试和fp_rate测试反映了被测平台处理器、内存子系统不同的方面,这个部分主要体现的系统执行任务的速度,而rate测试体现的则是系统并行执行任务的能力。可以看到Opteron 246处理器(2GHz)的浮点性能和整数性能都是落后于Xeon 3.0GHz处理器的。
对于这个测试结果,受所使用的编译器的影响非常明显,我们只是使用了Intel C++和Intel Fortran编译器。从SPEC.org公布的结果来看,如果使用PGI编译器+ACML库的话测试结果应该能达到同Xeon 3.0相近的性能。
从上面表格中可以了解到,浮点运算方面,Opteron处理器在3D图形库(177)、计算机化学(188)和气象学:污染物扩散(301)等应用中依然有性能优势;在整数运算方面,Opteron则在数据压缩(164)、电路布线和路由(175)、象棋程序(186)、布线和路由(300)等应用中有10%以上的性能优势。