测试结果
Sisoft Sandra 2k5 | ASUS_NVIDIA | TYAN_AMD |
CPU Arithmetic Benchmark | ||
Dhrystone ALU | 16910 MIPS | 16765 MIPS |
Whetstone FPU | 6267 MFLOPS | 6231 MFLOPS |
Whetstone iSSE2 | 8291 MFLOPS | 8245 MFLOPS |
CPU Multi-media Benchmark | ||
Integer x8 iSSE2 | 38179 it/s | 37868 it/s |
Floating-Point x4 | 40914 it/s | 40686 it/s |
Memory Bandwith Benchmark | ||
Int Buff''d iSSE2 | 4912 MB/s | 4061 MB/s |
Float Buff''d iSSE2 | 5959 MB/s | 4041 MB/s |
我们使用了Sisoft Sandra 2005 Pro SR2a对于各个系统进行了测试,这个测试结果对于普通的读者来说更加熟悉,甚至可以利用共享版本直接测试自己系统,因此会对于我们的测试结果有更加直观的概念。
从Sisoft Sandra 2005的测试结果来看,处理器的性能并没有受到双通道内存或者单通道内存配置的影响,两个平台的性能非常的接近,我们几乎看不出来不同的芯片组之间的性能差异,这说明AMD和NVIDIA的两个厂商的Opteron芯片组都非常的成熟。双Opteron 246的ALU、FPU、Interger x8 iSSE2性能同双Xeon 3.0的性能相当,但是Whetstone iSSE2和Floating-Point x4性能则明显低于双Xeon 3.0平台性能。
内存带宽测试显然华硕平台优势更加明显,这主要是双通道内存配置所带来的。
SPECint rate_base2000 | ASUS_NVIDIA | 2Xeon |
---|---|---|
168.wupwise | 24.6 | 30.8 |
171.swim | 24.0 | 21.3 |
172.mgrid | 31.6 | 41.2 |
173.applu | 21.2 | 19.4 |
177.mesa | 29.4 | 27.2 |
178.galgel | 28.3 | 33.4 |
179.art | 40.1 | 44.3 |
183.equake | 35.0 | 36.4 |
187.facerec | 31.0 | 38.2 |
188.ammp | 50.8 | 56.4 |
189.lucas | 21.0 | 26.9 |
191.fma3d | 28.4 | 25.2 |
200.sixtrack | 29.5 | 31.9 |
SPECint_base2000 | ASUS_NVIDIA | 2Xeon |
---|---|---|
168.wupwise | 1073 | 999 |
171.swim | 1052 | 906 |
172.mgrid | 1383 | 1643 |
173.applu | 905 | 1301 |
177.mesa | 1278 | 1110 |
178.galgel | 1219 | 1166 |
179.art | 1748 | 1856 |
183.equake | 1510 | 1577 |
187.facerec | 1355 | 1641 |
188.ammp | 2146 | 2299 |
189.lucas | 964 | 969 |
191.fma3d | 1187 | 1139 |
200.sixtrack | 1280 | 1329 |
SPEC CPU2000是SPEC组织推出的一套CPU子系统评估软件,它包括CINT2000和CFP2000两个子项目,前者用于测量和对比整数性能,而后者则用于测量和对比浮点性能。计算系统中的处理器、内存和编译器都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2000的影响非常的小。
我们在被测服务器中安装了Intel C++ 8.1 Compiler、Intel Fortran 8.1 Compiler这两款SPEC CPU2000必需的编译器,另外安装了Microsoft Visual Studio 2003.net提供必要的库文件。按照SPEC的要求我们根据自己的情况编辑了新的Config文件,可以满足Base测试。
由于缺乏必要的编译器,我们只能在AMD平台上运行SPEC CPU2000的INT测试部分。这个部分包括多个实例,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。我们分别进行了SPECint_2000和SPECint_rate_2000的测试。前者一般用于衡量执行完毕单个任务的速度,后者用于衡量系统可以同时处理多少个并行任务。
从测试结果上来看,双Opteron 246平台的性能略微的低于双Xeon 3.0GHz平台的性能——而Opteron 246的主频只有2GHz,可见Opteron架构具有很高的效率。不过,两款处理器的价格相近,都大约是2500元左右,构建双处理器服务器的成本也大体相当。
ASUS_NVIDIA | TYAN_AMD | |
内存带宽 | 4495.03 MB/s | 1928 MB/s |
L1 Cache Latency | ||
32 Bytes Stride | 3 cycles/1.50ns | 3 cycles/1.50ns |
L2 Cache Latency | ||
4 Bytes Stride | 3 cycles/1.50 ns | 3 cycles/1.50 ns |
16 Bytes Stride | 5 cycles/2.5 ns | 5 cycles/2.5 ns |
64 Bytes Stride | 16 cycles/8.00 ns | 17 cycles/8.50 ns |
256 Bytes Stride | 12 cycles/6.00 ns | 12 cycles/6.00 ns |
512 Bytes Stride | 13 cycles/6.50 ns | 13 cycles/6.50 ns |
Memory Latency | ||
4 Bytes Stride | 4 cycles/ 2.00 ns | 5 cycles/ 2.50 ns |
16 Bytes Stride | 14 cycles/7.00 ns | 19 cycles/9.50 ns |
64 Bytes Stride | 56 cycles/28.00 ns | 73 cycles/36.5 ns |
256 Bytes Stride | 132 cycles/66.00 ns | 147 cycles/73.50 ns |
512 Bytes Stride | 138 cycles/69.00 ns | 158 cycles/79.00 ns |
ScienceMark v2.0是一款用于测试系统特别是处理器在科学计算应用中的性能的软件,MemBenchmark是其中针对处理器缓存、系统内存而设计的功能模块,它可以测试系统内存带宽、L1 Cache延迟、L2 Cache延迟和系统内存延迟,另外还可以测试不同指令集的性能差异。两个平台的L1延迟和L2延迟基本相同,这再次显示两个平台对于Opteron处理器都提供了良好的支持。
两个平台内存方面的延迟差异比较明显,特别是在64 Bytes宽度以上的测试。我们分析这主要是两个平台所采用的内存模组时序不同所造成的。
|
WebBench是针对服务器作为Web Server时的性能进行测试,我们在被测服务器上安装了IIS6.0组件,以提供测试所需的Web服务。在测试中我们开启了网络实验室中的32台PC(Celeron 1.7/256MB/40GB/100Ethernet)作为客户端,分别使用了WebBench 5.0内置的动态CGI以及静态页面脚本对服务器进行了测试。
动态测试偏重于对服务器CPU子系统的性能测试,它对于Web服务器提供了足够的负载。我们将一个C语言编写的CGI源文件Simcigi.c编译为Simcgi.exe,并将其作为动态测试中的CGI脚本。在测试过程中,每台安装了WebBench客户端软件的PC,会在300秒的时间内持续向服务器发送CGI请求,而控制台会纪录并汇总服务器所响应CGI请求的数据。
当WebBench测试开始后,客户端会以每四台一组依次连接到服务器并发送CGI请求。当测试结束后,控制台会收集数据并绘制出服务器CGI响应数的变化曲线。CGI测试的成绩高低,主要取决于服务器处理器子系统性能的优劣。处理器子系统包括CPU、内存以及内存控制器,CPU频率、缓存以及内存容量大小和内存带宽,都会影响该项成绩。
华硕K8N DRE主板的Web动态请求处理能力达到了4124 Requests Per Second,这个测试结果超过了使用了AMD8000芯片组的对比平台(3567 Requests Per Second,此时单通道配置会影响测试结果),另外也超过了双Xeon 3.0GHz配置的平台。