两款方正圆明MR200服务器评测-服务器专区

两款方正圆明MR200服务器评测

作者：IT168评测中心李琪编辑：李琪 2005-12-03 00:00

　　处理器和内存性能测试

　　SPEC是标准性能评估公司（Standard Performance Evaluation Corporation）的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织，这个组织的目标是建立、维护一套用于评估计算机系统的标准。

　　SPEC CPU2000是SPEC组织推出的一套CPU子系统评估软件，它包括CINT2000和CFP2000两个子项目，前者用于测量和对比整数性能，而后者则用于测量和对比浮点性能。计算系统中的处理器、内存和编译器都会影响最终的测试性能，而I/O（磁盘）、网络、操作系统和图形子系统对于SPEC CPU2000的影响非常的小。

　　我们在被测服务器中安装了Intel C++ 8.1 Compiler、Intel Fortran 8.1 Compiler这两款SPEC CPU2000必需的编译器，另外安装了Microsoft Visual Studio 2003.net提供必要的库文件。按照SPEC的要求我们根据自己的情况编辑了新的Config文件，可以满足Base测试，下面的测试成绩是在开启双Xeon处理器超线程条件下，4用户，SPECint_rate_base2000和SPECfp_rate_base2000。

MR200_E7520
	SPECfp rate_base2000		SPECint rate_base2000
开启线程数量	4	开启线程数量	4
168.wupwise	35.2	164.gzip	28.1
171.swim	19.8	175.vpr	22.8
172.mgrid	15.3	176.gcc	39.3
173.applu	17.5	181.mcf	16.6
177.mesa	28.6	186.crafty	25.2
178.galgel	40.2	197.parser	28.0
179.art	35.2	252.eon	41.0
183.equake	17.5	253.perlbmk	33.3
187.facerec	28.5	254.gap	27.5
188.ammp	23.6	255.vortex	51.9
189.lucas	19.0	256.bzip2	26.2
191.fma3d	19.2	300.twolf	27.8
200.sixtrack	15.8	总分	29.4
301.apsi	24.9
总分	23.0

　　SPECfp_rate2000测试过程中同时执行多个实例（instance），测量系统执行计算密集型浮点操作的能力，比如CAD/CAM、DCC以及科学计算等方面应用可以参考这个结果。SPECint_rate 2000测试过程中同时执行多个实例（instances），然后测试系统同时执行多个计算密集型整数操作的能力，可以很好的反应诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。

　　方正MR200_E7520服务器的浮点性能和整数性能均比之前所测试的MR100服务器略低，结合后面的内存带宽和延迟测试，我们判断这个成绩还是有些偏低的。

MR200_E7520	ScienceMark Membench
内存带宽	3294.38 MB/s
L1 Cache Latency
32 Bytes Stride	3 cycles/1.07ns
L2 Cache Latency
4 Bytes Stride	6 cycles/2.15 ns
16 Bytes Stride	12 cycles/4.30 ns
64 Bytes Stride	27 cycles/9.67 ns
256 Bytes Stride	26 cycles/9.31 ns
512 Bytes Stride	25 cycles/8.95 ns
Memory Latency
4 Bytes Stride	31 cycles/11.10 ns
16 Bytes Stride	97 cycles/34.73 ns
64 Bytes Stride	370 cycles/132.47 ns
256 Bytes Stride	367 cycles/131.40 ns
512 Bytes Stride	368 cycles/131.76 ns
Algorithm Bandwidth
Compiler	1551.93 MB/s
REP MOVSD	1577.49 MB/s
ALU Reg Copy	1304.60 MB/s
MMX Reg Copy	1586.76 MB/s
MMX Reg 3dNow	-
MMX Reg SSE	2385.17 MB/s
SSE PAlign	3012.13 MB/s
SSE PAlign SSE	2917.91 MB/s
SSE2 PAlign	3011.78 MB/s
SSE2 PAlign SSE	2917.87 MB/s
MMX Block 4kb	3055.85 MB/s
MMX Block 16kb	3294.38 MB/s
SSE Block 4kb	3082.75 MB/s
SSE Block 16kb	3289.42 MB/s

　　ScienceMark v2.0是一款用于测试系统特别是处理器在科学计算应用中的性能的软件，MemBenchmark是其中针对处理器缓存、系统内存而设计的功能模块，它可以测试系统内存带宽、L1 Cache延迟、L2 Cache延迟和系统内存延迟，另外还可以测试不同指令集的性能差异。

　　对比之前测试的其它相近配置的系统，可以发现同方MR200 2200服务器的内存子系统的表现有些异常，双通道内存带宽只有3.3GB/s左右，比正常水平低了大约14%。仔细观察ScienceMark的测试结果，读者会发现处理器L1、L2缓存的延迟都是正常的，但是内存延迟，特别是4字节/16字节/64字节测试，其延迟时间是正常水平的5-6倍。关于这个问题，我们联系同方公司之后，他们并没有发现问题的原因，最后他们又送来了另外一台基于E7320芯片组的同型号服务器。

MR200_E7520
	SPECfp rate_base2000		SPECint rate_base2000
开启线程数量	4	开启线程数量	4
168.wupwise	46.3	164.gzip	28.6
171.swim	23.6	175.vpr	23.1
172.mgrid	21.5	176.gcc	43
173.applu	22.0	181.mcf	22.2
177.mesa	29.7	186.crafty	25.4
178.galgel	46.0	197.parser	33.3
179.art	35.0	252.eon	41.0
183.equake	24.3	253.perlbmk	34.1
187.facerec	35.8	254.gap	37.8
188.ammp	22.6	255.vortex	54.6
189.lucas	22.8	256.bzip2	28.7
191.fma3d	26.7	300.twolf	30.2
200.sixtrack	16.1	总分	32.4
301.apsi	27.4
总分	27.3

　　同样的型号的服务器，但是测试结果差距非常的。MR200_7320的浮点性能比MR200_7520高出了18.6%，而整数性能比MR200-E7520高出了10.2%。一般的情况下，两者的性能是非常相近的。

MR200_E7320	ScienceMark Membench
内存带宽	4022.57 MB/s
L1 Cache Latency
32 Bytes Stride	3 cycles/1.07ns
L2 Cache Latency
4 Bytes Stride	6 cycles/2.15 ns
16 Bytes Stride	13 cycles/4.64 ns
64 Bytes Stride	27 cycles/9.64 ns
256 Bytes Stride	26 cycles/9.29 ns
512 Bytes Stride	25 cycles/8.93 ns
Memory Latency
4 Bytes Stride	6 cycles/2.14 ns
16 Bytes Stride	15 cycles/5.36 ns
64 Bytes Stride	47 cycles/16.78 ns
256 Bytes Stride	353 cycles/126.06 ns
512 Bytes Stride	371 cycles/132.49 ns
Algorithm Bandwidth
Compiler	2059.63 MB/s
REP MOVSD	2099.7 MB/s
ALU Reg Copy	1818.97 MB/s
MMX Reg Copy	1943.32 MB/s
MMX Reg 3dNow	-
MMX Reg SSE	3181.00 MB/s
SSE PAlign	3439.11 MB/s
SSE PAlign SSE	3367.64 MB/s
SSE2 PAlign	3441.6 MB/s
SSE2 PAlign SSE	3366.21 MB/s
MMX Block 4kb	3565.00 MB/s
MMX Block 16kb	4014.74 MB/s
SSE Block 4kb	3507.21 MB/s
SSE Block 16kb	4022.57 MB/s

MR200_E7320的内存带宽也比MR200_E7520的内存带宽高出约22%，对比Memoery Latency测试结果，我们发现4 Bytes Stride、16 Bytes Stride和64 Bytes Stride测试结果差距明显。

　　通过研究基于E7520芯片组的其它型号Intel主板，我们发现在Intel主板的BIOS中一般会提供Hardware Prefetcher和Adjacent Cache Line Prefetch这两个选项，特别是后面的选项，大部分的服务器主板都不提供开关。在BIOS默认状态下，这两个选项是关闭的，而我们每测试一台服务器之前都会把BIOS恢复到默认状态。通过测试我们发现，当启用这两个选项的时候，特别是Adjacent Cache Line Prefetch选项时，内存带宽和延迟均正常，如果关闭这个选项则内存带宽会明显的降低，部分情况下内存延迟也会降低。我们推测方正MR200_E7520服务器内存方面的性能偏低同这个选项有关，并且将这个建议告知方正，但是方正并没有把MR200_E7520服务器发回来让我们验证，我们希望方正自己进行验证，不过他们并没有通知我们是否进行了验证，结果如何。因此，我们还是把我们测试到的所有结果发布出来，如果方正MR200服务器的用户发现自己的服务器性能不够理想，可以试着在这个方面查找一下原因。

第1页：方正圆明MR200服务器第2页：安装、维护和管理第3页：测试平台和测试方法第4页：处理器和内存性能测试第5页：磁盘性能测试：IOMeter 2004.07.30 第6页：网络连通性能：NetBench 7.03 第7页：WebBench 5.0性能测试第8页：NetBench 7.03性能测试第9页：IT168评测中心观点

关注我们