服务器 频道

对比延续:Opteron2212和Xeon5120评测

    【IT168评测中心】今年以来,服务器市场充斥同业眼球的,从IBM Power6处理器的推出,到中外刀片服务器标准之争,再到AMD四核处理器的待出,焦点都围绕着上游厂商的动作进行,但是,毕竟服务器最基础的是是应用,而应用需要足够的性能来支持。

  Opteron2212与Xeon5120分别是AMD Opteron 2000和Intel Xeon 5100两系高出入门级一个级别的处理器,出于不少用户不买最低的消费心理,两者在中低端消费群里的市场关注度颇高。

  作为前两次推出主流服务器市场双路Opteron 2214与Xeon 5130、Opteron 2218与Xeon 5150服务器平台的对比评测以来,此次,我们将推出Opteron 2212与Xeon 5120的对比。以下同样列出AMD Opteron 2000与Intel Xeon 5100两系产品的简要参数表。

厂商系列 型号 主频 HTT/FSB L1(K) L2(M) TDP(W)
AMD Opteron2000 2210 1.80 1000Mhz 64+64 1*2 95
2212 2.00 1000Mhz 64+64 1*2 95
2214 2.20 1000Mhz 64+64 1*2 95
2216 2.40 1000Mhz 64+64 1*2 95
2218 2.60 1000Mhz 64+64 1*2 95
2220 2.80 1000Mhz 64+64 1*2 95
2222 3.00 1000Mhz 64+64 1*2 95
Intel Xeon5100 5110 1.60 1066Mhz 32+32 4(共享) 65
5120 1.86 1066Mhz 32+32 4(共享) 65
5130 2.00 1333Mhz 32+32 4(共享) 65
5140 2.33 1333Mhz 32+32 4(共享) 65
5150 2.66 1333Mhz 32+32 4(共享) 65
5160 3.00 1333Mhz 32+32 4(共享) 80

测试平台简介:

  Opteron2000系列与Xeon5100系列处理器规格对比:

系统支持项目 Opteron 2000系列 Xeon 5100系列
模块化/可扩展 支持 需要北桥
SMP 双路四核 双路四核
直接连接架构 支持 不支持
双核技术 支持 支持
32bit计算 支持  支持
64bit计算 AMD64 EM64T
HyperTransport技术 支持 不支持
内存控制器 整合于处理器 整合于北桥
硬件辅助虚拟化 AMD-V VT
HTT/FSB频率 1000MHz 1066MHz/1333MHz
最大处理器间带宽 8.0GB/s 8.5-10.66GB/s
内存类型 DDR2 400/533/667 FB-DIMM DDR2 533/667
最大双路内存带宽 21.2GB/s 21.3GB/s
L1 Cache [64K(Data)+64K(Instruction)]/Per core [32K(Data)+32K(Instruction)]/Per core
L2 Cache 1MB/core*2 4MB(share)
SIMD指令集 SSE/SSE2/SSE3 SSE/SSE2/SSE3/SSE4

  Opteron2212与Xeon5120平台对比

系统参数 Opteron 2212平台 Xeon 5120平台
主板 ASUS KFN4-16 ASUS DSBF-D
芯片组 nVIDIA nForce Pro 2200, AMD Hammer Intel 5000P
处理器 AMD Opteron 2212*2 Intel Xeon 5120*2
主频 双核2.00GHz*2 双核1.86GHz*2
HTT/FSB 1000MHz 1066MHz
接口 Socket F Socket 771
L1 [64K(Data)+64K(Instruction)]/Per core [32K(Data)+32K(Instruction)]/Per core
L2 1MB*2(独立) 4MB(共享)
处理器设置 AMD Power Now! (Disable) Xdbit(Disable)EIST(Disable)C1 State(Disable)
内存 Kingston DDR2 533 Reg Ecc 512M*8 KingSton FB-DIMM 533 512M*8
磁盘 Seagate 73GB万转SCSI(型号ST373307LC) Seagate 73GB万转SCSI(型号ST373307LC)
磁盘控制器 LSI Logic PCI-X Ultra320 SCSI Host Adapter LSI Logic PCI-X Ultra320 SCSI Host Adapter
操作系统 Microsoft Windows Server2003SP1,5.02.3790,开启PAE Microsoft Windows Server2003SP1,5.02.3790,开启PAE
网卡 Broadcom NetXtreme Gigabit Ethernet (BCM5780整合GbE) Intel PRO/1000 EB Network Connection with I/O Acceleration

  本次测试的Opteron2212与Xeon5120两平台的处理器主频基本相当,而这里需要注意的一点是,两款处理器的架构、参数稍有不同:AMD Opteron 2212相对Intel Xeon 5120在主频上要高出0.14Ghz,即高出百分比为8%;在Intel FSB频率上,则要比AMD Opteron2000系列HTT频率高出66Mhz,即高出百分比为6%。但是总体来说,本次选择的Opteron2212与Xeon5120这两个平台的各项参数指标还是非常接近的。

  在Intel的Xeon 5120平台中,我们分别关闭了XDbit、EIST、C1 State功能,而在AMD的Opteron 2212平台中,我们关闭了“AMD Power Now!”功能。通过这些简单的优化设置,可以确保测试过程尽量受到其他项目的干扰,从而保障两平台尽量工作在最大性能状态下。

  相关参数功能介绍:

  XDbit功能:Intel产品的内存保护功能,起到防止程序不正当运行的作用。关闭这项功能,在一些未能被系统正确识别的程序运行时,避免因报错而影响系统进程。

  EIST功能: Intel产品的处理器自动调频与调压功能,起到减少工作时耗电量与发热量的作用。关闭此项功能,可以保障平台在进行大批量数据处理的时候,一直保持高速度运行。

  C1 state: 当操作系统负载较小的情况下,会向处理器不断发送指令,通过降低处理器频率与电压将处理器能耗降低,如果与EIST功能进行配合使用,能够更好地控制系统空闲时间的能耗。关闭此项功能,可以让平台的处理状态时刻保持高速。

  AMD Power Now!: AMD产品的一种节电技术,依据处理器的负载情况实现自动调频调压,以达到省电效果。关闭此项功能,可以让平台的处理状态时刻保持高速。

测试方法研究:

  在本次测试过程中,我们依然进行了所有必要的常规测试项目:

  • SPECCPU2000 v1.2

  SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。

  SPEC CPU2000是SPEC组织推出的一套CPU子系统评估软件,它包括CINT2000和CFP2000两个子项目,前者用于测量和对比整数性能,而后者则用于测量和对比浮点性能。计算系统中的处理器、内存和编译器都会影响最终的测试性能,而I/O(磁盘)、网络操作系统和图形子系统对于SPEC CPU2000的影响非常的小。

  SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、DCC以及科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。

  我们在被测服务器中安装了Intel C++ 8.1 Compiler、Intel Fortran 8.1 Compiler这两款SPEC CPU2000必需的编译器,另外安装了Microsoft Visual Studio 2003.net提供必要的库文件。按照SPEC的要求我们根据自己的情况编辑了新的Config文件,可以满足Base测试。然后我们根据被测系统实际可同时处理的线程数量,设定用户数量,分别运行SPEC base和SPEC rate base测试的结果(其中SPEC base代表系统执行某个任务的速度,而SPEC base rate测试代表系统可以同时处理任务的能力)。

  • ScienceMark v2.0 Membench

  ScienceMark v2.0是一款用于测试系统特别是处理器在科学计算应用中的性能的软件,MemBenchmark是其中针对处理器缓存、系统内存而设计的功能模块,它可以测试系统内存带宽、L1 Cache延迟、L2 Cache延迟和系统内存延迟,另外还可以测试不同指令集的性能差异。

  • IOMeter 2004.7.30

  IOMeter是一款功能非常强大的IO测试软件,它除了可以在本机运行测试本机的IO(磁盘)性能之外,还提供了模拟网络应用的能力。在这次的测试中,我们仅仅让它在本机运行测试服务器的磁盘性能。为了全面测试被测服务器的IO性能,我们分别选择了不同的测试脚本。

  • Max_throughput(read):文件尺寸为64KB,100%读取操作,随机率为0%,用于检测磁盘系统的最大读取吞吐量

  • Max_IO(read):文件尺寸为512B,100%读取操作,随机率为0%,用于检测磁盘系统的最大读取操作IO处理能力

  • Max_throughput(write):文件尺寸为64KB,0%读取操作,随机率为0%,用于检测磁盘系统的最大写入吞吐量

  • Max_IO(write):文件尺寸为512B,0%读取操作,随机率为0%,用于检测磁盘系统的最大写入操作IO处理能力

  • SiSoftware.Sandra.Enterprise.v2007.5.10.98

  SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。今年该软件推出了2007版,该版本新增了4项基准测试,包括Power Management Efficiency、Memory Latency、Physical Disks和CD-ROM and DVD这四个项目。另外,它还对于原有的几个基准测试模块进行升级,比如在Arithmetic benchmarks中增加了对SSE3 & SSE4 SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,另外还升级了File System benchmark和Removable Storage benchmark两个子项目。对于新的硬件的支持当然也是该软件每次升级的重要内容之一。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台,这也是我们选择这款软件的原因之一。

  • WebBench v5.0

  WebBench是针对服务器作为Web Server时的性能进行测试,我们在被测服务器上安装了IIS6.0组件,以提供测试所需的Web服务。在测试中我们开启了网络实验室中的56台客户端,分别使用了WebBench 5.0内置的动态CGI以及静态页面脚本对服务器进行了测试。

  静态测试是由客户端读取预先放置在服务器Web Server下的Web页面(wbtree),这项测试主要考察的是服务器磁盘系统以及网络连接性能。我们使用了实验室中的56台客户端,配合Static_mt.tst多线程静态脚本测试向被测服务器发送请求。

  动态测试偏重于对服务器CPU子系统的性能测试,它对于Web服务器提供了足够的负载。我们将一个C语言编写的CGI源文件Simcigi.c编译为Simcgi.exe,并将其作为动态测试中的CGI脚本。在测试过程中,每台安装了WebBench客户端软件的PC,会在300秒的时间内持续向服务器发送CGI请求,而控制台会纪录并汇总服务器所响应CGI请求的数据。CGI测试的成绩高低,主要取决于服务器处理器子系统性能的优劣。处理器子系统包括CPU、内存以及内存控制器,CPU频率、缓存以及内存容量大小和内存带宽,都会影响该项成绩。

  • NetBench v7.03

  NetBench是针对文件服务器的性能测试软件,影响NetBench性能的主要是服务器的磁盘子系统,服务器磁盘控制器、条带大小、读写缓存、硬盘类型、组建磁盘阵列模式、内存容量、网络拓朴结构等都会对测试结果有明显的影响。我们在被测服务器上设立了文件服务器,NetBench通过网络实验室中60个客户端来模拟网络中的PC向文件服务器所发出的文件传输请求,文件服务器则将存储在磁盘上的文件数据发送给相应的客户端。在测试过程中,客户端会以每四台一组的步进依次增加并且向服务器发送文件传输请求,测试结束后控制台收集数据并绘制出服务器的数据传输变化曲线。

  • Benchmarkfactory 4.6

  大部分的服务器应用都同数据库有着密切的联系,因此我们今年开始着手在在服务器测试中加入对于数据库性能的测试。我们选择了Benchmark Factory 4.6软件和Microsoft SQL2000 SP4来测试不同的硬件平台在数据库应用中的表现。

  我们选择了BF内置的标准测试脚本AS3AP,这项测试可用于对于ANSI结构化查询语言(SQL)关系型数据库进行测试,它可用于测试DBMS(单用户微机数据库管理系统),也可用于测试高性能并行或者分布式数据库。

  • 系统功耗监测

  我们使用UNI-T UT71E智能数字万用表对于被测服务器系统的整体功耗进行了监测,利用随机附带的接口程序,我们可以记录被测服务器任意时间段内的功率变化。

皓龙2212与至强5120处理器性能对比测试:

Sisoftware.Sandra.Enterprise.w2007.5.10.98

处理器型号 Opteron 2212 Xeon 5120
Processor Arithmetic
Dhrystone ALU(MIPS) 29069 34567
Whetstone iSSE3(MFLOPS) 24593 23112
Processor Multi-Media
Integer x8 iSSE4(it/s)   205123
Integer x4 Aemmx/aSSE(it/s) 75228  
Floating-Point x4 isse2(it/s) 81870 111132

  Sisoftware Sandra Enterprise 2007在Arithmetic benchmarks中增加了对SSE3 & SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,AMD Opteron 2212处理器和Intel Xeon 5120处理器对于指令集的支持情况并不相同:
 
   AMD Opteron 2212:MMX(+)、3DNow!(+)、SSE、SSE2、SSE3、X86-64。
 
   Intel Xeon 5120:MMX、SSE、SSE2、SSE3、SSE4、EM64T。
 
   因此,除了Processor Multi-Media Integer测试之外,其它的三个测试项目均具有可比性。
 
   从以上对比数据我们可以看到:Xeon5120处理平台的Dhrystone ALU(MIPS)测试数据相对Opteron2212处理平台高出约19%,Whetstone iSSE3(MFLOPS)测试项目中,Opteron2212处理平台则相对Xeon5120处理平台要高出6%,在多媒体测试的Floating-Point x4 isse2项目中,Xe5120处理平台则要高出35%左右。

皓龙2212与至强5120缓存内存对比(ScienceMem):

ScienceMark Membench

平台 Opteron 2212 Xeon5120
L1带宽 23004.50 52358.39
L2带宽 7281.75 15683.28
内存带宽(MB/s) 5031.90 2918.25
L1 Cache Latency(ns)
32 Bytes Stride 1.50 1.61
L2 Cache Latency(ns)
4 Bytes Stride 1.50 1.61
16 Bytes Stride 2.50 2.14
64 Bytes Stride 8.50 5.89
256 Bytes Stride 6.00 6.43
512 Bytes Stride 6.50 6.43
Memory Latency(ns)
4 Bytes Stride 2.00 1.61
16 Bytes Stride 6.50 5.64
64 Bytes Stride 27.00 28.69
256 Bytes Stride 67.50 79.32
512 Bytes Stride 69.50 88.31
Algorithm Bandwidth(MB/s)
Compiler 2499.96 2068.71
REP MOVSD 2467.54 2086.70
ALU Reg Copy 2501.77 2019.78
MMX Reg Copy 2600.75 2046.38
MMX Reg 3dNow 4549.64 -
MMX Reg SSE 5026.48 2906.74
SSE PAlign 3877.31 2897.37
SSE PAlign SSE 5031.65 2918.25
SSE2 PAlign 3877.81 2888.73
SSE2 PAlign SSE 5031.90 2917.67
MMX Block 4kb 4019.15 2460.69
MMX Block 16kb 4350.06 2663.69
SSE Block 4kb 4202.00 2452.03
SSE Block 16kb 4489.33 2668.89

  从以上测试结果统计表可以看到,在L1与L2缓存带宽测试环节,Xeon 5120服务器平台相对都要高出,而到了内存带宽测试环节,Opteron 2212服务器平台反而以5031.90MB/s高出Xeon 5120服务器平台的2918.25MB/s。

  一二级缓存(L1与L2)延迟的测试环节,Opteron 2212服务器平台的测试结果相对Xeon 5120服务器平台略有见好,但是也可以发现,在L2二级缓存测试环节的测试中,与前两次对比测试结果相似地,再在测试数据块大小为64K(相当于Opteron 2212的L1容量大小)时,Opteron 2212服务器平台以8.50ns的延迟时间略高于Xeon 5120服务器平台的5.89ns。不过考虑到两平台延迟都处于非常微小的ns级,可以确定两服务器平台的延迟非常接近。

  在Algorithm Bandwidth测试环节,Opteron 2212服务器平台相对Xeon 5120服务器平台要占据优势,两者差距大致维持在20%以上。

 

皓龙2212与至强5120缓存内存对比(Sisoftware2007):

SiSoftware.Sandra.Enterprise.v2007.5.10.98

平台 Opteron 2212 Xeon 5120

Memory Bandwidth

RAM Int Buff iSSE2(MB/s) 11126 4152
RAM Float Buff iSSE2(MB/s) 11093 4158

Memory Latency

Random Access
1kB 1.6 1.6
4kB 1.6 1.6
16kB 1.6 1.6
64kB 1.6 15.2
256kB 19.1 16.3
1MB 23.6 17.5
4MB 103.8 26.8
16MB 106.2 118.5
64MB 110.3 134.9

Linear Access

1kB 1.6 1.6
4kB 1.6 1.6
16kB 1.6 1.6
64kB 1.6 12.1
256kB 19.2 12.1
1MB 19.7 12.1
4MB 28.9 14.5
16MB 28.9 25.5
64MB 28.9 25.6
Cache and Memory(MB/s)
2KB 81326 169224
4KB 80465 212754
8KB 80231 226392
16KB 80896 236478
32KB 82237 234714
64KB 80656 222290
128KB 69841 173958
256KB 64327 69226
512KB 51129 68656
1MB 40173 65802
4MB 24154 54043
16MB 9487 7008
64MB 9316 4703
256MB 8923 4430
1GB 7125 3544

  Opteron 2000与Xeon 5100两系列产品不同的体系结构以级测试软件测试机制不同的侧重点,再次在本次对比测试中显示出来:理论内存带宽一致的两服务器平台,在Sisoftware Sandra 2007的内存缓存测试项目中显示,Opteron 2212服务器平台的内存带宽是Xeon 5120服务器平台的2倍多。

  两服务器平台不同的一二级缓存与内存子系统的不同,同样带来在不同大小测试数据块的情况下,测试结果各有上下,我们可以通过以下的随机与线性延迟测试结果对比图来看看。 

随机延迟测试

线性延迟测试

  从随机与线性延迟测试图中,我们可以看到,在测试数据块大小为64K(Opteron 2212的L1容量)与4M(Xeon 5120的L2容量)的时候,两者性能的差异较大。

皓龙2212与至强5120平台Web服务器性能对比:

  在测试Web服务器的时候,我们选择了动态CGI应用进行测试。在整个动态测试过程中,吞吐量远没有达到被测服务器网卡的吞吐量上限,测试结果主要反映处理器、内存等部分的性能。

  如上图所示,双路Opteron 2212、4GFB-DIMM DDR2-533内存的服务器平台在动态CGI请求处理能力上到达峰值7036 Requests/s,配置了双路Xeon 5120处理器、4GB DDR2-533的服务器平台动态CGI请求处理能力达到了峰值6926 Requests/s。
 
   我们从图表中也可以看到:两个服务区平台的动态Web处理性能都呈现出比较稳定的上升态势;在接入用户数超过24个时,Opteron 2212服务器平台相对Xeon 5120服务器平台稍显示出优势;当接入的终端数为60时,两者的性能非常接近。
 
   总地来说,在Web服务处理性能测试环节,Opteron 2212服务器平台相对Xeon 5120服务器平台要稍占优势,但若是把Opteron 2212相对稍高的主频也算在内,两者的性能还是相当的。

皓龙2212与至强5120平台数据库性能对比:

  我们在被测服务器上安装了Microsoft SQL 2000 SP4,按照测试要求建立了数据库。BF在测试之前会在数据库中生成9个表,其中包括4个500万行的表格,每行包括100字节的数据,因此每个表格容量大约是476MB,整个数据库容量为1.86GB。我们用60个客户端模拟1600个用户,并且以8个一组依次增加,在这个数据库中进行查询、添加、删除、修改等操作。在测试期间,数据的吞吐量很小,因此磁盘吞吐量和网络吞吐量都不会成为瓶颈。

  测试数据显示:两服务器平台在处理数据库操作请求的过程中,当接入虚拟用户数为1448个时Opteron2212服务器平台达到峰值33693TPS,当接入虚拟用户数为1024个时Xeon5120服务器平台达到峰值31778TPS;在数据库操作请求不断增加的过程中,两服务器平台的处理性能曲线都非常平滑,显示两处理系统稳定的处理性能。

  从上图显示的Opteron 2212与Xeon 5120两服务器平台的数据库压力处理曲线,整体来看两服务器平台的处理性能,Opteron 2212服务器平台,其总体数据库服务器性能相对优越,考虑其多出的8%主频,两平台性能也是相当。

【IT168评测中心】在Opteron 2212与Xeon 5120两服务器平台的测试中,多项目测试结果显示:

  1)单机测试项目中,由于Opteron 2212与Xeon 5120两服务器平台存在处理器、内存等技术结构和参数的差异,带来与之相应的处理性能、内存带宽与延迟等测试结果各有长短;

  2)网络测试项目中,Web与数据库测试项目均显示,综合性能以Opteron 2212服务器平台稍占优势。

  综上,单机测试数据在一定程度上只能显示出单机处理的性能与特点,但服务器毕竟是用来作为网络应用的核心,所以我们重点考虑实际的网络应用测试:Web与数据库这两个最广泛的服务器网络应用测试中,Opteron 2212服务器平台要稍微领先,但考虑到其相对高出的8%的主频,可以发现,两者的性能还是相当的。

0
相关文章