服务器 频道

优异DC服务器CPU 皓龙2222对决至强5160

  【IT168评测中心】“双核”服务器X86服务器市场分为两大派别,一方是配置了AMD Opteron2000系处理器的服务器,另外一方则是配置了Intel Xeon5100系处理器的服务器。

  在推出前几组AMD Opteron2000系与Intel Xeon5100系服务器平台的对比评测后,本次,我们将会评测Opteron 2000和Xeon 5100系列处理器的优异处理器产品:Opteron 2222与Xeon 5160。

Opteron 2222正面图(点击上图查看清晰大图)

Xeon 5160正面图(点击上图查看清晰大图)

  以下为AMD Opteron 2000与Intel Xeon 5100两系产品的简要参数表。

厂商系列 型号 主频 HTT/FSB L1(K) L2(M) TDP(W)
AMD Opteron2000 2210 1.80 1000Mhz 64+64 1*2 95
2212 2.00 1000Mhz 64+64 1*2 95
2214 2.20 1000Mhz 64+64 1*2 95
2216 2.40 1000Mhz 64+64 1*2 95
2218 2.60 1000Mhz 64+64 1*2 95
2220 2.80 1000Mhz 64+64 1*2 95
2222 3.00 1000Mhz 64+64 1*2 95
Intel Xeon5100 5110 1.60 1066Mhz 32+32 4(共享) 65
5120 1.86 1066Mhz 32+32 4(共享) 65
5130 2.00 1333Mhz 32+32 4(共享) 65
5140 2.33 1333Mhz 32+32 4(共享) 65
5150 2.66 1333Mhz 32+32 4(共享) 65
5160 3.00 1333Mhz 32+32 4(共享) 80

  从处理器的主要参数上来看,Opteron 2222与Xeon 5160是两款势均力敌的双核处理器,它们的主频均为3.0GHz。Opteron 2222采用了1000MHz HTT总线,Xeon 5160则依然采用了FSB结构,其频率达到了1333MHz。Opteron 2222一级缓存容量比Xeon 5160大一倍,而Xeon 5160的二级缓存容量比Opteron 2222处理器大一倍,显然两家厂商对于处理器缓存的理解和应用都是有明显不同的。全系列的Opteron 2000处理器的TDP均为95瓦,即便是最高主频的Opteron 2222也如此,而Xeon 5160则是Xeon 5100系列处理器中的特例,它的TDP从普遍的65瓦跃升到80瓦。

  AMD和Intel两个门派的两大顶尖双核高手的对决的结果如何?且看下面的章节一一分解。

测试平台简介:

  Opteron2000系列与Xeon5100系列处理器规格对比:

系统支持项目 Opteron 2000系列 Xeon 5100系列
模块化/可扩展 支持 需要北桥
SMP 双路四核 双路四核
直接连接架构 支持 不支持
双核技术 支持 支持
32bit计算 支持  支持
64bit计算 AMD64 EM64T
HyperTransport技术 支持 不支持
内存控制器 整合于处理器 整合于北桥
硬件辅助虚拟化 AMD-V VT
HTT/FSB频率 1000MHz 1066MHz/1333MHz
最大处理器间带宽 8.0GB/s 8.5-10.66GB/s
内存类型 DDR2 400/533/667 FB-DIMM DDR2 533/667
最大双路内存带宽 21.2GB/s 21.3GB/s
L1 Cache [64K(Data)+64K(Instruction)]/Per core [32K(Data)+32K(Instruction)]/Per core
L2 Cache 1MB/core*2 4MB(share)
SIMD指令集 SSE/SSE2/SSE3 SSE/SSE2/SSE3/SSE4

  Opteron2222与Xeon5160平台对比:

系统参数 Opteron 2222平台 Xeon 5160平台
主板 ASUS KFN4-16 ASUS DSBF-D
芯片组 nVIDIA nForce Pro 2200, AMD Hammer Intel 5000P
处理器 AMD Opteron 2222*2 Intel Xeon 5160*2
主频 双核3.0GHz*2 双核3.0GHz*2
HTT/FSB 1000MHz 1333MHz
接口 Socket F Socket 771
L1 [64K(Data)+64K(Instruction)]/Per core [32K(Data)+32K(Instruction)]/Per core
L2 1MB*2(独立) 4MB(共享)
处理器设置 AMD Power Now! (Disable) Xdbit(Disable)EIST(Disable)C1 State(Disable)
内存 Kingston DDR2 533 Reg Ecc 512M*8 KingSton FB-DIMM 533 512M*8
磁盘 Seagate 73GB万转SCSI(型号ST373307LC) Seagate 73GB万转SCSI(型号ST373307LC)
磁盘控制器 LSI Logic PCI-X Ultra320 SCSI Host Adapter LSI Logic PCI-X Ultra320 SCSI Host Adapter
操作系统 Microsoft Windows Server2003SP1,5.02.3790,开启PAE Microsoft Windows Server2003SP1,5.02.3790,开启PAE
网卡 Broadcom NetXtreme Gigabit Ethernet (BCM5780整合GbE) Intel PRO/1000 EB Network Connection with I/O Acceleration

  本次测试的Opteron2222与Xeon5160两平台的处理器主频相同,但双方在包括内存子系统、处理通道结构等技术结构等方面均有不同,而具体参数也略有差异:AMD Opteron 2222的HTT也相对Intel Xeon 5160 FSB频率则要低333Mhz,具体百分比为33.3%。

  在Intel的Xeon 5160平台中,我们分别关闭了XDbit、EIST、C1 State功能,而在AMD的Opteron 2222平台中,我们关闭了“AMD Power Now!”功能。通过这些简单的优化设置,可以确保测试过程尽量受到其他项目的干扰,从而保障两平台尽量工作在最大性能状态下。

  相关参数功能介绍:

  XDbit功能:Intel产品的内存保护功能,起到防止程序不正当运行的作用。关闭这项功能,在一些未能被系统正确识别的程序运行时,避免因报错而影响系统进程。

  EIST功能: Intel产品的处理器自动调频与调压功能,起到减少工作时耗电量与发热量的作用。关闭此项功能,可以保障平台在进行大批量数据处理的时候,一直保持高速度运行。

  C1 state: 当操作系统负载较小的情况下,会向处理器不断发送指令,通过降低处理器频率与电压将处理器能耗降低,如果与EIST功能进行配合使用,能够更好地控制系统空闲时间的能耗。关闭此项功能,可以让平台的处理状态时刻保持高速。

  AMD Power Now!: AMD产品的一种节电技术,依据处理器的负载情况实现自动调频调压,以达到省电效果。关闭此项功能,可以让平台的处理状态时刻保持高速运行。

测试方法研究:

  在本次测试过程中,我们依然进行了所有必要的常规测试项目:

  • SPECCPU2000 v1.2

  SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。

  SPEC CPU2000是SPEC组织推出的一套CPU子系统评估软件,它包括CINT2000和CFP2000两个子项目,前者用于测量和对比整数性能,而后者则用于测量和对比浮点性能。计算系统中的处理器、内存和编译器都会影响最终的测试性能,而I/O(磁盘)、网络操作系统和图形子系统对于SPEC CPU2000的影响非常的小。

  SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、DCC以及科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。

  我们在被测服务器中安装了Intel C++ 8.1 Compiler、Intel Fortran 8.1 Compiler这两款SPEC CPU2000必需的编译器,另外安装了Microsoft Visual Studio 2003.net提供必要的库文件。按照SPEC的要求我们根据自己的情况编辑了新的Config文件,可以满足Base测试。然后我们根据被测系统实际可同时处理的线程数量,设定用户数量,分别运行SPEC base和SPEC rate base测试的结果(其中SPEC base代表系统执行某个任务的速度,而SPEC base rate测试代表系统可以同时处理任务的能力)。

  • ScienceMark v2.0 Membench

  ScienceMark v2.0是一款用于测试系统特别是处理器在科学计算应用中的性能的软件,MemBenchmark是其中针对处理器缓存、系统内存而设计的功能模块,它可以测试系统内存带宽、L1 Cache延迟、L2 Cache延迟和系统内存延迟,另外还可以测试不同指令集的性能差异。

  • IOMeter 2004.7.30

  IOMeter是一款功能非常强大的IO测试软件,它除了可以在本机运行测试本机的IO(磁盘)性能之外,还提供了模拟网络应用的能力。在这次的测试中,我们仅仅让它在本机运行测试服务器的磁盘性能。为了全面测试被测服务器的IO性能,我们分别选择了不同的测试脚本。

  • Max_throughput(read):文件尺寸为64KB,100%读取操作,随机率为0%,用于检测磁盘系统的最大读取吞吐量

  • Max_IO(read):文件尺寸为512B,100%读取操作,随机率为0%,用于检测磁盘系统的最大读取操作IO处理能力

  • Max_throughput(write):文件尺寸为64KB,0%读取操作,随机率为0%,用于检测磁盘系统的最大写入吞吐量

  • Max_IO(write):文件尺寸为512B,0%读取操作,随机率为0%,用于检测磁盘系统的最大写入操作IO处理能力

  • SiSoftware.Sandra.Enterprise.v2007.5.10.98

  SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。今年该软件推出了2007版,该版本新增了4项基准测试,包括Power Management Efficiency、Memory Latency、Physical Disks和CD-ROM and DVD这四个项目。另外,它还对于原有的几个基准测试模块进行升级,比如在Arithmetic benchmarks中增加了对SSE3 & SSE4 SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,另外还升级了File System benchmark和Removable Storage benchmark两个子项目。对于新的硬件的支持当然也是该软件每次升级的重要内容之一。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台,这也是我们选择这款软件的原因之一。

  • WebBench v5.0

  WebBench是针对服务器作为Web Server时的性能进行测试,我们在被测服务器上安装了IIS6.0组件,以提供测试所需的Web服务。在测试中我们开启了网络实验室中的56台客户端,分别使用了WebBench 5.0内置的动态CGI以及静态页面脚本对服务器进行了测试。

  静态测试是由客户端读取预先放置在服务器Web Server下的Web页面(wbtree),这项测试主要考察的是服务器磁盘系统以及网络连接性能。我们使用了实验室中的56台客户端,配合Static_mt.tst多线程静态脚本测试向被测服务器发送请求。

  动态测试偏重于对服务器CPU子系统的性能测试,它对于Web服务器提供了足够的负载。我们将一个C语言编写的CGI源文件Simcigi.c编译为Simcgi.exe,并将其作为动态测试中的CGI脚本。在测试过程中,每台安装了WebBench客户端软件的PC,会在300秒的时间内持续向服务器发送CGI请求,而控制台会纪录并汇总服务器所响应CGI请求的数据。CGI测试的成绩高低,主要取决于服务器处理器子系统性能的优劣。处理器子系统包括CPU、内存以及内存控制器,CPU频率、缓存以及内存容量大小和内存带宽,都会影响该项成绩。

  • NetBench v7.03

  NetBench是针对文件服务器的性能测试软件,影响NetBench性能的主要是服务器的磁盘子系统,服务器磁盘控制器、条带大小、读写缓存、硬盘类型、组建磁盘阵列模式、内存容量、网络拓朴结构等都会对测试结果有明显的影响。我们在被测服务器上设立了文件服务器,NetBench通过网络实验室中60个客户端来模拟网络中的PC向文件服务器所发出的文件传输请求,文件服务器则将存储在磁盘上的文件数据发送给相应的客户端。在测试过程中,客户端会以每四台一组的步进依次增加并且向服务器发送文件传输请求,测试结束后控制台收集数据并绘制出服务器的数据传输变化曲线。

  • Benchmarkfactory 4.6

  大部分的服务器应用都同数据库有着密切的联系,因此我们今年开始着手在在服务器测试中加入对于数据库性能的测试。我们选择了Benchmark Factory 4.6软件和Microsoft SQL2000 SP4来测试不同的硬件平台在数据库应用中的表现。

  我们选择了BF内置的标准测试脚本AS3AP,这项测试可用于对于ANSI结构化查询语言(SQL)关系型数据库进行测试,它可用于测试DBMS(单用户微机数据库管理系统),也可用于测试高性能并行或者分布式数据库。

  • 系统功耗监测

  我们使用UNI-T UT71E智能数字万用表对于被测服务器系统的整体功耗进行了监测,利用随机附带的接口程序,我们可以记录被测服务器任意时间段内的功率变化。

处理器性能测试对比:

Sisoftware.Sandra.Enterprise.w2007.5.10.98

处理器型号 Opteron 2222 Xeon 5160
Processor Arithmetic
Dhrystone ALU(MIPS) 43625 55401
Whetstone iSSE3(MFLOPS) 36917 37980
Processor Multi-Media
Integer x8 iSSE4(it/s)   328916
Integer x4 Aemmx/aSSE(it/s) 111593  
Floating-Point x4 isse2(it/s) 122882 178243

Opteron2222与Xeon5160处理器性能测试对比

  Sisoftware Sandra Enterprise 2007在Arithmetic benchmarks中增加了对SSE3 & SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持。AMD Opteron 2222处理器和Intel Xeon 5160处理器对于指令集的支持情况并不相同:

  AMD Opteron 2222:MMX(+)、3DNow!(+)、SSE、SSE2、SSE3、X86-64。

  Intel Xeon 5160:MMX、SSE、SSE2、SSE3、SSE4、EM64T。

  因此,除了Processor Multi-Media Integer测试之外,其它的三个测试项目均具有可比性。

  从以上对比数据我们可以看到:

  Xeon5160处理平台的Dhrystone ALU(MIPS)测试数据相对Opteron2222处理平台高出约27%,Whetstone iSSE3(MFLOPS)测试项目中,Opteron2222处理平台与Xeon5160处理平台性能相当;在多媒体测试的Floating-Point x4 isse2项目中,Xe5160处理平台则要高出45%左右。

缓存内存性能测试对比(ScienceMem):

ScienceMark Membench

平台 Opteron 2222 Xeon5160
L1带宽 34557.56 75403.18
L2带宽 10921.06 25116.44
内存带宽(MB/s) 5490.15 3888.55
L1 Cache Latency(ns)
32 Bytes Stride 1.00 1.00
L2 Cache Latency(ns)
4 Bytes Stride 1.00 1.00
16 Bytes Stride 1.67 1.34
64 Bytes Stride 5.67 3.68
256 Bytes Stride 4.00 3.68
512 Bytes Stride 4.33 4.01
Memory Latency(ns)
4 Bytes Stride 1.67 1.34
16 Bytes Stride 5.33 5.68
64 Bytes Stride 22.33 22.72
256 Bytes Stride 60.33 75.19
512 Bytes Stride 62.67 82.20
Algorithm Bandwidth(MB/s)
Compiler 2629.39 2906.60
REP MOVSD 2556.37 2932.95
ALU Reg Copy 2601.05 2792.60
MMX Reg Copy 2741.83 2864.49
MMX Reg 3dNow 4812.14 -
MMX Reg SSE 5246.63 3888.55
SSE PAlign 4396.83 3780.74
SSE PAlign SSE 5252.08 3872.43
SSE2 PAlign 4397.07 3763.25
SSE2 PAlign SSE 5253.65 3866.37
MMX Block 4kb 5061.37 3161.79
MMX Block 16kb 5446.77 3465.26
SSE Block 4kb 5035.93 3122.51
SSE Block 16kb 5490.15 3465.00

  从以上测试结果统计表可以看到,在L1与L2带宽测试环节,Xeon 5160服务器平台的测试数据都要高出一倍多,而到了内存带宽测试环节,Opteron 2222服务器平台反而以5490.15MB/s高出Xeon 5160服务器平台的3888.55MB/s,同比高出41%。

  在一二级缓存(L1与L2)延迟的测试环节,Opteron 2222与Xeon 5160两平台延迟时间同为1.00ns。

  在Algorithm Bandwidth测试环节,Xeon 5160服务器平台在Compiler、REP MOVSD、ALU Reg Copy、MMX Reg Copy等四个项目测试中领先,但是在MMX Reg SSE、SSE PAlign、SSE PAlign SSE、SSE2 PAlign、SSE2 PAlign SSE、MMX Block 4kb 、MMX Block 16kb、SSE Block 4kb、SSE Block 16kb等九个项目的测试中,Opteron 2222服务器平台则显出更大幅度的优势。

缓存内存性能测试对比(Sisoftware2007):

SiSoftware.Sandra.Enterprise.v2007.5.10.98

平台 Opteron 2222 Xeon 5160

Memory Bandwidth

RAM Int Buff iSSE2(MB/s) 13349 5759
RAM Float Buff iSSE2(MB/s) 13307 5765

Memory Latency

Random Access
1kB 3.0 3.0
4kB 3.0 3.0
16kB 3.0 3.0
64kB 3.0 14.1
256kB 17.3 15.7
1MB 23.1 16.1
4MB 81.1 29.0
16MB 91.0 111.9
64MB 96.2 127.4

Linear Access

1kB 3.0 3.0
4kB 3.0 3.0
16kB 3.0 3.0
64kB 3.0 12.3
256kB 17.1 12.3
1MB 17.2 12.3
4MB 22.8 14.4
16MB 22.9 23.4
64MB 22.9 23.8
Cache and Memory(MB/s)
2KB 122746 262476
4KB 118221 341429
8KB 116882 363256
16KB 121900 379784
32KB 122984 376820
64KB 119135 356665
128KB 104711 278174
256KB 94116 107944
512KB 72786 106988
1MB 59170 102473
4MB 34415 83982
16MB 10953 9981
64MB 10801 6786
256MB 10303 6399
1GB 8242 5119

  Sisoftware Sandra 2007的内存缓存测试项目中显示,虽然两者的理论带宽应该是相同的,但Opteron 2222服务器平台的内存带宽是Xeon 5160服务器平台的2倍多,产生这一结果的原因,可能与测试软件对不同的内存子系统的结构支持有关。

  内存延迟测试方面,我们可以通过以下的随机与线性延迟测试结果对比图来看看。

随机测试数据曲线图

  从随机与线性延迟测试图中,我们可以看到,在测试数据块大小为64K(Opteron 2222的L1容量)与4M(Xeon 5160的L2容量)的时候,两者性能的差异较大。

  内存与缓存测试中,当数据块大小比4M小时,Xeon 5160服务器平台的性能表现较好;当数据块大小大于4M时,Opteron 2222服务器平台的测试成绩则慢慢赶上;当数据块大小超过16M后,Opteron 2222平台的测试成绩甚至超过Xeon 5160平台。这一结果应该与两服务器平台的L1、L2容量差异有很大的关系。

Web服务器性能测试对比:

  在测试Web服务器的时候,我们选择了动态CGI应用进行测试。在整个动态测试过程中,吞吐量远没有达到被测服务器网卡的吞吐量上限,测试结果主要反映处理器、内存等部分的性能。

  如上图所示,在内存、磁盘、网卡等配置在容量与级别相同的情况下,双路Opteron 2222服务器平台在动态CGI请求处理能力上到达峰值9147 Requests/s, 而双路Xeon 5160服务器平台动态CGI请求处理能力达到了峰值9038 Requests/s。

  我们从图表中也可以看到:两个服务区平台的动态Web处理性能都呈现出比较稳定的上升态势;在接入用户数未达到16个时,Opteron 2222服务器平台相对Xeon 5160服务器平台稍显示出些微优势;当接入的终端数超过16个而未达到52个时,双路Xeon 5160平台的对于网络响应处理的性能稍显优势;当接入终端数达到并超过52个时,Opteron 2222又显出更多的处理优势。

  从以上图形显示的整体信息来看,在Web服务处理性能测试环节,双路Opteron 2222与双路Xeon 5160两服务器平台的测试数据非常贴近,体现出两平台相当的Web服务器处理性能。

数据库性能测试对比:

  我们在被测服务器上安装了Microsoft SQL 2000 SP4,按照测试要求建立了数据库。BF在测试之前会在数据库中生成9个表,其中包括4个500万行的表格,每行包括100字节的数据,因此每个表格容量大约是476MB,整个数据库容量为1.86GB。我们用60个客户端模拟1600个用户,并且以8个一组依次增加,在这个数据库中进行查询、添加、删除、修改等操作。在测试期间,数据的吞吐量很小,因此磁盘吞吐量和网络吞吐量都不会成为瓶颈。

  两服务器平台在处理数据库操作请求的过程中,测试数据显示:当接入1528个虚拟用户时,Opteron2222服务器平台达到峰值43018TPS;当接入1224个虚拟用户时Xeon5160服务器平台达到峰值42521TPS;在数据库操作请求不断增加的过程中,两服务器平台的处理性能曲线都非常平滑,显示两处理系统稳定的处理性能。

  通过上图,可以直接地看到,Opteron 2222与Xeon 5160两服务器平台数据库压力处理对比曲线非常地贴近,与此对应的是两服务器平台难分上下的处理性能。

【IT168评测中心】AMD Opteron 2222与Intel Xeon 5160分属于Opteron 2000与Xeon 5100处理器中的优异产品,由此组成的服务器平台的单机与网络应用测试,在一定程度上也代表了双方对于产品性能、服务器系统整合等设计方面的实力。

  从本次多项目对比测试的结果,我们可以看到:

  1)单机测试项目中,由于两服务器平台在处理器、内存等技术结构和参数有所不同,带来与之相应的处理性能、内存带宽与延迟等结果各有胜着;

  2)网络测试项目中,Web与数据库测试项目均显示,两服务器平台的实际网络应用的性能相当。

  综上,在单机测试部分项目中,因测试软件各自侧重的技术结构不同显示出极大的差异,但服务器毕竟是用来作为网络应用的核心,所以我们重点考虑实际的网络应用测试。

  从此次实际网络应用的对比测试结果中,我们了解到,Opteron 2222与Xeon 5160两服务器平台的综合处理性能仍然是相当的。

0
相关文章