而据其他渠道得到的消息,目前,国内已有超过一百家大中型机构用户正在进行Bacelona服务器产品的阶段性测试与试用。
另一方面,Intel也将与AMD在同一时间推出主频为3.0Ghz、型号为Xeon 5365的服务器处理器。
X86市场中,双核的争辉却正在激烈地进行。而四核的高阶比拼即将上演。在这个剑拔弩张的时刻,我们也将开始本次Opter2216与Xeon5140对比评测的过程。以下同样列出AMD Opteron 2000与Intel Xeon 5100两系产品的简要参数表。
厂商系列
型号
主频
HTT/FSB
L1(K)
L2(M)
TDP(W)
AMD Opteron2000
2210
1.80
1000Mhz
64+64
1*2
95
2212
2.00
1000Mhz
64+64
1*2
95
2214
2.20
1000Mhz
64+64
1*2
95
2216
2.40
1000Mhz
64+64
1*2
95
2218
2.60
1000Mhz
64+64
1*2
95
2220
2.80
1000Mhz
64+64
1*2
95
2222
3.00
1000Mhz
64+64
1*2
95
Intel Xeon5100
5110
1.60
1066Mhz
32+32
4(共享)
65
5120
1.86
1066Mhz
32+32
4(共享)
65
5130
2.00
1333Mhz
32+32
4(共享)
65
5140
2.33
1333Mhz
32+32
4(共享)
65
5150
2.66
1333Mhz
32+32
4(共享)
65
5160
3.00
1333Mhz
32+32
4(共享)
80
Opteron2216与Xeon5140测试平台简介:
Opteron2000系列与Xeon5100系列处理器规格对比:
| 系统支持项目 | Opteron 2000系列 | Xeon 5100系列 |
| 模块化/可扩展 | 支持 | 需要北桥 |
| SMP | 双路四核 | 双路四核 |
| 直接连接架构 | 支持 | 不支持 |
| 双核技术 | 支持 | 支持 |
| 32bit计算 | 支持 | 支持 |
| 64bit计算 | AMD64 | EM64T |
| HyperTransport技术 | 支持 | 不支持 |
| 内存控制器 | 整合于处理器 | 整合于北桥 |
| 硬件辅助虚拟化 | AMD-V | VT |
| HTT/FSB频率 | 1000MHz | 1066MHz/1333MHz |
| 最大处理器间带宽 | 8.0GB/s | 8.5-10.66GB/s |
| 内存类型 | DDR2 400/533/667 | FB-DIMM DDR2 533/667 |
| 最大双路内存带宽 | 21.2GB/s | 21.3GB/s |
| L1 Cache | [64K(Data)+64K(Instruction)]/Per core | [32K(Data)+32K(Instruction)]/Per core |
| L2 Cache | 1MB/core*2 | 4MB(share) |
| SIMD指令集 | SSE/SSE2/SSE3 | SSE/SSE2/SSE3/SSE4 |
Opteron2216与Xeon5140平台对比:
| 系统参数 | Opteron 2216平台 | Xeon 5140平台 |
| 主板 | ASUS KFN4-16 | ASUS DSBF-D |
| 芯片组 | nVIDIA nForce Pro 2200, AMD Hammer | Intel 5000P |
| 处理器 | AMD Opteron 2216*2 | Intel Xeon 5140*2 |
| 主频 | 双核2.40GHz*2 | 双核2.33GHz*2 |
| HTT/FSB | 1000MHz | 1333MHz |
| 接口 | Socket F | Socket 771 |
| L1 | [64K(Data)+64K(Instruction)]/Per core | [32K(Data)+32K(Instruction)]/Per core |
| L2 | 1MB*2(独立) | 4MB(共享) |
| 处理器设置 | AMD Power Now! (Disable) | Xdbit(Disable)EIST(Disable)C1 State(Disable) |
| 内存 | Kingston DDR2 533 Reg Ecc 512M*8 | KingSton FB-DIMM 533 512M*8 |
| 磁盘 | Seagate 73GB万转SCSI(型号ST373307LC) | Seagate 73GB万转SCSI(型号ST373307LC) |
| 磁盘控制器 | LSI Logic PCI-X Ultra320 SCSI Host Adapter | LSI Logic PCI-X Ultra320 SCSI Host Adapter |
| 操作系统 | Microsoft Windows Server2003SP1,5.02.3790,开启PAE | Microsoft Windows Server2003SP1,5.02.3790,开启PAE |
| 网卡 | Broadcom NetXtreme Gigabit Ethernet (BCM5780整合GbE) | Intel PRO/1000 EB Network Connection with I/O Acceleration |
本次测试的Opteron2216与Xeon5140两平台的处理器主频基本相当,而这里需要注意的一点是,两款处理器的架构、参数稍有不同:AMD Opteron 2216相对Intel Xeon 5140在主频上要高出0.07Ghz,Intel Xeon 5140 FSB频率则要比AMD Opteron2216HTT频率高出66Mhz,即高出百分比为6%。但是总体来说,本次选择的Opteron2216与Xeon5140这两个平台的各项参数指标还是非常接近的。
在Intel的Xeon 5140平台中,我们分别关闭了XDbit、EIST、C1 State功能,而在AMD的Opteron 2216平台中,我们关闭了“AMD Power Now!”功能。通过这些简单的优化设置,可以确保测试过程尽量受到其他项目的干扰,从而保障两平台尽量工作在最大性能状态下。
相关参数功能介绍:
XDbit功能:Intel产品的内存保护功能,起到防止程序不正当运行的作用。关闭这项功能,在一些未能被系统正确识别的程序运行时,避免因报错而影响系统进程。
EIST功能: Intel产品的处理器自动调频与调压功能,起到减少工作时耗电量与发热量的作用。关闭此项功能,可以保障平台在进行大批量数据处理的时候,一直保持高速度运行。
C1 state: 当操作系统负载较小的情况下,会向处理器不断发送指令,通过降低处理器频率与电压将处理器能耗降低,如果与EIST功能进行配合使用,能够更好地控制系统空闲时间的能耗。关闭此项功能,可以让平台的处理状态时刻保持高速。
AMD Power Now!: AMD产品的一种节电技术,依据处理器的负载情况实现自动调频调压,以达到省电效果。关闭此项功能,可以让平台的处理状态时刻保持高速。
测试方法研究:
在本次测试过程中,我们依然进行了所有必要的常规测试项目:
-
SPECCPU2000 v1.2
SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。
SPEC CPU2000是SPEC组织推出的一套CPU子系统评估软件,它包括CINT2000和CFP2000两个子项目,前者用于测量和对比整数性能,而后者则用于测量和对比浮点性能。计算系统中的处理器、内存和编译器都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2000的影响非常的小。
SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、DCC以及科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。
我们在被测服务器中安装了Intel C++ 8.1 Compiler、Intel Fortran 8.1 Compiler这两款SPEC CPU2000必需的编译器,另外安装了Microsoft Visual Studio 2003.net提供必要的库文件。按照SPEC的要求我们根据自己的情况编辑了新的Config文件,可以满足Base测试。然后我们根据被测系统实际可同时处理的线程数量,设定用户数量,分别运行SPEC base和SPEC rate base测试的结果(其中SPEC base代表系统执行某个任务的速度,而SPEC base rate测试代表系统可以同时处理任务的能力)。
- ScienceMark v2.0 Membench
ScienceMark v2.0是一款用于测试系统特别是处理器在科学计算应用中的性能的软件,MemBenchmark是其中针对处理器缓存、系统内存而设计的功能模块,它可以测试系统内存带宽、L1 Cache延迟、L2 Cache延迟和系统内存延迟,另外还可以测试不同指令集的性能差异。
-
IOMeter 2004.7.30
IOMeter是一款功能非常强大的IO测试软件,它除了可以在本机运行测试本机的IO(磁盘)性能之外,还提供了模拟网络应用的能力。在这次的测试中,我们仅仅让它在本机运行测试服务器的磁盘性能。为了全面测试被测服务器的IO性能,我们分别选择了不同的测试脚本。
-
Max_throughput(read):文件尺寸为64KB,100%读取操作,随机率为0%,用于检测磁盘系统的最大读取吞吐量
-
Max_IO(read):文件尺寸为512B,100%读取操作,随机率为0%,用于检测磁盘系统的最大读取操作IO处理能力
-
Max_throughput(write):文件尺寸为64KB,0%读取操作,随机率为0%,用于检测磁盘系统的最大写入吞吐量
-
Max_IO(write):文件尺寸为512B,0%读取操作,随机率为0%,用于检测磁盘系统的最大写入操作IO处理能力
-
SiSoftware.Sandra.Enterprise.v2007.5.10.98
SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。今年该软件推出了2007版,该版本新增了4项基准测试,包括Power Management Efficiency、Memory Latency、Physical Disks和CD-ROM and DVD这四个项目。另外,它还对于原有的几个基准测试模块进行升级,比如在Arithmetic benchmarks中增加了对SSE3 & SSE4 SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,另外还升级了File System benchmark和Removable Storage benchmark两个子项目。对于新的硬件的支持当然也是该软件每次升级的重要内容之一。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台,这也是我们选择这款软件的原因之一。
-
WebBench v5.0
WebBench是针对服务器作为Web Server时的性能进行测试,我们在被测服务器上安装了IIS6.0组件,以提供测试所需的Web服务。在测试中我们开启了网络实验室中的56台客户端,分别使用了WebBench 5.0内置的动态CGI以及静态页面脚本对服务器进行了测试。
静态测试是由客户端读取预先放置在服务器Web Server下的Web页面(wbtree),这项测试主要考察的是服务器磁盘系统以及网络连接性能。我们使用了实验室中的56台客户端,配合Static_mt.tst多线程静态脚本测试向被测服务器发送请求。
动态测试偏重于对服务器CPU子系统的性能测试,它对于Web服务器提供了足够的负载。我们将一个C语言编写的CGI源文件Simcigi.c编译为Simcgi.exe,并将其作为动态测试中的CGI脚本。在测试过程中,每台安装了WebBench客户端软件的PC,会在300秒的时间内持续向服务器发送CGI请求,而控制台会纪录并汇总服务器所响应CGI请求的数据。CGI测试的成绩高低,主要取决于服务器处理器子系统性能的优劣。处理器子系统包括CPU、内存以及内存控制器,CPU频率、缓存以及内存容量大小和内存带宽,都会影响该项成绩。
-
NetBench v7.03
NetBench是针对文件服务器的性能测试软件,影响NetBench性能的主要是服务器的磁盘子系统,服务器磁盘控制器、条带大小、读写缓存、硬盘类型、组建磁盘阵列模式、内存容量、网络拓朴结构等都会对测试结果有明显的影响。我们在被测服务器上设立了文件服务器,NetBench通过网络实验室中60个客户端来模拟网络中的PC向文件服务器所发出的文件传输请求,文件服务器则将存储在磁盘上的文件数据发送给相应的客户端。在测试过程中,客户端会以每四台一组的步进依次增加并且向服务器发送文件传输请求,测试结束后控制台收集数据并绘制出服务器的数据传输变化曲线。
-
Benchmarkfactory 4.6
大部分的服务器应用都同数据库有着密切的联系,因此我们今年开始着手在在服务器测试中加入对于数据库性能的测试。我们选择了Benchmark Factory 4.6软件和Microsoft SQL2000 SP4来测试不同的硬件平台在数据库应用中的表现。
我们选择了BF内置的标准测试脚本AS3AP,这项测试可用于对于ANSI结构化查询语言(SQL)关系型数据库进行测试,它可用于测试DBMS(单用户微机数据库管理系统),也可用于测试高性能并行或者分布式数据库。
-
系统功耗监测
我们使用UNI-T UT71E智能数字万用表对于被测服务器系统的整体功耗进行了监测,利用随机附带的接口程序,我们可以记录被测服务器任意时间段内的功率变化。
处理器性能测试对比:
|
Sisoftware.Sandra.Enterprise.w2007.5.10.98 |
||
| 处理器型号 | Opteron 2216 | Xeon 5140 |
| Processor Arithmetic | ||
| Dhrystone ALU(MIPS) | 34709 | 43089 |
| Whetstone iSSE3(MFLOPS) | 29367 | 29545 |
| Processor Multi-Media | ||
| Integer x8 iSSE4(it/s) | 255717 | |
| Integer x4 Aemmx/aSSE(it/s) | 87673 | |
| Floating-Point x4 isse2(it/s) | 97770 | 138575 |
Opteron2216与Xeon5140处理器性能测试对比
Sisoftware Sandra Enterprise 2007在Arithmetic benchmarks中增加了对SSE3 & SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,AMD Opteron 2216处理器和Intel Xeon 5140处理器对于指令集的支持情况并不相同:
AMD Opteron 2216:MMX(+)、3DNow!(+)、SSE、SSE2、SSE3、X86-64。
Intel Xeon 5140:MMX、SSE、SSE2、SSE3、SSE4、EM64T。
因此,除了Processor Multi-Media Integer测试之外,其它的三个测试项目均具有可比性。
从以上对比数据我们可以看到:Xeon5140处理平台的Dhrystone ALU(MIPS)测试数据相对Opteron2216处理平台高出约24%,Whetstone iSSE3(MFLOPS)测试项目中,Opteron2216处理平台与Xeon5140处理平台相当,在多媒体测试的Floating-Point x4 isse2项目中,Xe5140处理平台则要高出41%左右。
Opteron2216与Xeon5140缓存内存对比之ScienceMem:
|
ScienceMark Membench |
||
| 平台 | Opteron 2216 | Xeon5140 |
| L1带宽 | 27501.52 | 65280.48 |
| L2带宽 | 8714.97 | 19522.33 |
| 内存带宽(MB/s) | 5020.13 | 3811.16 |
| L1 Cache Latency(ns) | ||
| 32 Bytes Stride | 1.25 | 1.29 |
| L2 Cache Latency(ns) | ||
| 4 Bytes Stride | 1.25 | 1.29 |
| 16 Bytes Stride | 2.09 | 1.72 |
| 64 Bytes Stride | 7.10 | 4.73 |
| 256 Bytes Stride | 5.01 | 4.73 |
| 512 Bytes Stride | 5.43 | 5.16 |
| Memory Latency(ns) | ||
| 4 Bytes Stride | 1.67 | 1.29 |
| 16 Bytes Stride | 5.85 | 5.59 |
| 64 Bytes Stride | 24.64 | 24.06 |
| 256 Bytes Stride | 60.15 | 77.76 |
| 512 Bytes Stride | 63.07 | 84.64 |
| Algorithm Bandwidth(MB/s) | ||
| Compiler | 2231.41 | 2833.21 |
| REP MOVSD | 2213.65 | 2854.71 |
| ALU Reg Copy | 2238.90 | 2708.18 |
| MMX Reg Copy | 2330.00 | 2773.14 |
| MMX Reg 3dNow | 4205.73 | - |
| MMX Reg SSE | 4804.04 | 3811.16 |
| SSE PAlign | 3752.89 | 3721.01 |
| SSE PAlign SSE | 4789.99 | 3805.91 |
| SSE2 PAlign | 3751.98 | 3701.07 |
| SSE2 PAlign SSE | 4788.82 | 3795.62 |
| MMX Block 4kb | 4155.91 | 3066.73 |
| MMX Block 16kb | 4646.29 | 3351.23 |
| SSE Block 4kb | 4399.63 | 3039.11 |
| SSE Block 16kb | 5020.13 | 3359.00 |
以上测试结果显示出,在L1与L2带宽测试环节,Xeon 5140服务器平台的测试数据都要高出一倍,而到了内存带宽测试环节,Opteron 2216服务器平台反而以5020.13MB/s高出Xeon 5140服务器平台的3811.16MB/s,同比高出32%。
在一二级缓存(L1与L2)延迟的测试环节,两平台延迟时间的数值位数相同,结合两平台延迟都处于非常微小的ns级的情况,可以确定两服务器平台的延迟是相当的。
在Algorithm Bandwidth测试环节,Xeon 5140服务器平台在Compiler、REP MOVSD、ALU Reg Copy、MMX Reg Copy等四个项目测试中领先,但是在MMX Reg SSE、SSE PAlign、SSE PAlign SSE、SSE2 PAlign、SSE2 PAlign SSE、MMX Block 4kb 、MMX Block 16kb、SSE Block 4kb、SSE Block 16kb等九个项目的测试中,Opteron 2216服务器平台则更显优势。
Opteron2216与Xeon5140缓存内存对比之Sisoftware2007:
|
SiSoftware.Sandra.Enterprise.v2007.5.10.98 |
||
| 平台 | Opteron 2216 | Xeon 5140 |
|
Memory Bandwidth |
||
| RAM Int Buff iSSE2(MB/s) | 11109 | 5570 |
| RAM Float Buff iSSE2(MB/s) | 11091 | 5576 |
|
Memory Latency |
||
| Random Access | ||
| 1kB | 3.0 | 3.0 |
| 4kB | 3.0 | 3.0 |
| 16kB | 3.0 | 3.0 |
| 64kB | 3.0 | 14.1 |
| 256kB | 17.3 | 15.7 |
| 1MB | 22.9 | 16.1 |
| 4MB | 104.8 | 28.1 |
| 16MB | 105.6 | 116.7 |
| 64MB | 110.1 | 133.2 |
|
Linear Access |
||
| 1kB | 3.0 | 3.0 |
| 4kB | 3.0 | 3.0 |
| 16kB | 3.0 | 3.0 |
| 64kB | 3.0 | 12.3 |
| 256kB | 17.2 | 12.3 |
| 1MB | 17.3 | 12.3 |
| 4MB | 25.1 | 14.1 |
| 16MB | 25.1 | 24.0 |
| 64MB | 25.1 | 24.0 |
| Cache and Memory(MB/s) | ||
| 2KB | 97710 | 215762 |
| 4KB | 94122 | 264506 |
| 8KB | 93191 | 281286 |
| 16KB | 97022 | 294113 |
| 32KB | 97884 | 291719 |
| 64KB | 94818 | 276395 |
| 128KB | 83345 | 215483 |
| 256KB | 74920 | 83794 |
| 512KB | 57989 | 83103 |
| 1MB | 47211 | 79698 |
| 4MB | 28006 | 65718 |
| 16MB | 7849 | 9625 |
| 64MB | 7755 | 6599 |
| 256MB | 7401 | 6228 |
| 1GB | 5928 | 4983 |
Sisoftware Sandra 2007的内存缓存测试项目中显示,Opteron 2216服务器平台的内存带宽是Xeon 5140服务器平台的将近2倍,但是两者的理论带宽应该是相同的,产生这一结果的原因,可能与测试软件对不同的内存子系统的结构支持有关。
内存延迟测试方面,我们可以通过以下的随机与线性延迟测试结果对比图来看看。
![]() |
随机缓存测试数据图
![]() |
线性缓存测试数据图
从随机与线性延迟测试图中,我们可以看到,在测试数据块大小为64K(Opteron 2216的L1容量)与4M(Xeon 5140的L2容量)的时候,两者性能的差异较大。
内存与缓存测试中,当数据块大小比4M小时,Xeon 5140服务器平台的性能表现较好,而当数据块大小大于4M时,Opteron 2216服务器平台的测试成绩则慢慢赶上并超过Xeon 5140平台。这一结果应该与两服务器平台的L1、L2容量差异有很大的关系。
Opteron2216与Xeon5140之Web性能对比:
在测试Web服务器的时候,我们选择了动态CGI应用进行测试。在整个动态测试过程中,吞吐量远没有达到被测服务器网卡的吞吐量上限,测试结果主要反映处理器、内存等部分的性能。
![]() |
从上图可以看到,双路Opteron 2216服务器平台在接入40个终端时,动态CGI请求处理能力到达峰值7378 Requests/s,而双路Xeon 5140服务器平台在接入40个终端时,动态CGI请求处理能力达到了峰值7664 Requests/s。
另外,随着接入终端数的增加,两条平滑的动态CGI请求处理能力曲线,反映出两者稳定攀升的动态CGI请求处理能力,而交叉并贴近的两条曲线趋势图,还反映出两服务器平台相近的处理性能。
皓龙2216与至强5140平台数据库性能对比:
我们在被测服务器上安装了Microsoft SQL 2000 SP4,按照测试要求建立了数据库。BF在测试之前会在数据库中生成9个表,其中包括4个500万行的表格,每行包括100字节的数据,因此每个表格容量大约是476MB,整个数据库容量为1.86GB。我们用60个客户端模拟1600个用户,并且以8个一组依次增加,在这个数据库中进行查询、添加、删除、修改等操作。在测试期间,数据的吞吐量很小,因此磁盘吞吐量和网络吞吐量都不会成为瓶颈。
![]() |
测试数据显示:
1)两服务器平台在处理数据库操作请求时,均呈现随着接入虚拟用户数和压力值的增加而增加的数据库操作处理能力;
2)两条平滑而上扬的曲线,同样反映出两两服务器系统稳定的数据库处理性能;
3)从上图中反映的曲线我们可以了解到,Opteron2216服务器平台相对Xeon5140服务器平台在处理数据库请求时,呈现出稍高的处理性能。
综上,在数据库性能测试中,Opteron2216服务器平台显示出了相对的优势,不过如果注意到Opteron2216略高的主频,以性能与主频之比作为参考的话,两者的能力还是相当的。
【IT168评测中心】从前面对Opteron 2216服务器平台与Xeon 5140服务器平台的测试,我们了解到:1)单机测试项目中,Opteron 2216与Xeon 5140两服务器平台在处理性能、内存缓存带宽与延迟等方面各有自己的优势;
2)网络测试项目中,Web服务器测试与数据库服务器测试项目的结果显示,Opteron 2216与Xeon 5140两服务器平台的综合性能相近,而两者总体性能与主频之比的平均性能也是相当。
单机测试可以反映出服务器的单机处理性能,还能够从不同的方面体现出各服务器核心部件的一些结构特点,而网络测试则是从用户实用的角度,通过数据来表达服务器在某项实际应用中的综合处理性能。作为网络核心设备的服务器,其网络测试项目的综合处理性能才是客观反映其真实性能的标准,而结合前文实际网络应用测试,我们可以判断,Opteron 2216与Xeon 5140的真实性能是相当的。
Intel四核Xeon处理器推出已过半年,而AMD的四核Opteron处理器也即将推出,由于双方双核处理平台均可以向四核处理平台进行完美的支持,随着四核Opteron处理器的推出,由Intel独占X86服务器四核处理市场的局面也将不在,价格风暴随时上演。在这种情况下,四核服务器时代的来临也是具备了相当的市场基础。
不过,从市场用户的消费心理来看,服务器最侧重的是稳定性,其次才是性能,这就需要上游厂商从大型机构用户对于性能的迫切需求切入,带动服务器市场四核的慢慢渗透,慢慢拉近四核服务器价格与用户的距离,从而实现四核服务器的大众化。
在四核竞争正式上演的前夜,双核仍然是服务器市场的主流,就让我们在双核的争辉的年岁里,耐心期待四核时代的来临吧!
