服务器 频道

倍速 浪潮NF280D服务器全国首测

  优点

  • 应用了多种最新的技术规范,比如FB-DIMM、SAS

  • 良好的扩展能力

  • 完善的服务器维护和管理方案

  • 优异的性能

  不足:

  • 磁盘子系统硬件配置较高,但是性能一般

  IT168评测中心2005年5月底,浪潮发布了基于英特尔Bensley平台的塔式和机架式2大类4大系列共8款服务器新品,这些产品均应用了浪潮最新的IFA+智能弹性架构,除了应用了英特尔双核技术之外,还应用了更多的新技术以提高产品的可靠性、可管理性和可用性。浪潮同时还启动了“倍速计划”来推广其双核服务器产品,并且宣布他们将在较短的时间内把全线产品升级到双核平台。

  被浪潮誉为“稳定之星”的NF280D 2U机架式服务器近日送到了IT168评测中心,这款服务器采用了英特尔5000P芯片组,可支持英特尔Xeon 5000系列和最新的Xeon 5100系列处理器,最大可配置容量为32GB的FB-DIMM内存,主板还板载了SAS控制器,可直接支持最新的SAS接口的硬盘……从本文的介绍中,读者将会发现浪潮NF280D是一款应用了诸多新技术的服务器产品。

  正式介绍产品之前需要提前说明的是,我们此次测试的NF280D服务器为工程样机,同正式上市的版本会有一些不同,在文章中我们会尽可能的介绍这些不同,购买产品还请以实物为准。

  NF280D服务器前面板设计了8个热插拔硬盘扩展位,可安装8颗SAS硬盘,如果安装目前最高容量的300GB SAS硬盘的话,可提供2.4TB的存储容量。超薄CD-ROM驱动器的应用大大节约了前面板的空间。前面板上还预留了两个位置,不过却没有提供软驱,在安装操作系统的时候略感不方便,或许正式销售的产品会有不同。

  在前面板的右上角是一排指示灯和按钮,从左到右依次是电源故障指示灯、过热/风扇故障指示灯、两个千兆网卡状态指示灯、硬盘活动状态指示灯、电源指示灯、复位按钮和电源开关。

  在光驱上方是两个USB端口、前置VGA端口,这对于固定于机架上的而且可能会受到空间、线缆长度限制的服务器而言是非常方便的,浪潮的多款服务器都保持了这种设计。

  服务器背后的IO面板提供了PS/2键盘和鼠标接口各一个,两个USB接口,串口、并口和VGA接口各一个,两个千兆铜缆接口。机箱后部还提供了7个扩展位,分别对应于主板上的7个PCI类插槽。

  在NF280D送测样机中将两个700瓦ABLECOM PWS-702A-1R电源配置为冗余电源(服务器标配为单电560瓦),该型号电源+12V输出最高可达57A,+5Vsb输出可达4A,当仅使用一个电源模块时,服务器会报告电源故障,提示用户服务器没有足够安全的供电。在电源模块的旁边可以看到一条塑料线卡,它可以帮助固定电源线,防止其意外脱落——一个很不起眼的设计,但是却非常的实用。

侧面

  浪潮NF280D服务器导轨采用了免工具设计,拆卸都比较方便。

  服务器内部布局

  拆卸NF280D的机箱上盖也无需工具。从上图可见,机箱内部的前四分之一的部分是存储设备区域,主要用于容纳SAS硬盘、光驱等设备,它们通过硬盘背板连接到磁盘控制器上。

  存储区之后是三个机箱风扇,系统正常工作期间它们的转速在6000转以上。其中的两个风扇产生的气流在导风罩的引导下依次流经处理器散热片、FB-DIMM内存,最后流出服务器。由于FB-DIMM内存上的AMB芯片发热量较大,需要对于内存模组提供良好的散热,浪潮对于导风罩进行了小小的改进,可以使得经过处理器散热片的气流更加集中的流经FB-DIMM,从而为内存模组提供充分的散热。另外一个风扇所产生的气流经过另外的导风罩可为芯片组和PCI扩展卡进行散热。

  主板几乎占据了服务器机箱内大半的空间,处理器、内存、扩展卡等设备都安装其上。这款服务器的主板是基于英特尔5000P北桥、ESB2南桥和PXH IO芯片组设计的,可支持英特尔最新的Xeon DP处理器和FB-DIMM内存。

LGA771处理器底座

  NF280D可安装两颗采用LGA771接口的Xeon处理器,支持1333/1066/667MHz FSB,也就是可以支持目前英特尔已经发布的Xeon 5000系列处理器(Dempsey)和5100系列处理器(Woodcrest)的任何一款。

  NF280D服务器提供了8条DDR2 FBD内存插槽,最高可支持32GB 533MHz/667MHz DDR2 FBD内存。由于英特尔5000P芯片组开始支持4通道内存配置,因此内存的安装和配置更加复杂一些。首先,内存需要成对的使用,其次所有的内存应该完全相同(包括容量、频率、芯片组织结构、时序等等),否则可能会影响系统性能。

  主板上的8条FBD插槽从内到外依次被标记为1A、1B、2A、2B、3A、3B、4A、4B,每2条对应1个内存通道,而第1、2个通道则属于Branch0,第3、4个通道属于Branch1。下面的表格显示了分别使用2条、4条和8条内存时,内存模组的安装方式:

  Branch0 Branch1
DIMMs数量 通道0 通道1 通道2 通道3
2 DIMMs 1A - 2A - - - - -
4 DIMMs 1A - 2A - 3A - 4A -
8 DIMMs 1A 1B 2A 2B 3A 3B 4A 4B

  如果只有两条FB-DIMM则需要插入Branch0中的1A和2A,组成双通道模式,不过此时Interleaving功能不会发生作用,因此也会影响性能。只有在Branch0和Branch1同时安装有内存模组的时候,也就是使用4条或者8条内存条的时候,内存子系统才能达到非常好的性能。根据所安装的内存规格和配置模式,该系统最高可提供8.6-21GB/s的内存带宽。

  浪潮NF280D服务器提供了7条扩展插槽,如图从下向上依次是SIMPL IPMI扩展槽、三个PCI-E x8扩展槽(前两个是x8信号,后一个是x4信号,其中第一个PCI-E插槽还有辅助电源接口)、两个PCI-X 133MHz扩展槽和一个PCI-X 100MHz ZCR扩展槽。这款服务器提供了相当完备的扩展能力,不但支持PCI-E,也支持PCI-X,还能安装ZCR扩展卡。

  该服务器主板上提供了多种接口,包括1个软驱接口、1个IDE接口、1个CF卡接口、6个SATA接口和2个SAS接口(红色线框部分)。SAS接口是由Adaptec 9410W控制器芯片所提供的,也就是上图中绿色散热片下的那颗芯片,通过连接SAS背板可支持8个SAS硬盘,可支持RAID 0/1/10模式。

  浪潮NF280D利用板载HY82563EB双端口千兆网卡控制器提供了双千兆铜缆接口。

  浪潮NF280D主要部件展示

  我们在这个章节主要介绍浪潮NF280D送测样机中的主要部件,再次提醒消费者的是这并非是标准配置,具体情况请咨询厂商。

  英特尔目前已经发布了7款基于Woodcrest核心的Xeon 5100处理器,它们是Xeon 5160、Xeon 5150、Xeon 5148、Xeon 5140、Xeon 5130、Xeon 5120和Xeon 5110。

  Xeon 5100系列处理器的主频变化很大,他们没有延续上一代产品的主频,已经发布的处理器中主频最低是1.6GHz,而最高的也只有3.0GHz。Xeon 5000系列处理器的最低主频为2.5GHz,最高则达到了3.73GHz。处理器主频的大幅度下降帮助Xeon 5100处理器明显的降低了功耗,在7款处理器中只有5160的TDP为80瓦,5150/5140/5130/5120/5110等五款处理器TDP为65瓦,Xeon 5148的TDP只有40瓦。

  Xeon 5100系列处理器(Xeon 5160/5150/5148/5140/5130)增加了对于1333MHz前端总线的支持,该总线实际运行频率为333MHz,可以4倍于其频率的速率传输数据,因此理论上每秒可传输10.66 GB的数据。而部分低端的处理器(Xeon 5120/5110)则支持1066 MHz前端总线,此时其系统时钟频率为266MHz,带宽为8.5 GB/s。之前的Xeon 5000系列处理器中则有4款产品采用了1066MHz前端总线,还有4款产品采用了667MHz前端总线。前端总线的技术并没有明显地的改变,依然利用了分离传输(split-transaction)、延迟应答协议(deferred reply protocol)和地址和数据的源同步传输(Source-Synchronous Transfer,SST)等技术。

  从英特尔公布的文档来看,Xeon 5100系列处理器还进一步改进了热量和功率管理能力,它除了支持原有的TM1和EIST技术之外,还增加了对于TM2的支持——它主要增加了调节处理器电压的作用。另外,双核英特尔Xeon 5100系列处理器也支持EDBit(Execute Disable Bit)功能和英特尔虚拟化技术(Intel VT)。不过超线程技术并没有应用在Xeon 5100系列处理器上。(关于Xeon 5100的更详细介绍,请参阅《从频率到能效 务实的Woodcrest》一文)

  送测样机中配置了两颗Xeon 5120处理器,该处理器主频为1.86GHz,前端总线为1066MHz,32KB L1数据缓存和32KB L1指令缓存,4MB L2缓存。

  浪潮NF280D送测样机中安装了4条Ramaxel 1GB 2Rx8 PC2-4200R-444 FB-DIMM,我们分别将其安装于1A、2A、3A和4A内存插槽上,配置为4通道模式。

  浪潮是国内服务器厂商中少数几个积极推动SAS应用的厂商,该厂商已经推出了应用了SAS技术的存储设备和多款服务器。我们这次所测试的NF280D不但板载了Adaptec 9410W SAS控制器,还安装了PCI-E接口的LSI Logic MegaRAID SAS 8308ELP扩展卡。

  这是一款半高型PCI-E x4扩展卡,采用了Intel IOP333 I/O处理器,板载128MB DDR SDRAM内存,可支持连接8个SAS设备,通过扩展背板则可进一步扩展为16个SAS设备。

  8308ELP支持多种磁盘阵列模式,包括RAID 0/1/5/10/50,可用于微软Windows Server2003/2000/XP、Red Hat AS Linux、SuSE Linux等多种操作系统。

2个SAS SFF8087 x4端口

  测试平台和测试方法

浪潮NF280D服务器配置

主板

X7DB3

芯片组

Intel 5000P

驱动程序

INF 7.3.1.1013

处理器

Intel Xeon 5120 x2

主频

1.86GHz

FSB

1066MHz

L2容量

4MB(共享)

处理器设置

XDbit Disable
EIST Disable
C1 State Disable

内存

Ramaxel 1GB 2Rx8 PC2-4200R-444 x4 FB-DIMM

配置 4通道 Interleaving开启

磁盘控制器

LSI Logic MegaRAID SAS 8308ELP扩展卡

硬盘

Maxtor ATLAS 10k V 147GB SAS x3

驱动程序

1.17.0.32(2/3/2006)

磁盘设置

三块硬盘组建为RAID 5模式,条带大小为64KB,Read=Normal,Write=BadBBU。
磁盘分为两个分区,均为NTFS格式,系统默认簇,主分区20GB,其它分为扩展分区,共享文件夹、磁盘测试均在格式化后的扩展分区上进行

操作系统

Microsoft Windows Server2003,5.02.3790,SP1

网卡

Intel PRO/1000 EB Network Connection with I/O Acceleration

驱动程序

9.3.39.0(4/3/2006)

  我们在上述配置的服务器上分别安装了Microsoft Windows 2003 SP1企业版,正确安装了各个硬件的驱动程序,确保服务器工作在非常好的的状态。

  我们所使用的评测项目如下:

  • SPECCPU2000 v1.2

  SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。

  SPEC CPU2000是SPEC组织推出的一套CPU子系统评估软件,它包括CINT2000和CFP2000两个子项目,前者用于测量和对比整数性能,而后者则用于测量和对比浮点性能。计算系统中的处理器、内存和编译器都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2000的影响非常的小。

  SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、DCC以及科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。

  我们在被测服务器中安装了Intel C++ 8.1 Compiler、Intel Fortran 8.1 Compiler这两款SPEC CPU2000必需的编译器,另外安装了Microsoft Visual Studio 2003.net提供必要的库文件。按照SPEC的要求我们根据自己的情况编辑了新的Config文件,可以满足Base测试。然后我们根据被测系统实际可同时处理的线程数量,设定用户数量,分别运行SPEC base和SPEC rate base测试的结果(其中SPEC base代表系统执行某个任务的速度,而SPEC base rate测试代表系统可以同时处理任务的能力)。

  • ScienceMark v2.0 Membench

  ScienceMark v2.0是一款用于测试系统特别是处理器在科学计算应用中的性能的软件,MemBenchmark是其中针对处理器缓存、系统内存而设计的功能模块,它可以测试系统内存带宽、L1 Cache延迟、L2 Cache延迟和系统内存延迟,另外还可以测试不同指令集的性能差异。

  • IOMeter 2004.7.30

  IOMeter是一款功能非常强大的IO测试软件,它除了可以在本机运行测试本机的IO(磁盘)性能之外,还提供了模拟网络应用的能力。在这次的测试中,我们仅仅让它在本机运行测试服务器的磁盘性能。为了全面测试被测服务器的IO性能,我们分别选择了不同的测试脚本。

  • Max_throughput(read):文件尺寸为64KB,100%读取操作,随机率为0%,用于检测磁盘系统的最大读取吞吐量

  • Max_IO(read):文件尺寸为512B,100%读取操作,随机率为0%,用于检测磁盘系统的最大读取操作IO处理能力

  • Max_throughput(write):文件尺寸为64KB,0%读取操作,随机率为0%,用于检测磁盘系统的最大写入吞吐量

  • Max_IO(write):文件尺寸为512B,0%读取操作,随机率为0%,用于检测磁盘系统的最大写入操作IO处理能力

  • SiSoftware.Sandra.Enterprise.v2007.5.10.98

  SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。今年该软件推出了2007版,该版本新增了4项基准测试,包括Power Management Efficiency、Memory Latency、Physical Disks和CD-ROM and DVD这四个项目。另外,它还对于原有的几个基准测试模块进行升级,比如在Arithmetic benchmarks中增加了对SSE3 & SSE4 SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,另外还升级了File System benchmark和Removable Storage benchmark两个子项目。对于新的硬件的支持当然也是该软件每次升级的重要内容之一。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台,这也是我们选择这款软件的原因之一。

  • WebBench v5.0

  WebBench是针对服务器作为Web Server时的性能进行测试,我们在被测服务器上安装了IIS6.0组件,以提供测试所需的Web服务。在测试中我们开启了网络实验室中的56台客户端,分别使用了WebBench 5.0内置的动态CGI以及静态页面脚本对服务器进行了测试。

  静态测试是由客户端读取预先放置在服务器Web Server下的Web页面(wbtree),这项测试主要考察的是服务器磁盘系统以及网络连接性能。我们使用了实验室中的56台客户端,配合Static_mt.tst多线程静态脚本测试向被测服务器发送请求。

  动态测试偏重于对服务器CPU子系统的性能测试,它对于Web服务器提供了足够的负载。我们将一个C语言编写的CGI源文件Simcigi.c编译为Simcgi.exe,并将其作为动态测试中的CGI脚本。在测试过程中,每台安装了WebBench客户端软件的PC,会在300秒的时间内持续向服务器发送CGI请求,而控制台会纪录并汇总服务器所响应CGI请求的数据。CGI测试的成绩高低,主要取决于服务器处理器子系统性能的优劣。处理器子系统包括CPU、内存以及内存控制器,CPU频率、缓存以及内存容量大小和内存带宽,都会影响该项成绩。

  • NetBench v7.03

  NetBench是针对文件服务器的性能测试软件,影响NetBench性能的主要是服务器的磁盘子系统,服务器磁盘控制器、条带大小、读写缓存、硬盘类型、组建磁盘阵列模式、内存容量、网络拓朴结构等都会对测试结果有明显的影响。我们在被测服务器上设立了文件服务器,NetBench通过网络实验室中60个客户端来模拟网络中的PC向文件服务器所发出的文件传输请求,文件服务器则将存储在磁盘上的文件数据发送给相应的客户端。在测试过程中,客户端会以每四台一组的步进依次增加并且向服务器发送文件传输请求,测试结束后控制台收集数据并绘制出服务器的数据传输变化曲线。

  • Benchmarkfactory 4.6

  大部分的服务器应用都同数据库有着密切的联系,因此我们今年开始着手在在服务器测试中加入对于数据库性能的测试。我们选择了Benchmark Factory 4.6软件和Microsoft SQL2000 SP4来测试不同的硬件平台在数据库应用中的表现。

  我们选择了BF内置的标准测试脚本AS3AP,这项测试可用于对于ANSI结构化查询语言(SQL)关系型数据库进行测试,它可用于测试DBMS(单用户微机数据库管理系统),也可用于测试高性能并行或者分布式数据库。

  • 系统功耗监测

  我们使用UNI-T UT71E智能数字万用表对于被测服务器系统的整体功耗进行了监测,利用随机附带的接口程序,我们可以记录被测服务器任意时间段内的功率变化。

  对比平台配置明细

  我们选择了如下几个平台做为对比平台。由于各个对比平台的处理器内存配置较为接近,具有一定的可比性,因此我们主要对比涉及系统计算能力的项目。而不同的系统的磁盘子系统、网络配置差异较大,并不在我们的对比范围之内。

  为了便于叙述,我们分别将各个测试平台简称如下:

  • Xeon 5120(本次浪潮NF280D服务器测试结果)

  • Xeon 5080

  • Xeon 5050

  • Paxville DP

  • Xeon LV

  • Opteron 270

Xeon 5080

主板

Gigabyte GA-7BESH-RH

芯片组

Intel 5000P+6321ESB

驱动程序

INF 7.3.1.1013

处理器

Intel Xeon 5080

主频

3.73GHz

FSB

1066MHz DIB

L2容量

2 x 2MB

处理器设置

XDbit Disable
EIST Disable
C1 State Disable
HyperThreading Disable

内存

三星512MB 1Rx8 PC2-4200F x8

内存时序

444-11

磁盘控制器

LSI Logic MegaRaid SAS 8408E RAID卡

硬盘

FUJITSU MAX3147RC x 4

驱动程序

1.17.0.32

磁盘设置

四块硬盘配置为RAID 5模式,磁盘分为两个分区,均为NTFS格式,系统默认簇,主分区20GB,其它分为扩展分区,共享文件夹、磁盘测试均在格式化后的扩展分区进行

操作系统

Microsoft Windows Server2003,5.02.3790,SP1

网卡

Intel Pro/1000EB Network Connection with I/O Acceleration

驱动程序

9.3.28.0(1/23/2006)

 

Xeon 5050

主板

Lenovo DPX1066

芯片组

Intel 5000V+ESB2

驱动程序

INF 7.3.1.1013

处理器

Intel Xeon 5050

主频

3.0GHz

FSB

667MHz DIB

L2容量

2 x 2MB

处理器设置

XDbit Disable
EIST Disable
C1 State Disable
HyperThreading Enable

内存

英飞凌HYS72T64000
512MB 1Rx8 PC4200-4200F

内存时序

444-10

磁盘控制器

LSI MegaRAID 320-0 零通道RAID卡

硬盘

FUJITSU MAT3073NC x 3

驱动程序

6.43.2.32(3/16/2004)

磁盘设置

三块硬盘配置为RAID 5模式,磁盘分为两个分区,均为NTFS格式,系统默认簇,主分区20GB,其它分为扩展分区,共享文件夹、磁盘测试均在格式化后的扩展分区进行

操作系统

Microsoft Windows Server2003,5.02.3790,SP1

网卡

Intel Pro/1000EB Network Connection with I/O Acceleration

驱动程序

9.3.28.0(1/23/2006)

 

Paxville DP

主板

ASUS PVL-D/SCSI

芯片组

E7520 + 6700PXH x2 + ICH5R

驱动程序

INF 7.3.1.1013

处理器

Intel Xeon 2.8GHz(Paxville DP核心)

主频

2.8GHz

FSB

800MHz

L2容量

2 x 2MB

处理器设置

XDbit Disable
EIST Disable
C1 State Disable
HyperThreading Enable

内存

三星 512MB 1Rx8 PC2-3200R-333-12-A3 x 4

内存时序

3-3-3-7 1CMD

磁盘控制器

板载AIC-7902 PCI-X Dual U320 SCSI控制器

硬盘

Seagate Cheetah 10k.7 ST373207LW x 2

驱动程序

Adaptec AIC-7902 HostRaid 1.2.63.0

磁盘设置

两款硬盘组建为RAID 1模式,磁盘分为两个分区,均为NTFS格式,系统默认簇,主分区20GB,其它分为扩展分区,共享文件夹、磁盘测试均在格式化后的扩展分区进行

操作系统

Microsoft Windows Server2003,5.02.3790,SP1

网卡

板载Broadcom BCM5721千兆网卡

驱动程序

8.27.1.0

 

Xeon LV

主板

Tiger i7520SD(S5363)

芯片组

Intel E7520+6300ESB

驱动程序

INF 7.3.1.1013

处理器

Intel Xeon LV

主频

2.00GHz

FSB

667MHz

L2容量

2MB(共享)

处理器设置

XDbit Disable
EIST Disable
C1 State Disable

内存

三星 512MB 1Rx8 PC2-3200R-333-12-A3 x 4

内存时序

3-3-3-7 1CMD

磁盘控制器

Adaptec ASR-2130SLP SCSI RAID卡

硬盘

Seagate Cheetah 10k.7 ST373207LW x 3

驱动程序

5.1.0.9114(03/27/2006)

磁盘设置

三块硬盘配置为RAID 5模式,磁盘分为两个分区,均为NTFS格式,系统默认簇,主分区20GB,其它分为扩展分区,共享文件夹、磁盘测试均在格式化后的扩展分区进行

操作系统

Microsoft Windows Server2003,5.02.3790,SP1

网卡

Intel PRO/1000 PT Dual Port Network

驱动程序

9.3.28.0(01/23/2006)

 

Opteron 270

主板 ASUS K8N-DRE
芯片组 NVIDIA nForce Professional 2200
驱动程序 Ver 6.66 for 32bit WHQL
处理器 AMD Opteron 270 x 2
主频 2.0GHz
HTT 200MHz
L2容量 1MB x 2
处理器设置 Cool''n''Quiet Disable
MPS 1.4 Enable
驱动程序 1.2.2.0
内存 Ramaxel 512MB DDR333 ECC REG x 4
内存时序 2.5-3-3-7 1CMD
磁盘控制器 nForce Pro 2200整合SATA控制器
硬盘 WDC WD800 80GB SATA
驱动程序 5.10.2600.534
磁盘设置 磁盘分为两个分区,均为NTFS格式,系统默认簇,主分区20GB,其它分为扩展分区
操作系统 Microsoft Windows Server2003,Enterprise Edition
网卡 板载Broadcom BCM5751千兆网卡
驱动程序 8.27.1.0

  处理器性能测试

SPECint
rate_base2000
平台 Xeon 5120 Xeon 5080 Xeon 5050 Paxville DP Xeon LV Opteron 270
开启线程数量

4

4 8 8 4 4
164.gzip 52.2 57.0 60.1 56.6 36.2 50.9
175.vpr 50.6 53.0 39.5 38.2 27.9 48.4
176.gcc 85.0 93.2 83.7 80.1 55.1 66.1
181.mcf 45.5 65.5 25.5 23.1  19.1 27.3
186.crafty 55.8 63.5 53.1 50.0 40.7 59.8
197.parser 62.4 69.9 65.7 63.1 35.5 54.5
252.eon 85.7 107.0 87.7 81.9 69.1 84.8
253.perlbmk 86.3 89.9 71.2 67.6 56.0 67.3
254.gap 69.0 81.7 61.6 56.3 41.1 63.1
255.vortex 115.0 130.0 104 105.0 65.0 92.8
256.bzip2 52.9 56.1 48.4 49.2 30.3 41.1
300.twolf 88.1 83.5 54.3 50.7 40.8 57.5
总分 68.0 76.3 59.2 56.4 40.5 56.9

 

SPECfp
rate_base2000
平台 Xeon 5120 Xeon 5080 Xeon 5050 Paxville DP Xeon LV Opteron 270
开启线程数量 4 4 8 8 4 4
168.wupwise 69.4 89.7 61.8

57.6

39.4 41.9
171.swim 37.9 49.0 30.7

22.6

16.8 28.3
172.mgrid 34.8 45.5 27.7

21.0

14.3 35.6
173.applu 37.2 46.1 29.3

21.7

17.6 30.0
177.mesa 81.5 73.3 59.3

57.7

49.7 42.4
178.galgel 151 149.0 61.8

53.5

51.5 69.1
179.art 113 104.0 40.1

34.4

31.3 32.3
183.equake 33.4 41.4 25.7

24.6

19.2 42.0
187.facerec 64.4 64.6 46.4

41.9

33.1 50.2
188.ammp 50.8 51.5 32.6

33.6

18.6 40.5
189.lucas 37.8 46.7 30.5

22.4

18.8 44.7
191.fma3d 41.5 49.9 33.8

28.5

20.9 40.0
200.sixtrack 33.5 33.6 33.7

32.3

15.0 24.9
301.apsi 46.6 52.3 49.7

45.4

25.9 45.0

总分

52.7 58.8 38.4

33.3

24.2 39.2

  整数性能测试中包括11个C程序和1个C++程序(252.eon),它们分别代表数据压缩(164、256)、电路布线(175)、C编译器(176)、 最低成本网络流解算机(181)、象棋模拟程序(186)、自然语言处理(197)、光线追踪(252)、Perl应用(253)、计算机群论(254)、面向对象的数据库应用(255)等应用。

  浮点性能测试中包含了14个程序,分别代表量子色动力学(168)、浅水模型(171)、3D势场多栅格解算器(172)、抛物/椭圆偏微分方程(173)、3D图形库(177)、流体动力学(178)、神经元网络(179)、有限元模拟:地震模型(183)、面部识别(187)、计算化学(188)、数论(189)、有限元模拟:碰撞(191)、粒子加速器(200)、污染物扩散(301)。

  采用了英特尔Xeon 5120处理器的浪潮NF280D服务器的SPEC CPU2000的测试结果好的令人吃惊,这个主频只有1.86GHz的处理器在Intel 5000P芯片组上释放出来巨大的能量。

  虽然Xeon 5120所采用的Core微架构同Xeon LV 2.0(Sossaman核心)是最为接近的,主频也大致相当(1.86GHz VS. 2.0GHz)但是更加优化的架构和更合理的运行平台(比如DIB总线),使得Xeon 5120的整数性能是Xeon LV的1.67倍,浮点性能更是Xeon LV的2.17倍!

  在Intel的一些宣传文档中(《从频率到能效 务实的Woodcrest》一文中引用了部分数据),主要将Xeon 5160处理器同双核Xeon 2.8GHz处理器(Paxville DP)的性能进行对比来显示新架构的给Xeon处理器所带来的优势。我们也将Xeon 5120和双核Xeon 2.8GHz处理器的性能进行了对比。Xeon 5120的整数性能是第一款双核Xeon处理器的1.2倍,浮点性能则是1.58倍(Intel公布的Xeon 5160处理器的浮点行是双核Xeon 2.8GHz的1.95倍),可见英特尔所言不虚。

  Xeon 5120同AMD Opteron 270(2GHz)主频也比较接近,因此两者的对比也比较有意义。从上面的表格来看,即便是主频为3.0GHz的Xeon 5050同Opteron 270相比也没有占到任何上风,但是Xeon 5120却取得了完全的领先,其整数性能是Opteron 270的1.2倍,浮点性能是Opteron 270的1.34倍。看来AMD需要加速其新一代Opteron的研发进程了,不能一拖再拖了。

  主频只有1.86GHz的Xeon 5120同主频高达3.73GHz的Xeon 5080相比,性能差距也不算很大,其整数性能和浮点性能比Xeon 5080仅低了约10%,而主频只有Xeon 5080的49%!

SiSoftware.Sandra.Enterprise.v2007.5.10.98

Processor Arithmetic
平台 Xeon 5120 Xeon 5080 Xeon 5050 Paxville DP Xeon LV Opteron 270
Dhrystone ALU(MIPS) 34567 32902 28717 32930 24610 29073
Whetstone iSSE3(MFLOPS) 23112 27524 36410 22931 20167 24515
Processor Multi-Media
Integer x8 iSSE2(it/s) 205123 85796 87718 80943 60349 75495
Floating-Point x4(it/s) 111132 97064 113162 106720 76092 81899

  SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,因此开启超线程技术比不开启超线程技术测试结果要高出30%左右,而两颗处理器的成绩比一颗处理器的成绩也会高出近1倍。我们将这项测试做为一项参考,并不做为主要考察不同被测对象的基准。

  Arithmetic测试结果显示Xeon 5120同其它对比平台的性能差距不大,而且其Dhrystone ALU测试结果还是最高的。在Multi-Media测试结果中,Xeon 5120的测试结果更是“疯狂”,Integer x8 iSSE2几乎是其它平台测试结果的2-3倍,而Floating-Point x4测试结果也超过了大部分其它平台。

  缓存内存性能测试

ScienceMark Membench

平台 Xeon 5120 Xeon 5080 Xeon 5050 Paxville DP Xeon LV Opteron 270
L1带宽 52358.39 - - - 25050.18 23044.12
L2带宽 15683.28 - - - 12543.13 7311.76

内存带宽(MB/s)

2918.25

3573.56 2283.58 3703.52 3202.20 4243.7

L1 Cache Latency (ns)

32 Bytes Stride

1.61

1.07 1.34 1.43 1.50 1.5

L2 Cache Latency(ns)

4 Bytes Stride

1.61 1.07 1.34

 2.21

1.50 1.5

16 Bytes Stride

2.14 2.15 2.67

 4.64

2.50 2.5

64 Bytes Stride

5.89 7.25 9.02

10.36

7.00 8.5

256 Bytes Stride

6.43 6.98 8.69

10.36

7.00 6.5

512 Bytes Stride

6.43 6.71 8.35

10.00

7.00 6.5

Memory Latency(ns)

4 Bytes Stride

1.61 1.34 1.67

  3.21   

2.00 2

16 Bytes Stride

2.14 4.83 6.68

  5.71

7.00 7.5

64 Bytes Stride

6.96 18.53 27.07

 16.78

28.50 28

256 Bytes Stride

7.50 135.34 179.11

128.21

123.49 69

512 Bytes Stride

8.04 142.06 189.8

134.63

122.49 70.5

Algorithm Bandwidth(MB/s)

Compiler

2068.71 2753.82 1771.21

1914.36

1603.90 1765.82

REP MOVSD

2086.7 2789.13 1796.07

1950.86

1621.81 1758.61

ALU Reg Copy

2019.78 2652.54 1751.59

1746.1

1321.41 1811.95

MMX Reg Copy

2046.38 2791.96 1794.26

1903.61

1364.01 1899.24

MMX Reg 3dNow

- - -

-

- 3290.3

MMX Reg SSE

2906.74 3573.56 2283.58

2712.14

2695.34 3623.76

SSE PAlign

2897.37 3554.13 2272.72

3066.42

2834.36 2875.31

SSE PAlign SSE

2918.25 3561.63 2281.81

3012.8

2624.56 3624.98

SSE2 PAlign

2888.73 3551.91     2271.43

3066.15

2807.56 2876.13

SSE2 PAlign SSE

2917.67 3561.73 2280.69

3010.93

2641.72 3623.51

MMX Block 4kb

2460.69 3336.38 3163.14

3098.21

2889.96 3677.91

MMX Block 16kb

2663.69 3442.12 2212.04

3622.71

3176.61 4041.21

SSE Block 4kb

2452.03 3353.61 2174.46

3292.47

2910.25 3854.69

SSE Block 16kb

2668.89 3446.63 2204.89

3703.52

3202.20 4243.7

  L1缓存同处理器主频同频,因此它的延迟主要受到处理器主频、数据通道接口位宽的影响,从上表可知主频为3.73GHz的Xeon 5080 L1缓存延迟约为1.07ns,而主频为1.86GHz的Xeon 5120的L1缓存延迟则约为1.61ns。由于这项测试无法测试Netburst微架构的处理器的L1/L2带宽,因此我们只能对于Xeon 5120、Xeon LV 2.0GHz和Opteron 270进行对比。从测试结果来看,Xeon 5120 L1缓存带宽是另外两个的2倍。(Xeon 5120中执行资源到L1数据缓存的通道位宽为128bit,而Xeon LV则是64bit,两者主频相当,因此测试数据与之吻合。不过,我们无法确认Opteron的该项参数,否则可进一步确认该结论)

  L2缓存也同处理器主频同频,它的延迟除了受到主频的影响之外,还同L2缓存的结构(比如独立还是共享)、算法有关、数据通道接口位宽。从测试结果来看,共享二级缓存架构的处理器相对于独享二级缓存架构的处理器具有一定的优势——Xeon 5080凭借着3.73GHz的主频同其它共享二级缓存架构的处理器持平。

  虽然不同的平台所采用的内存类型、时序、容量都不完全相同,但是Xeon 5120平台的内存延迟明显的低于其它的平台,不过这些优势并没有在内存带宽测试中体现出来。

  Algorithm Bandwidth部分的测试结果反应了不同的处理器在处理针对不同的指令集优化的软件时的表现,Xeon 5080凭借着其高主频和4通道内存配置在6个项目中取得了第一,在7个项目中取得了第二。Opteron 270则在8个项目中取得了第一。而Xeon 5120在前4项测试中取得了第二成绩。

SiSoftware.Sandra.Enterprise.v2007.5.10.98

平台 Xeon 5120 Xeon 5080 Xeon 5050 Paxville DP Xeon LV Opteron 270
Memory Bandwidth
RAM Int Buff iSSE2(MB/s) 4152 5216 3336

3411

3259

8425

RAM Float Buff iSSE2(MB/s) 4158 5213 3338

3421

3272

8406

Memory Latency
Random Access 
1kB 1.6 1.1 1.4 - 1.5 1.5
4kB 1.6 1.1 1.4 - 1.5 1.5
16kB 1.6 1.2 1.5 - 1.5 1.5
64kB 7.6 7.6 9.4 - 7.0 1.5
256kB 8.4 7.6 9.5 - 7.0 8.6
1MB 8.6 15.1 18.9 - 8.3 11.2
4MB 14.4 109 145.0 - 83.8 97.6
16MB 118.5 145.1 191.7 - 115.5 102.4
64MB 134.9 155.1 205.0 - 121.5 108.5
Linear Access
1kB 1.6 1.1 1.4 - 1.5 1.5
4kB 1.6 1.1 1.4 - 1.5 1.5
16kB 1.6 1.2 1.5 - 1.5 1.5
64kB 6.6 7.6 9.4 - 7.0 1.5
256kB 6.6 7.6 9.4 - 7.0 8.6
1MB 6.6 7.7 9.7 - 7.1 8.6
4MB 7.3 18.8 27.5 - 28.8 28
16MB 25.5 18.9 27.6 - 29.0 28
64MB 25.6 18.9 27.5 - 29.0 28
Cache and Memory(MB/s)
2KB 169224  231224 183580 10210 93979 81770
4KB 212754 239076 190065 37519 104009 78787
8KB 226392 179823 143786 33837 106945 77982
16KB 236478 175076 139958 34569 110788 81218
32KB 234714 170846 136540 35837 109814 81931
64KB 222290 155952 124609 31268 105650 79351
128KB 173958 126491 101256 25359 85798 69673
256KB 69226 127008 101868 25266 53855 62682
512KB 68656 126246 101100 25254 53103 48378
1MB 65802 118893 95312 25009 46464 39154
4MB 54043 95930 76271 24883 19709 21975
16MB 7008 6669 4194 11281 2520 6607
64MB 4703 6163 3811 2371 2197 6541
256MB 4430 5839 3629 2370 2078 6225
1GB 3544 4679 2903 2199 1658 4978

  从SiSoft Sandra 2007的内存带宽测试结果分析,处理器主频、前端总线带宽都会对于内存带宽测试产生较为明显的影响,这种趋势也体现在了内存延迟测试、缓存和内存带宽测试部分。

  磁盘性能测试

IOMeter 2004.7.30

读取IO性能(IOps)

Queue Depth

 

1 9695.9
2 16565.7
4 27186.3
8 41271.6
16 52838.9
32 60150.0
64 71374.2
128 72369.8
256 69923.9

读取吞吐量(MBps)

Queue Depth  
1 149.4
2 147.4
4 149.3
8 150.5
16 150.1
32 152.8
64 156.7
128 152.6
256 156.0

写入IO性能(IOps)

Queue Depth  
1 3267.0
2 5861.9
4 7204.9
8 10828.5
16 11812.8
32 17804.4
64 19768.5
128 48855.4
256 56767.7

写入吞吐量(MBps)

Queue Depth  
1  9.1
2 20.8
4 27.5
8 48.3
16 88.5
32 82.8
64 80.2
128 94.4
256 77.8

  浪潮NF280D服务器送测样机配置了LSI Logic MegaRAID SAS 8308ELP扩展卡和三块Maxtor ATLAS 10k V 147GB SAS硬盘,我们将其配置为RAID 5模式,条带大小为64KB,Read=Normal,Write=BadBBU。磁盘分为两个分区,均为NTFS格式,系统默认簇,主分区20GB,其它分为扩展分区。然后我们利用IOMeter在扩展分区上建立8000000个扇区的测试文件(4GB)。

  测试结果显示当Queue Depth为128时,读取IO处理能力达到了72369.8 IOps,此时处理器占用率在30%左右,大部分工作由RAID卡上的Intel IOP333 I/O处理器承担了。写入IO处理能力达到了56767 IOps,此时处理器占用率在24%左右。该磁盘子系统的读取吞吐量可达156MB/s,写入吞吐量可达94MB/s。

  文件服务器性能测试

  浪潮NF280D服务器主板采用了板载了HY82563EB双端口千兆网卡控制器,安装驱动之后,在操作系统中的名称是“Intel PRO/1000 EB Network Connection with I/O Acceleration”,我们对于其中任意一个端口的性能进行了测试,在传输不同容量文件的时候,平均吞吐量均在900Mbps左右,此时CPU占用率只有13%左右,相对于没有开启I/O AT功能时降低了20-30%。

  运行Ent_dm.tst测试脚本期间,不同数量的客户端要对于文件服务器进行频繁的读取和写入动作。测试结果显示当12个客户端同时接入被测服务器时,吞吐量达到了峰值418Mbps——就这款服务器的磁盘子系统的硬件配置来看,这个成绩并不理想。

  Web服务器性能测试

  我们利用60个客户端向被测服务器发送静态页面请求,服务器峰值处理能力为18208 Requests/s。此时,数据吞吐量只有110MB/s左右,远没有达到磁盘吞吐量的上限,因此被测服务器的静态请求处理能力主要受到了千兆网卡吞吐量的限制。这个成绩同以往对于配置了千兆网卡的服务器的测试相当。

  在进行动态CGI测试时,吞吐量远没有达到被测服务器网卡的吞吐量上限,因此测试结果可以反映处理器、内存等部分的性能。从测试结果来看,响应动态CGI请求的峰值能力达到了6829 Requests/s,在所有6个被测平台中,Xeon 5120平台的性能位居第二,仅比Xeon 5080低5%,比Opteron 270平台高3%,远远的领先于剩余的三个平台。

  数据库性能测试

  我们在被测服务器上安装了Microsoft SQL 2000 SP4,按照测试要求建立了数据库。BF在测试之前会在数据库中生成9个表,其中包括4个500万行的表格,每行包括100字节的数据,因此每个表格容量大约是476MB,整个数据库容量为1.86GB。我们用60个客户端模拟800个用户,并且以8个一组依次增加,在这个数据库中进行查询、添加、删除、修改等操作。在测试期间,数据的吞吐量很小,因此磁盘吞吐量和网络吞吐量都不会成为瓶颈。

  由于这是一项我们新加入的测试,数据积累不多,因此我们仅仅对比了Xeon 5120平台和Opteron 270平台的测试数据。需要说明的是,Xeon 5120测试过程中我们启用了1600个虚拟用户,Opteron270测试过程中启用了800个虚拟用户,但是由于数据峰值均出现在400个虚拟用户之前,因此对于测试结果并没有影响。

  Opteron 270平台的测试曲线比较平滑,峰值出现在360个用户同时接入时,为40410 Tps,而Xeon 5120平台的测试曲线前半部分波动比较大,峰值出现在296个用户同时接入时,为82061 Tps。从曲线的走势上看,当用户数量增加到600个以上,两个平台的性能开始逐渐接近,Xeon 5120略高,为45000-42000 Tps,Opteron 270则为40000 Tps左右。

  系统功率

功率监控程序界面

  我们主要对于被测服务器在几种不同的状态下的功耗进行了监测,主要包括如下项目:

  • 未加电至加电状态

  • 加电不开机状态

  • 系统启动过程

  • 系统启动完毕,无动作

  • 系统启动完毕,处理器满载、硬盘工作

  我们利用UNI-T UT71E智能数字万用表和相配套的软件对于浪潮NF280D服务器的整个系统的功率进行监测,整个监测过程近1个小时,每秒钟采样一次。我们挑选了其中的30点来形成了上面的图标。

  S1点是我们按下服务器所连接的电源插座的按钮时的功率,大约在60W左右,随后系统所消耗的功率趋于平缓,基本稳定在25瓦左右(S3-S8)。S9电是我们按下服务器Power按钮瞬间的情况,S9-19之间代表了系统启动过程中的主要功率情况,可以看到在系统系统过程中功率的波动比较大,大致范围是在250-310瓦之间。系统启动成功之后,没有任何动作,也不进入休眠状态下功率大约在265瓦左右。随后我们同时启动了SPEC CPU2000和IOMeter,让CPU处于满载状态,磁盘处于尽可能活动的状态,此时整个系统的功率并不高,315瓦左右。之前我们曾经测试过双Xeon 3.0GHz(Irwindale核心)服务器的功率在370瓦左右,基于Bensley平台的服务器的确在功耗方面取得了明显的改进。

  IT168评测中心观点

  做为“浪潮倍速”计划的重要成员,NF280D服务器首先需要带给用户“倍速产品”的体验。我们的测试结果显示该服务器具有相当优异的性能。比如SPEC CPU2000浮点性能测试结果显示主频只有1.86GHz的Xeon 5120处理器的性能是主频为双核2.8GHz的Xeon 2.8GHz处理器的1.58倍!Xeon 5120的Web服务器性能是双核Xeon 2.8GHz的1.4倍!数据库性能更是竞争对手Opteron 270的2倍!

  能帮助浪潮NF280D服务器取得明显性能提升的因素除了基于Woodcrest核心的双核Xeon 5100系列处理器之外,还有整体更加平衡、技术更加先进的Benlsey平台。其中的双独立总线设计大大缓解了处理器和芯片之间的带宽瓶颈,串行理念的FB-DIMM内存技术可提供给服务器更大的容量、更高带宽的内存,着眼于整个系统的I/O AT技术在有效提升系统I/O能力的同时可明显的降低对于处理器资源的占用。之前我们对于浪潮NF380D服务器测试时,就已经看到这个平台为服务器整体性能提升所发挥的巨大作用。新的Xeon 5100处理器在这个平台上所迸发出来的能量,更证明了这个平台优秀。

  浪潮独有的IFA+智能弹性架构进一步增强了其服务器的可靠性、可管理性等方面。比如浪潮通过应用增强型应变散热系统、智能电源切换技术来提供更高的可靠性,而通过提供睿捷管理套件(蓝海豚导航软件、猎鹰服务器管理软件)配合远程管理技术大大降低了系统维护的难度和工作量。

  附录:浪潮倍速计划概要

浪潮倍速计划

倍速产品 IFA+智能弹性架构是核心,在之前的IFA智能弹性架构的基础上,除了从单核升级到双核,还应用了诸多新技术,包括:
  • 可信智能方面:增强型应变散热系统、智能电源切换
  • 可管理智能方面:睿捷管理套件、即时远程管理技术、光路诊断技术、虚拟技术
  • 可用智能方面:FB-DIMM内存、I/O AT等
倍速生态链 与英特尔、EMC、微软、SPA、甲骨文等上游合作伙伴加强合作
倍速服务 提供针对性行业应用解决方案、平台优化测试以及平台迁移服务
倍速普及 进行“百城巡展”,进行大规模市场推广、渠道培训和促销等。

 

0
相关文章