服务器 频道

同方超强 TP320-5110 服务器评测

  优点

  • 良好的扩展性,支持主流扩展卡、最大可安装8个硬盘

  • 双千兆网卡,性能优秀

  • 较好的发挥了Bensley平台的性能和特性

  缺点

  • 未提供完善的服务器管理维护工具

  价格

  IT168评测中心】超强TP320系列服务器是清华同方推出的基于英特尔Bensley平台的产品。这个系列的产品被设计为可应用于中大规模千兆网络中,可承担数据库服务器、频点播服务器等应用,也可用于政府信息化建设、教育城域网/校园网等领域,经过合理的配置也能满足中心企业核心业务的需求。

  超强TP320系列服务器根据所采用处理器型号不同又细分为多个子型号,比如清华同方先期推出的TP320 5050服务器和这次送测的TP320 5110服务器。

  TP320 5110服务器为塔式结构,外观尺寸为620mm(高)×220mm(宽)×425mm(深)。机箱的前面板通过两个安全锁固顶,在取下面板之前,用户只能操作电源按钮和复位按钮,可以观察电源指示灯、磁盘活动指示灯、网卡状态指示灯和风扇故障指示灯的状态。

  如果要使用光驱、软驱、安装或者拆卸硬盘乃至使用前置USB端口都需要取下前置面板——而且侧面板的固顶螺丝也处于前面板的保护之下。这样的设计可以避免非授权用户操作服务器,从而保证服务器的正常运行和数据安全。

  TP320 5110服务器背面提供了1个PS/2鼠标接口、1个PS/2键盘接口、2个USB接口、2个千兆铜缆接口、1个串口和1个VGA接口,每个接口旁边都有形象的标识。机箱上还提供了7个扩展卡插槽位置,并且已经安装了两个扩展卡。

  送测样机中配置了一个550W服务器电源。用户可以根据需要,选配650W 2+1热插拔冗余电源。

  TP320 5110服务器机箱内非常的宽敞,前面部分主要用于安装存储器,它最多可安装3个5.25英寸设备(样机中预装了1个CD-ROM驱动器),预装了一个硬盘托架,可安装4块SCSI硬盘,用户如果需要可以通过增加硬盘托架,在服务器内安装更多的硬盘。软驱的位置比较巧妙,不会占用5.25英寸设备的位置。

  机箱内提供了3风扇,其中两个前置,一个后置。为了安全起见,机箱盖的拆卸需要工具,但是系统风扇的装卸、光驱软驱的装卸都无需工具(在机箱中所有绿色的部件都是可免工具维护的)。

  机箱内的线缆捆扎较为整齐,并且都至于风道之外,确保了机箱内气流不会受到阻碍。

  清华同方TP320 5110服务器采用了华硕DSBF主板,我们IT168评测中心于8月份推出了DSBF-D/SAS主板的国内首个评测报告(《华硕DSBF-D/SAS服务器主板首测——基于Bensley平台的支持众多新技术的服务器主板》),该文对于这个系列的主板进行详细的介绍和评测。

  DSBF服务器主板采用了英特尔5000P芯片组,包括5000P MCH北桥芯片、6321ESB I/O控制器和6702PXH 64-bit PCI Hub芯片。因此清华同方TP320 5110服务器可以支持双路双核Xeon 5000/5100系列处理器,本次测试的样机配置了两颗Xeon 5110处理器,其主频为1.6GHz,1066MHz FSB,共享4MB二级缓存。清华同方为处理器安装了主动式散热器,

  清华同方服务器提供了8条240-pin FB-DIMM插槽,可支持Registered ECC全缓冲DDR2-533/DDR-667内存模组。根据内存模组的容量不同,基于该主板的系统可配置256MB-32GB的内存。在5000P芯片组集成的内存控制器的支持下,其内存可配置为4通道模式,理论上最高可提供21GB/s的内存带宽。另外,该服务器还支持内存冗余和内存镜像技术,进一步确保整个平台的可靠性和稳定性。

  送测样机中配置了4条Ramaxel 1GB 2Rx8 PC2-4200R-444 FB-DIMM内存。在我们过去的测试中发现,FB-DIMM内存的功耗相当的大,因此新一代的Xeon服务器在散热设计上不但要满足处理器的要求,还要确保FB-DIMM能够稳定工作。

  清华同方TP320 5110服务器的扩展性相当的出色,它提供了1条PCI Express x16插槽(x8 Link)、1条PCI Exress x8插槽(x8 Link)、2条PCI-X 133/100/66MHz、1条PCI 33MHz/32bit/5V插槽、1条PCI-X 133/100/66MHz插槽(可支持零通道RAID卡)、1条DDR SO-DIMM插槽(可支持ASUS 3系列服务器管理卡)。

  清华同方TP320 5110服务器所采用的主板没有板载SCSI/RAID控制器,但是提供了6个SATA II接口,可以支持RAID0/1/10等磁盘阵列模式。送测样机中通过安装了一张华硕ASUS PXL-S30R(LSILOGIC 1030)双通道SCSI控制卡提供了对于SCSI设备的支持,该卡采用了LSI 53C1030控制器芯片,可支持RAID 0/1等基本磁盘阵列模式。

  服务器利用Intel 82563EB双端口PHY芯片,配合6321ESB所整合的双千兆网卡控制器,提供了双千兆网卡,可支持负载平衡和冗余功能。配合Intel I/O AT技术,在提升I/O吞吐量的同时,可有效的降低对于处理器资源的占用。

 

  测试平台和测试方法

清华同方TP320 5110服务器配置

主板

ASUS DSBF-D

芯片组

Intel 5000P

驱动程序

INF 8.1.1.1001

处理器

Intel Xeon 5110 x2(Woodcrest)

主频

1.60GHz

FSB

1066MHz

L2容量

4MB(共享)

处理器设置

XDbit Disable
EIST Disable
C1 State Disable

内存

Ramaxel 1GB 2Rx8 PC2-4200R-444

SPD 266MHz 4-4-4-12
总容量 1GB x 4
配置 4通道 Interleave

磁盘控制器

ASUS PXL-S30R(LSILOGIC 1030)

硬盘

FUJITSU MAT3073NC(73GB SCSI)

驱动程序

5.2.3790.1830(10/1/2002 )

磁盘设置

2块硬盘组建为RAID 1模式,磁盘分为两个分区,均为NTFS格式,系统默认簇,主分区20GB,其它分为扩展分区,共享文件夹、磁盘测试均在格式化后的扩展分区上进行

操作系统

Microsoft Windows 2003 Enterprise Server R2 5.02.3790 (Service Pack 1)

网卡

Intel PRO/1000 EB Network Connection with I/O Acceleration

驱动程序

9.3.39.0(4/3/2006)

  我们在上述配置的服务器上分别安装了Microsoft Windows 2003 Enterprise Server R2 5.02.3790 (Service Pack 1),正确安装了各个硬件的驱动程序,确保服务器工作在非常好的的状态。

  我们所使用的评测项目如下:

  • SPECCPU2000 v1.2

  SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。

  SPEC CPU2000是SPEC组织推出的一套CPU子系统评估软件,它包括CINT2000和CFP2000两个子项目,前者用于测量和对比整数性能,而后者则用于测量和对比浮点性能。计算系统中的处理器、内存和编译器都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2000的影响非常的小。

  SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、DCC以及科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。

  我们在被测服务器中安装了Intel C++ 8.1 Compiler、Intel Fortran 8.1 Compiler这两款SPEC CPU2000必需的编译器,另外安装了Microsoft Visual Studio 2003.net提供必要的库文件。按照SPEC的要求我们根据自己的情况编辑了新的Config文件,可以满足Base测试。然后我们根据被测系统实际可同时处理的线程数量,设定用户数量,分别运行SPEC base和SPEC rate base测试的结果(其中SPEC base代表系统执行某个任务的速度,而SPEC base rate测试代表系统可以同时处理任务的能力)。

  • ScienceMark v2.0 Membench

  ScienceMark v2.0是一款用于测试系统特别是处理器在科学计算应用中的性能的软件,MemBenchmark是其中针对处理器缓存、系统内存而设计的功能模块,它可以测试系统内存带宽、L1 Cache延迟、L2 Cache延迟和系统内存延迟,另外还可以测试不同指令集的性能差异。

  • IOMeter 2004.7.30

  IOMeter是一款功能非常强大的IO测试软件,它除了可以在本机运行测试本机的IO(磁盘)性能之外,还提供了模拟网络应用的能力。在这次的测试中,我们仅仅让它在本机运行测试服务器的磁盘性能。为了全面测试被测服务器的IO性能,我们分别选择了不同的测试脚本。

  • Max_throughput(read):文件尺寸为64KB,100%读取操作,随机率为0%,用于检测磁盘系统的最大读取吞吐量

  • Max_IO(read):文件尺寸为512B,100%读取操作,随机率为0%,用于检测磁盘系统的最大读取操作IO处理能力

  • Max_throughput(write):文件尺寸为64KB,0%读取操作,随机率为0%,用于检测磁盘系统的最大写入吞吐量

  • Max_IO(write):文件尺寸为512B,0%读取操作,随机率为0%,用于检测磁盘系统的最大写入操作IO处理能力

  • SiSoftware.Sandra.SP1 v2007

  SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。今年该软件推出了2007版,该版本新增了4项基准测试,包括Power Management Efficiency、Memory Latency、Physical Disks和CD-ROM and DVD这四个项目。另外,它还对于原有的几个基准测试模块进行升级,比如在Arithmetic benchmarks中增加了对SSE3 & SSE4 SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,另外还升级了File System benchmark和Removable Storage benchmark两个子项目。对于新的硬件的支持当然也是该软件每次升级的重要内容之一。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台,这也是我们选择这款软件的原因之一。

  • WebBench v5.0

  WebBench是针对服务器作为Web Server时的性能进行测试,我们在被测服务器上安装了IIS6.0组件,以提供测试所需的Web服务。在测试中我们开启了网络实验室中的56台客户端,分别使用了WebBench 5.0内置的动态CGI以及静态页面脚本对服务器进行了测试。

  静态测试是由客户端读取预先放置在服务器Web Server下的Web页面(wbtree),这项测试主要考察的是服务器磁盘系统以及网络连接性能。我们使用了实验室中的56台客户端,配合Static_mt.tst多线程静态脚本测试向被测服务器发送请求。

  动态测试偏重于对服务器CPU子系统的性能测试,它对于Web服务器提供了足够的负载。我们将一个C语言编写的CGI源文件Simcigi.c编译为Simcgi.exe,并将其作为动态测试中的CGI脚本。在测试过程中,每台安装了WebBench客户端软件的PC,会在300秒的时间内持续向服务器发送CGI请求,而控制台会纪录并汇总服务器所响应CGI请求的数据。CGI测试的成绩高低,主要取决于服务器处理器子系统性能的优劣。处理器子系统包括CPU、内存以及内存控制器,CPU频率、缓存以及内存容量大小和内存带宽,都会影响该项成绩。

  • NetBench v7.03

  NetBench是针对文件服务器的性能测试软件,影响NetBench性能的主要是服务器的磁盘子系统,服务器磁盘控制器、条带大小、读写缓存、硬盘类型、组建磁盘阵列模式、内存容量、网络拓朴结构等都会对测试结果有明显的影响。我们在被测服务器上设立了文件服务器,NetBench通过网络实验室中60个客户端来模拟网络中的PC向文件服务器所发出的文件传输请求,文件服务器则将存储在磁盘上的文件数据发送给相应的客户端。在测试过程中,客户端会以每四台一组的步进依次增加并且向服务器发送文件传输请求,测试结束后控制台收集数据并绘制出服务器的数据传输变化曲线。

  • Benchmarkfactory 4.6

  大部分的服务器应用都同数据库有着密切的联系,因此我们今年开始着手在在服务器测试中加入对于数据库性能的测试。我们选择了Benchmark Factory 4.6软件和Microsoft SQL2000 SP4来测试不同的硬件平台在数据库应用中的表现。

  我们选择了BF内置的标准测试脚本AS3AP,这项测试可用于对于ANSI结构化查询语言(SQL)关系型数据库进行测试,它可用于测试DBMS(单用户微机数据库管理系统),也可用于测试高性能并行或者分布式数据库。

  • 系统功耗监测

  我们使用UNI-T UT71E智能数字万用表对于被测服务器系统的整体功耗进行了监测,利用随机附带的接口程序,我们可以记录被测服务器任意时间段内的功率变化。

  处理器性能测试

SPECint
rate_base2000
开启线程数量 4
164.gzip 42.3
175.vpr 44.6
176.gcc 68.2
181.mcf 38.7
186.crafty 42.5
197.parser 50.9
252.eon 73.3
253.perlbmk 67.5
254.gap 46.8
255.vortex 103.0
256.bzip2 40.8
300.twolf 76.2
总分 55.2

 

SPECfp
rate_base2000
开启线程数量 4
168.wupwise 71.9
171.swim 36.3
172.mgrid 34.4
173.applu 32.3
177.mesa 69.9
178.galgel 131.0
179.art 114.0
183.equake 37.0
187.facerec 62.3
188.ammp 45.6
189.lucas 35.4
191.fma3d 41.4
200.sixtrack 28.7
301.apsi 41.1

总分

49.7

  整数性能测试中包括11个C程序和1个C++程序(252.eon),它们分别代表数据压缩(164、256)、电路布线(175)、C编译器(176)、 最低成本网络流解算机(181)、象棋模拟程序(186)、自然语言处理(197)、光线追踪(252)、Perl应用(253)、计算机群论(254)、面向对象的数据库应用(255)等应用。

  浮点性能测试中包含了14个程序,分别代表量子色动力学(168)、浅水模型(171)、3D势场多栅格解算器(172)、抛物/椭圆偏微分方程(173)、3D图形库(177)、流体动力学(178)、神经元网络(179)、有限元模拟:地震模型(183)、面部识别(187)、计算化学(188)、数论(189)、有限元模拟:碰撞(191)、粒子加速器(200)、污染物扩散(301)。

  清华同方TP320 5110服务器的浮点性能和整数性能分别是49.7分和55.2分——之前我们仅测试过双Xeon 5120配置,其性能差异基本上同处理器主频差异成正比,可以判断该服务器处理器计算性能也到了同类产品的水平。

SiSoftware.Sandra.Enterprise.v2007 Sp1

Processor Arithmetic
Dhrystone ALU(MIPS) 29525
Whetstone iSSE3(MFLOPS) 20261
Processor Multi-Media
Integer x8 iSSE4(it/s) 175017
Floating-Point x4(it/s) 94919

  Sisoftware Sandra 2007处理器测试包括算术运算性能测试和多媒体运行性能两个部分,两颗Xeon 5110处理器的Dhrystone ALU得分达到了29525 MIPS,Whetstone iSSE3得分达到了20261 MFLOPS,Integer x8 iSSE4得分为175017 it/s,Floating-Point x4得分为94919 it/s,该得分正好是单颗Xeon 5110处理器性能的1倍——这说明Intel Bensley平台具有很好的线性扩展性能。

  缓存内存性能测试

ScienceMark Membench

L1带宽 44446.48
L2带宽 13330.29

内存带宽(MB/s)

3083.95

L1 Cache Latency (ns)

32 Bytes Stride

1.88

L2 Cache Latency(ns)

4 Bytes Stride

1.88

16 Bytes Stride

2.51

64 Bytes Stride

7.52

256 Bytes Stride

7.52

512 Bytes Stride

7.52

Memory Latency(ns)

4 Bytes Stride

1.88

16 Bytes Stride

2.51

64 Bytes Stride

7.52

256 Bytes Stride

8.77

512 Bytes Stride

9.4

Algorithm Bandwidth(MB/s)

Compiler

2308.04

REP MOVSD

2334.38

ALU Reg Copy

2192.87

MMX Reg Copy

2254.39

MMX Reg 3dNow

-

MMX Reg SSE

3067.99

SSE PAlign

3036.04

SSE PAlign SSE

3083.95

SSE2 PAlign

3023.02

SSE2 PAlign SSE

3072.07

MMX Block 4kb

2539.84

MMX Block 16kb

2703.70

SSE Block 4kb

2500.15

SSE Block 16kb

2707.09

  虽然同方TP320 5110采用了4通道FB-DIMM内存,但是ScicenMark v2.0 Membench的测试结果并不能很好的体现其带宽优势,测试结果显示其内存带宽为3083MB/s。在Algorithm Bandwidth测试中,不同算法应用下的带宽测试结果也比较平均。

  从ScicenMark v2.0 Membench延迟测试数据上来看,新的Bensley平台的内存延迟有了飞跃式的改进,从4Bytes Stride到512Bytes Stride测试的内存延迟都在10ns一下,而之前的E7520/7320平台的内存延迟100ns以上。

SiSoftware.Sandra.Enterprise.SP1 v2007

Memory Bandwidth
RAM IntBuff iSSE2(MB/s) 4042
Assignment   3729
Scaling 3737
Addition 4353
Triad 4351
RAM FloatBuff iSSE2(MB/s) 4047
Assignment 3753
Scaling 3739
Addition 4346
Triad 4352

  Sisoft Sandra 2007内存带宽测试结果显示整数应用带宽和浮点应用带宽都在4000MB/s以上。  

  SiSoftwaren Sandra 2007可以测试缓存内存子系统的随机访问延迟时间和线性访问延迟时间,从上图来看当测试数据块小于32KB的时候(大约小于L1缓存容量),无论是随机还是线性测试其延迟都在2ns左右;当测试数据块小于4MB的时候(大约小于L2缓存容量),其延迟时间也非常的接近,在7-9ns之间;当数据块容量超过4MB之后,随机访问延迟时间明显的提升,达到了120-140ns之间,而现象访问延迟时间还能维持在较为理想的26ns左右。

  Cache and Memory测试结果以带宽为单位显示了缓存和内存的性能。当测试数据块小于等于64KB时,带宽维持在150000-200000MB/s之间,此值可认为是L1带宽;当测试数据块小于4MB大于256KB时,带宽维持在50000MB/s以上,此值相当于L2带宽;当测试数据块大于16MB时,测试带宽在3500-4700MB/s之间,同之前的内存带宽测试结果是相符的。

  磁盘性能测试

  清华同方TP320 5110服务器的磁盘子系统由PXL-S30R SCSI卡和2块FUJITSU MAT3073NC硬盘(10000RPM,73GB)组成,我们将它们配置为RAID 1磁盘阵列模式。从测试曲线来看,其读取IO性能相当的出色,达到了23958 IOps,但是写入IO性能很一般,只能维持在1200 IOps左右。

  在Queue Depth小于8时,该磁盘子系统的读取吞吐量和写入吞吐量都维持在一个相对较低的水平上。当Queue Depth大于8时,读取吞吐量可以达到114MB/s,而写入吞吐量也能达到76MB/s。

  文件服务器性能测试

  清华同方TP320 5110服务器采用了Intel PRO/1000 EB Network Connection with I/O Acceleration网卡,该网卡是由ESB6321芯片和板载双Intel 82563EB双端口PHY芯片共同组成的。测试结果显示其吞吐量在887-901Mbps之间,具有较高的性能。

  NetBench 7.03 Ent_dm.tst测试脚本模拟的是企业级文件服务器应用,测试结果显示其吞吐量可以达到272Mbps(28个客户端接入时)。从其吞吐来看,这个数值既没有达到千兆网卡的吞吐量上限,也没有达到磁盘子系统的吞吐量上限,唯一合理的解释就是其磁盘子系统的IO能力此时成为了瓶颈。就这款服务器的磁盘子系统配置而言,达到了同级别产品的水平。

  Web服务器性能测试

  Web服务器测试分为静态应用测试和动态应用测试,IO能力对于静态应用的性能有明显的影响,而处理器计算能力、缓存内存效能则对于动态应用的性能有明显影响。从测试曲线来看,这台服务器静态响应可达到每秒18100个以上,此时数据吞吐量已经达到了千兆以太网的上限,其动态响应峰值为6254 Requests Per Second,远远超过了上一代平台的主流配置的性能。

  数据库服务器性能测试

  我们在被测服务器上安装了Microsoft SQL 2000 SP4,按照测试要求建立了数据库。BF在测试之前会在数据库中生成9个表,其中包括4个500万行的表格,每行包括100字节的数据,因此每个表格容量大约是476MB,整个数据库容量为1.86GB。我们用60个客户端模拟800个用户,并且以8个一组依次增加,在这个数据库中进行查询、添加、删除、修改等操作。在测试期间,数据的吞吐量很小,因此磁盘吞吐量和网络吞吐量都不会成为瓶颈。

  测试曲线大致可以分为两个部分,当用户数量少于600个时,清华同方TP320 5110服务器性能处于快速增长的阶段,其中峰值处理能力达到了79448 TPS。当用户数量高于600个时,该服务器依然可以维持38000-42000 TPS的处理能力。

  服务器整体功耗

  我们利用UNI-T UT71E智能数字万用表和相配套的软件对于对于被测服务器在几种不同的状态下的功耗进行了监测,主要包括如下项目:

  • P1:连接电源但不开机状态

  • P2:系统启动完毕,5分钟内无动作,但不休眠

  • P3:系统启动完毕,处理器满载、磁盘以最大吞吐量工作

  清华同方此次送测的超强TP320 5110服务器并非标准,它配置两颗Xeon 5110处理器、4条1GB FB-DIMM 533MHz内存、PXL-S30R SCSI卡和两块FUJITSU MAT3073NC硬盘(10000RPM,73GB),在接通电源但是不启动的状态下,其功耗约为8瓦,而进入系统之后常时间无动作(不启用节电模式),系统功耗为201瓦,我们使得处理器满载同时让磁盘子系统工作在最大吞吐量模式下,此时系统功耗达到了250瓦。

  这款服务器配置了容量为550瓦的电源,结合测试结果来看,它为服务器进一步扩展设备提供了足够的容量储备。

  IT168评测中心观点

  具有良好的扩展性是清华同方TP320 5110服务器最大的特色,它支持双路Xeon 5000/5100系列处理器,还可以安装8条FB-DIMM 533/667MHz内存,理论上最大可配置32GB内存。更能体现其扩展性的是这款服务器提供了1条PCI Express x16插槽(x8 Link)、1条PCI Exress x8插槽(x8 Link)、2条PCI-X 133/100/66MHz、1条PCI 33MHz/32bit/5V插槽、1条PCI-X 133/100/66MHz插槽(可支持零通道RAID卡)、1条DDR SO-DIMM插槽,这意味着这款服务器可以使用所有的主流扩展卡来扩展其功能。其机箱标配情况下可安装4块3.5英寸硬盘,如果选配一个硬盘托架则可以在增加4块硬盘,从而实现相当大的存储容量。

  TP320 5110服务器较为充分的发挥了英特尔Bensley平台的计算特性,其计算能力超过了上一代主流单核Xeon平台近乎一倍。而且从单路Xeon 5100处理器扩展到双路Xeon 5100处理器其性能也有近乎于线性的增长。这些在SEPC CPU2000、Webbench和Benchmarkfactory的测试中都能明显的表现出来。

  当然,这款产品也并非完美。TP320 5110服务器随机附送的光盘仅仅提供了服务器所需的驱动程序,为了方便用户这张光盘可以引导系统,并且帮助用户制作必须的驱动软盘。该服务器采用了华硕主板,但是并没有附送ASWM管理软件,也没有附送其它的任何的服务器相关的管理或者维护软件。用户如果需要,则只有另外购置。

0
相关文章