【IT168评测中心】PowerLeader宝德,是1997年深圳市宝德科技股份有限公司在中国的服务器方案解决市场建立的品牌。宝德为中国第三大国内服务器供货商,被市政府誉为「高新技术企业」及「深圳市百强科技企业」。凭借宝德的崭新技术、专业的产品及服务、全面的市场覆盖以及从著名的软硬件供货商得到的先进技术支持,公司致力促进其在中国市场作为服务器解决方案供货商的领导地位。
我们测试了宝德送来的PowerLeader PR3015S双路四核至强服务器,采用了在横评当中不多见的3U架构,基于Intel Xeon 5355 2.66GHz处理器和Intel 5000V芯片组,从外形上可以看出,宝德PowerLeader PR3015S是一款存储服务器。
这个服务器是属于3U高度,很是沉重,当单人在实验室搬来搬去的时候感想尤甚。
从前面板看,PowerLeader PR3015S具备了15个3.5" SATA 3Gbps热插拔槽,可以支持多达15个3.5"硬盘,可以达到巨大的存储容量,这从型号上也可以略窥一二。
PowerLeader PR3015S采用了双路5355至强处理器,频率达2.67GHz,这在Clovertown至强中算是比较高的频率了。PowerLeader PR3015S为处理器搭配的是一款5000V主板:Intel Sapello S5000VSA,和5000P相比,5000V简化了内存、PCIE等方面的支持。
宝德PowerLeader PR3015S是本次横评中少有的采用了企业级SATA硬盘的服务器,送来的配置中包括了8个西数250GB RE2硬盘,总硬盘容量就达到了2TB,不过因为它们配置为了一个RAID 5阵列,因此容量稍有削减。宝德PowerLeader PR3015S采用了一块Promise SuperTrak EX8350阵列卡,基于PCI-E x4接口,采用Intel IOP333 Xscale处理器,板载128MB ECC内存,并提供了8个SATA 3Gbps接口,8个硬盘刚好用完。
因为是3U架构,因此面板配置上很从容。
对于存储来说,冗余电源非常必要,宝德PowerLeader PR3015S采用了3路冗余电源设计。
后面板上具有两个出风风扇。
测试平台
本次送测的宝德PR3015S服务器配置了双路Xeon 5335处理器,搭载Intel 5000V芯片组,以8块磁盘组建大容量RAID5存储系统,详细参数见下表:
宝德PR3015S平台
|
宝德 PR3015S平台 |
|
| 主板 | Intel Sapello S5000VSA |
| 处理器 | Xeon E5355 x 2 |
| 主频 | 2.66GHz |
| FSB | 1333MHz |
| L1容量 | 64K(Data容量为32K) |
| L2容量 | 8MB(共享) |
| 芯片组 | Intel 5000V |
| 内存 | 1GB FBD ECC DDR2 667 SDRAM x 8 |
| 磁盘控制器 | Promise SuperTrak EX8350 RAID Controller |
| 硬盘 | 250GB 7200转 SATA硬盘 x 8 |
| 硬盘设置 | 8块硬盘组建为RAID 5模式,条带大小为64KB,磁盘分为两个分区,均为NTFS格式,系统默认簇,主分区20GB,其它分为扩展分区,共享文件夹、磁盘测试均在格式化后的扩展分区上进行 |
| 操作系统 | Microsoft Windows Server2003,5.02.3790,SP2 |
| 网卡 | 集成双Intel(R) PRO/1000 EB Network网卡 |
对比双路平台:
|
双路Xeon 5365平台 |
|
| 主板 | ASUS DSBF-D/SAS |
| 处理器 | Xeon X5365 x 2 |
| 主频 | 3.0GHz |
| FSB | 1333MHz |
| L1容量 | 64K(Data容量为32K) |
| L2容量 | 8MB(共享) |
| 芯片组 | Intel 5000P |
| 内存 | 1GB FBD ECC DDR2 667 SDRAM x 8 |
| 磁盘控制器 | Adaptec SCSI RAID 2130S Controller |
| 硬盘 | 73GB 1万转 Seagate SCSI x 3 |
| 硬盘设置 | 3块硬盘组建为RAID 0模式,条带大小为64KB,磁盘分为两个分区,均为NTFS格式,系统默认簇,主分区20GB,其它分为扩展分区,共享文件夹、磁盘测试均在格式化后的扩展分区上进行 |
| 操作系统 | Microsoft Windows Server2003,5.02.3790,SP2 |
| 网卡 | 集成双Intel(R) PRO/1000 EB Network网卡 |
我们在两个平台上均安装了Microsoft Windows Server2003企业版操作系统,并将系统升级至最新的SP2,以保障平台性能得以稳定和正常地发挥。
我们进行了处理性能、内存缓存性能、数据库网络应用辅以基本测试环节进行。具体测试项目如下:
-
SPECCPU2006 v1.0.1
SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。
SPEC CPU 2006是SPEC组织推出的CPU子系统评估软件最新版,我们之前使用的是SPEC CPU 2000。和上一个版本一样,SPEC CPU 2006包括了CINT2006和CFP2006两个子项目,前者用于测量和对比整数性能,而后者则用于测量和对比浮点性能,SPEC CPU 2006中对SPEC CPU 2000中的一些测试进行了升级,并抛弃/加入了一些测试,因此两个版本测试得分并没有可比较性。
SPEC CPU测试中,测试系统的处理器、内存子系统和使用到的编译器(SPEC CPU提供的是源代码,并且允许测试用户进行一定的编译优化)都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2006的影响非常的小。
SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、DCC以及科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。
我们在被测服务器中安装了当前最新版本的Intel C++ 10.1.011 Compiler、Intel Fortran 10.1.011 Compiler这两款SPEC CPU2006必需的编译器,通过最新出现的QxS编译参数,Intel Compiler 10版本开始支持对Intel SSE4指令集进行优化,对于宝德PowerLeader PR3015S服务器采用的5355处理器,它只支持SSE3,因此我们使用的是QxT编译参数。我们另外安装了Microsoft Visual Studio 2003 SP1提供必要的库文件。按照SPEC的要求我们根据自己的情况编辑了新的Config文件,使用了较多的编译优化选项。
我们根据被测系统选择实际可同时处理的线程数量:也就是8个。最后得到SPEC rate base测试结果(基于base标准编译,SPEC base rate测试代表系统同时处理多个任务的能力)。
SPEC CPU 2006的测试比较消耗时间,因此准确度也很高。
-
ScienceMark v2.0 Membench
ScienceMark v2.0是一款用于测试系统特别是处理器在科学计算应用中的性能的软件,MemBenchmark是其中针对处理器缓存、系统内存而设计的功能模块,它可以测试系统内存带宽、L1 Cache延迟、L2 Cache延迟和系统内存延迟,另外还可以测试不同指令集的性能差异。
-
SiSoftware.Sandra.SP1 v2007
SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。今年该软件推出了2007版,该版本新增了4项基准测试,包括Power Management Efficiency、Memory Latency、Physical Disks和CD-ROM and DVD这四个项目。另外,它还对于原有的几个基准测试模块进行升级,比如在Arithmetic benchmarks中增加了对SSE3 & SSE4 SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,另外还升级了File System benchmark和Removable Storage benchmark两个子项目。对于新的硬件的支持当然也是该软件每次升级的重要内容之一。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台,这也是我们选择这款软件的原因之一。
-
IOMeter 2004.7.30
IOMeter是一款功能非常强大的IO测试软件,它除了可以在本机运行测试本机的IO(磁盘)性能之外,还提供了模拟网络应用的能力。在这次的测试中,我们仅仅让它在本机运行测试服务器的磁盘性能。为了全面测试被测服务器的IO性能,我们分别选择了不同的测试脚本。
-
Max_throughput(read):文件尺寸为64KB,100%读取操作,随机率为0%,用于检测磁盘系统的最大读取吞吐量
-
Max_IO(read):文件尺寸为512B,100%读取操作,随机率为0%,用于检测磁盘系统的最大读取操作IO处理能力
-
Max_throughput(write):文件尺寸为64KB,0%读取操作,随机率为0%,用于检测磁盘系统的最大写入吞吐量
-
Max_IO(write):文件尺寸为512B,0%读取操作,随机率为0%,用于检测磁盘系统的最大写入操作IO处理能力
-
WebBench v5.0
WebBench是针对服务器作为Web Server时的性能进行测试,我们在被测服务器上安装了IIS6.0组件,以提供测试所需的Web服务。在测试中我们开启了网络实验室中的56台客户端,分别使用了WebBench 5.0内置的动态CGI以及静态页面脚本对服务器进行了测试。
静态测试是由客户端读取预先放置在服务器Web Server下的Web页面(wbtree),这项测试主要考察的是服务器磁盘系统以及网络连接性能。我们使用了实验室中的56台客户端,配合Static_mt.tst多线程静态脚本测试向被测服务器发送请求。
动态测试偏重于对服务器CPU子系统的性能测试,它对于Web服务器提供了足够的负载。我们将一个C语言编写的CGI源文件Simcigi.c编译为Simcgi.exe,并将其作为动态测试中的CGI脚本。在测试过程中,每台安装了WebBench客户端软件的PC,会在300秒的时间内持续向服务器发送CGI请求,而控制台会纪录并汇总服务器所响应CGI请求的数据。CGI测试的成绩高低,主要取决于服务器处理器子系统性能的优劣。处理器子系统包括CPU、内存以及内存控制器,CPU频率、缓存以及内存容量大小和内存带宽,都会影响该项成绩。
-
NetBench v7.03
NetBench是针对文件服务器的性能测试软件,影响NetBench性能的主要是服务器的磁盘子系统,服务器磁盘控制器、条带大小、读写缓存、硬盘类型、组建磁盘阵列模式、内存容量、网络拓朴结构等都会对测试结果有明显的影响。我们在被测服务器上设立了文件服务器,NetBench通过网络实验室中60个客户端来模拟网络中的PC向文件服务器所发出的文件传输请求,文件服务器则将存储在磁盘上的文件数据发送给相应的客户端。在测试过程中,客户端会以每四台一组的步进依次增加并且向服务器发送文件传输请求,测试结束后控制台收集数据并绘制出服务器的数据传输变化曲线。
-
Benchmarkfactory 4.6
大部分的服务器应用都同数据库有着密切的联系,因此我们今年开始着手在在服务器测试中加入对于数据库性能的测试。我们选择了Benchmark Factory 4.6软件和Microsoft SQL2000 SP4来测试不同的硬件平台在数据库应用中的表现。
我们选择了BF内置的标准测试脚本AS3AP,这项测试可用于对于ANSI结构化查询语言(SQL)关系型数据库进行测试,它可用于测试DBMS(单用户微机数据库管理系统),也可用于测试高性能并行或者分布式数据库。
处理性能测试
|
SPEC CPU 2006 |
||
| 厂商 | 宝德 | 双路 X5365 |
| 产品型号 | PR3015S | 双路 X5365 |
| 开启线程数 | 8 | 8 |
| 410.bwaves | 33.6 | 32.6 |
| 416.gamess | 126 | 142 |
| 433.milc | 20.6 | 18.8 |
| 434.zeusmp | 62.2 | 63.7 |
| 435.gromacs | 118 | 133 |
| 436.cactusADM | 69.2 | 70.2 |
| 437.leslie3d | 24.6 | 24.3 |
| 444.namd | 110 | 123 |
| 447.dealII | 118 | 122 |
| 450.soplex | 29.9 | 29 |
| 453.povray | 151 | 170 |
| 454.calculix | 88.3 | 98.2 |
| 459.GemsFDTD | 20.5 | 21 |
| 465.tonto | 54.4 | 61.5 |
| 470.lbm | 19.1 | 24.5 |
| 481.wrf | 46.3 | 46.1 |
| 482.sphinx3 | 47.1 | 45.5 |
|
SPECfp_rate_base2006 |
53.8 | 56.5 |
|
SPEC CPU 2006 |
||
| 厂商 | 宝德 | 双路 X5365平台 |
| 产品型号 | PR3015S | 双路 X5365平台 |
| 开启线程数 | 8 | 8 |
| 410.bwaves | 43 | 43.1 |
| 416.gamess | 73.2 | 79.9 |
| 433.milc | 35 | 39 |
| 434.zeusmp | 56.5 | 56.9 |
| 435.gromacs | 130 | 147 |
| 436.cactusADM | 107 | 122 |
| 437.leslie3d | 121 | 134 |
| 444.namd | 30.1 | 43.5 |
| 447.dealII | 211 | 236 |
| 450.soplex | 30.9 | 28.3 |
| 453.povray | 48.2 | 47.4 |
| 454.calculix | 2.65 | 2.01 |
|
SPECint_rate_base2006 |
50.3 | 53.2 |
本次送测的宝德PR3015S配置双路Xeon E5355,与作为对比平台配置的双路Xeon X5365采用相同的架构,而且同属于Intel Xeon 5300系列,处理器性能的差别主要在主频上,因此,作为对比的双路 X5365以较高的处理器配置显示出相对的小幅优势。
在内存缓存测试环节,我们采用ScienceMark科学计算测试中的Membench项目:
|
ScienceMark Membench |
||
| 厂商 | 宝德 | 双路 X5365平台 |
| 产品型号 | PR3015S | 双路 X5365平台 |
| 内存技术参数 | 1GB FBD ECC DDR2 667 SDRAM x 8 |
1GB FBD ECC DDR2 667 SDRAM x 8 |
| L1带宽 | 74306.73 | 83902.59 |
| L2带宽 | 22304.07 | 25120.09 |
| 内存带宽(MB/s) | 3857.47 | 3933.06 |
| L1 Cache Latency(ns) | ||
| 32 Bytes Stride | 1.13 | 1 |
| L2 Cache Latency(ns) | ||
| 4 Bytes Stride | 1.13 | 1 |
| 16 Bytes Stride | 1.50 | 1.34 |
| 64 Bytes Stride | 4.14 | 3.68 |
| 256 Bytes Stride | 4.14 | 3.68 |
| 512 Bytes Stride | 4.51 | 4.01 |
| Memory Latency(ns) | ||
| 4 Bytes Stride | 1.50 | 1 |
| 16 Bytes Stride | 5.26 | 4.68 |
| 64 Bytes Stride | 21.05 | 18.81 |
| 256 Bytes Stride | 71.80 | 60.82 |
| 512 Bytes Stride | 79.70 | 67.84 |
| Algorithm Bandwidth(MB/s) | ||
| Compiler | 2668.01 | 2824.44 |
| REP MOVSD | 2648.67 | 2841.60 |
| ALU Reg Copy | 2575.63 | 2747.44 |
| MMX Reg Copy | 2697.06 | 2794.63 |
| MMX Reg 3dNow | --- | --- |
| MMX Reg SSE | 3805.16 | 3933.06 |
| SSE PAlign | 3814.15 | 3875.50 |
| SSE PAlign SSE | 3857.47 | 3922.27 |
| SSE2 PAlign | 3738.16 | 3860.31 |
| SSE2 PAlign SSE | 3809.62 | 3920.55 |
| MMX Block 4kb | 2749.01 | 3250.86 |
| MMX Block 16kb | 3260.06 | 3528.15 |
| SSE Block 4kb | 2682.72 | 3183.58 |
| SSE Block 16kb | 3297.64 | 3539.32 |
从上表我们可以看到,两对比平台的内存缓存性能在数量级上基本相当,而作为对比的双路 X5365平台在内存缓存各测试项目中的成绩小幅领先。
宝德PR3015S服务器与作为对比的双路 X5365平台架构完全相同,内存容量与技术规格也相同,不同处在于宝德PR3015S虽然与对比平台一样采用了8条1G容量FBD内存,但是其所采用的Intel 5000V芯片组仅仅支持双通道,而双路 X5365平台则支持四通道,并且四条通道均已占用,这也是双路 X5365平台内存缓存稍占优势的主要原因。
本次送测的宝德PR3015S配置了8块3.5寸SATA硬盘,以Promise SuperTrak EX8350 RAID Controller组建Raid5存储系统。

IO读写

IO吞吐量
测试数据显示,宝德PR3015S磁盘子系统的IO读写性能表现一般,而数据吞吐量性能则表现非常优越:
1)读取IO峰值为30868 Iops,写入IO峰值为25262 IOps,性能表现一般;
2)读取吞吐量达到458MB/s的峰值,写入吞吐量达到227MB/s的峰值,高吞吐量性能已经非常突出。
NetBench 7.03 Ent_dm.tst测试脚本模拟的是企业级文件服务器应用,它不但要求被测服务器的磁盘子系统可以提供足够的吞吐量,还需要其具有较高的IO处理能力,并且需要较为平衡的读取能力和写入能力。
宝德PR3015S服务器在主板上整合双Intel(R) PRO/1000 EB Network网卡,与对比平台相同;本次送测的宝德PR3015S选配了Promise SuperTrak EX8350 RAID Controller控制器将8块SATA硬盘组建成Raid5存储系统,而对比双路 X5365平台采用Adaptec SCSI RAID 2130S Controller将3块万转SCSI硬盘组建Raid0存储系统。

从对比测试结果我们可以看到,宝德PR3015S吞吐量峰值达到936 Mbps,高于对比双路 X5365平台的峰值891 Mbps,而从上图中我们可以直观地看到,宝德PR3015S随着客户端的增加,其文件服务器吞吐量的增长也更加稳定与平滑。
Web服务器测试分为静态应用测试和动态应用测试,处理器计算能力、缓存内存效能则对于动态应用的性能有明显影响,而IO能力对于静态应用的性能有明显的影响。

动态
动态测试曲线显示,宝德PR3015S服务器最高可处理9997个动态请求,略低于对比双路 X5365平台的每秒峰值10206个动态请求,而在处理动态请求的平均值方面,却是以宝德PR3015S服务器的每秒7022个请求略高于对比双路 X5365平台的每秒6882个请求。

静态
静态测试曲线显示,宝德PR3015S服务器最高可处理26781个静态请求,略高于双路 X5365平台的每秒峰值26543个静态请求。
整体来看动态与静态Web应用的测试数据曲线,可见两曲线非常接近,理解为两平台的Web应用性能相当。
我们在被测的宝德PR3015S服务器上安装了Microsoft SQL 2000 SP4,按照测试要求建立了数据库。BF在测试之前会在数据库中生成9个表,其中包括4个500万行的表格,每行包括100字节的数据,因此每个表格容量大约是476MB,整个数据库容量为1.86GB。我们用60个客户端模拟800个用户,并且以8个一组依次增加,在这个数据库中进行查询、添加、删除、修改等操作。在测试期间,数据的吞吐量很小,因此磁盘吞吐量和网络吞吐量都不会成为瓶颈。

当用户数量达到1100个时,宝德PR3015S服务器承压到达峰值84758 TPS,高于双路 X5365对比平台的83442 TPS,而以接入用户数为64个后稳定增加的承压来算均值,宝德PR3015S也以76205 TPS的承压均值相对领先于双路 X5365平台的75477 TPS。
服务器整体功耗
我们利用UNI-T UT71E智能数字万用表和相配套的软件对于对于被测服务器在几种不同的状态下的功耗进行了监测,主要包括如下项目:
加电关机:连接电源但不开机状态
开机空载:系统启动完毕,5分钟内无动作,但不休眠
系统满载:系统启动完毕,处理器满载、磁盘以最大吞吐量工作
宝德PR3015S服务器主耗电硬件配置包括双路Xeon 5355处理器、8条1GB 667Mhz FBD内存、1条Promise SuperTrak EX8350 RAID控制器、8块7200转SATA硬盘、6个机箱风扇和2个处理器散热风扇。
作为对比的双路 X5365服务器平台主耗电硬件配置包括双路Xeon 5365处理器、8条1GB 667Mhz FBD内存、1块独立Raid卡、3块73G万转SCSI硬盘、3个机箱风扇和2个处理器散热风扇。

测试结果显示,宝德PR3015S服务器开机空载功率为239.0W,低于双路 X5365对比服务器平台的开机空载功率274.2W,而系统满载时的功率,宝德PR3015S同样以380.1W优胜于双路 X5365平台的536W。
IT168评测中心观点
本次送测的宝德PR3015S服务器为3U设计,整机配备65nm双路四核Xeon 5355处理器,同时向上支持非常先进的Intel 45nm制程Xeon 5400系四核处理器并向下支持65nm制程Xeon 5100系双核处理器,产品定位于企业级商务存储应用。
在整个评测过程中,我们不难看出宝德PR3015S的优势:
1)在各应用项目中表现出优越的性能。由于数据库网络应用测试反映了整机在包括处理、内存缓存、IO、吞吐量、网络等在内的各项综合性能,宝德PR3015S在此项测试中的高性能表现突出了产品设计的综合协调性;
2)在更高性能的前提下,宝德PR3015S以更低的功耗突出了产品的能耗比;
另外,宝德PR3015S随机附送的USB软驱等系统安装工具也方便了技术人员安装与维护。
当然,我们也看出产品在设计与服务方面的一些不足:定位于企业商务关键应用的3U服务器主板,并未采用市场同一级别主流的扩展与综合性能更加优越的5000P芯片组,而采用了低上一个级别的5000V芯片组;产品随机装配的光盘中仅提供了主要部件的驱动程序,无服务器管理套件可选。