【IT168评测中心】宝德PR4850Q传承自宝德经典的PR4850D,依然为企业级四路高性能整合式机型。
作为一款代表X86服务器市场高端服务器的产品,PR4850Q在产品内部各个环节上,采用了免工具安装设计。
服务器内部布局图(蓝、绿两色标注免工具安装部件)
支持最高4条内存总线插槽,可使用4条内存盒进行高密度内存扩展,最高可支持32条内存。
本次送测的宝德PR4850Q仅配备了两条内存盒,但是其中有16条1G内存。
Core核心拓扑图
在主要功能扩展上,PR4850Q支持7条PCI-E扩展位,为整机的多应用系统整合提供了便利。
本次送测的PR4850Q配备了四路Xeon L7345处理器,主频为1.86Ghz,我们以四路Xeon 7130服务器平台与其进行对比测试——Xeon 7130的主频为3.2Ghz。
宝德PR4850Q平台 |
|
Intel S7000FC4UR | |
处理器 |
Intel Xeon L7345 x 4 |
主频 |
1.86GHz |
FSB |
1066MHz |
L2容量 |
4MB x 2 |
L3容量 | 无 |
L2容量 |
4MB x 2 |
处理器设置 |
XDbit Disable |
Transcend DDR2 667 1GB FB-DIMM |
|
总容量 | 1GB x 8 x 2(2总线通道) |
磁盘控制器 |
LSI Logic SAS Raid 1078 Controller |
73G SAS x 2 ,2.5寸 | |
磁盘设置 |
2块硬盘组建为RAID 1模式,磁盘分为两个分区,均为NTFS格式,系统默认簇,主分区20GB,其它分为扩展分区,共享文件夹、磁盘测试均在格式化后的扩展分区上进行 |
Microsoft Windows 2003 Enterprise Server R2 5.02.3790 (Service Pack 1) |
|
Intel(R) PRO/1000 EB Network Connection with I/O Acceleration,双网卡负载 |
四路Xeon 7130平台 |
|
Intel SE8500HW4 | |
处理器 |
Intel Xeon 7130 x 4 |
主频 |
3.2GHz |
FSB |
800MHz |
L2容量 |
1MB x 2 |
L3容量 | 8MB |
处理器设置 |
XDbit Disable |
内存 | Ramaxel 1GB 2Rx8 pc2-4200r-444 FB-DIMM |
总容量 | 1GB x 4 x 4(4通道) |
磁盘控制器 |
LSI LOGIC LSI5030 RAID Controller |
73G SCSI x 3,3.5寸 | |
磁盘设置 |
3块硬盘组建为RAID 5模式,磁盘分为两个分区,均为NTFS格式,系统默认簇,主分区20GB,其它分为扩展分区,共享文件夹、磁盘测试均在格式化后的扩展分区上进行 |
Microsoft Windows 2003 Enterprise Server R2 5.02.3790 (Service Pack 1) |
|
Broadcom BCM5704 NetXtreme Gigabit Ethernet,单网卡 |
两平台配置差异比较 |
||
宝德PR4850Q平台 | 四路Xeon 7130平台 | |
Intel S7000FC4UR | Intel SE8500HW4 | |
处理器 |
Intel Xeon L7345 x 4 |
Intel Xeon 7130 x 4 |
主频 |
1.86GHz | 3.2GHz |
FSB |
1066MHz | 800MHz |
L2容量 |
4MB x 2 | 1MB x 2 |
L3容量 | 无 | 8MB |
内存 | Transcend DDR2 667 1GB FB-DIMM | Ramaxel 1GB 2Rx8 pc2-4200r-444 FB-DIMM |
总容量 | 1GB x 8 x 2(2总线通道) | 1GB x 4 x 4(4通道) |
磁盘控制器 | LSI Logic SAS Raid 1078 Controller |
LSI LOGIC LSI5030 RAID Controller |
73G SAS x 2, 2.5寸 | 73G SCSI x 3, 3.5寸 | |
磁盘设置 |
RAID1 |
RAID 5 |
双千兆网卡负载 |
单网卡 |
在本次测试过程中,我们进行了必要的常规测试项目:
-
SPECCPU2000 v1.2
SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。
SPEC CPU2000是SPEC组织推出的一套CPU子系统评估软件,它包括CINT2000和CFP2000两个子项目,前者用于测量和对比整数性能,而后者则用于测量和对比浮点性能。计算系统中的处理器、内存和编译器都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2000的影响非常的小。
SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、DCC以及科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。
我们在被测服务器中安装了Intel C++ 8.1 Compiler、Intel Fortran 8.1 Compiler这两款SPEC CPU2000必需的编译器,另外安装了Microsoft Visual Studio 2003.net提供必要的库文件。按照SPEC的要求我们根据自己的情况编辑了新的Config文件,可以满足Base测试。然后我们根据被测系统实际可同时处理的线程数量,设定用户数量,分别运行SPEC base和SPEC rate base测试的结果(其中SPEC base代表系统执行某个任务的速度,而SPEC base rate测试代表系统可以同时处理任务的能力)。
- ScienceMark v2.0 Membench
ScienceMark v2.0是一款用于测试系统特别是处理器在科学计算应用中的性能的软件,MemBenchmark是其中针对处理器缓存、系统内存而设计的功能模块,它可以测试系统内存带宽、L1 Cache延迟、L2 Cache延迟和系统内存延迟,另外还可以测试不同指令集的性能差异。
-
IOMeter 2004.7.30
IOMeter是一款功能非常强大的IO测试软件,它除了可以在本机运行测试本机的IO(磁盘)性能之外,还提供了模拟网络应用的能力。在这次的测试中,我们仅仅让它在本机运行测试服务器的磁盘性能。为了全面测试被测服务器的IO性能,我们分别选择了不同的测试脚本。
-
Max_throughput(read):文件尺寸为64KB,100%读取操作,随机率为0%,用于检测磁盘系统的最大读取吞吐量
-
Max_IO(read):文件尺寸为512B,100%读取操作,随机率为0%,用于检测磁盘系统的最大读取操作IO处理能力
-
Max_throughput(write):文件尺寸为64KB,0%读取操作,随机率为0%,用于检测磁盘系统的最大写入吞吐量
-
Max_IO(write):文件尺寸为512B,0%读取操作,随机率为0%,用于检测磁盘系统的最大写入操作IO处理能力
-
SiSoftware.Sandra.Enterprise.v2007.5.10.98
SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。今年该软件推出了2007版,该版本新增了4项基准测试,包括Power Management Efficiency、Memory Latency、Physical Disks和CD-ROM and DVD这四个项目。另外,它还对于原有的几个基准测试模块进行升级,比如在Arithmetic benchmarks中增加了对SSE3 & SSE4 SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,另外还升级了File System benchmark和Removable Storage benchmark两个子项目。对于新的硬件的支持当然也是该软件每次升级的重要内容之一。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台,这也是我们选择这款软件的原因之一。
-
WebBench v5.0
WebBench是针对服务器作为Web Server时的性能进行测试,我们在被测服务器上安装了IIS6.0组件,以提供测试所需的Web服务。在测试中我们开启了网络实验室中的56台客户端,分别使用了WebBench 5.0内置的动态CGI以及静态页面脚本对服务器进行了测试。
静态测试是由客户端读取预先放置在服务器Web Server下的Web页面(wbtree),这项测试主要考察的是服务器磁盘系统以及网络连接性能。我们使用了实验室中的56台客户端,配合Static_mt.tst多线程静态脚本测试向被测服务器发送请求。
动态测试偏重于对服务器CPU子系统的性能测试,它对于Web服务器提供了足够的负载。我们将一个C语言编写的CGI源文件Simcigi.c编译为Simcgi.exe,并将其作为动态测试中的CGI脚本。在测试过程中,每台安装了WebBench客户端软件的PC,会在300秒的时间内持续向服务器发送CGI请求,而控制台会纪录并汇总服务器所响应CGI请求的数据。CGI测试的成绩高低,主要取决于服务器处理器子系统性能的优劣。处理器子系统包括CPU、内存以及内存控制器,CPU频率、缓存以及内存容量大小和内存带宽,都会影响该项成绩。
-
NetBench v7.03
NetBench是针对文件服务器的性能测试软件,影响NetBench性能的主要是服务器的磁盘子系统,服务器磁盘控制器、条带大小、读写缓存、硬盘类型、组建磁盘阵列模式、内存容量、网络拓朴结构等都会对测试结果有明显的影响。我们在被测服务器上设立了文件服务器,NetBench通过网络实验室中60个客户端来模拟网络中的PC向文件服务器所发出的文件传输请求,文件服务器则将存储在磁盘上的文件数据发送给相应的客户端。在测试过程中,客户端会以每四台一组的步进依次增加并且向服务器发送文件传输请求,测试结束后控制台收集数据并绘制出服务器的数据传输变化曲线。
-
Benchmarkfactory 4.6
大部分的服务器应用都同数据库有着密切的联系,因此我们今年开始着手在在服务器测试中加入对于数据库性能的测试。我们选择了Benchmark Factory 4.6软件和Microsoft SQL2000 SP4来测试不同的硬件平台在数据库应用中的表现。
我们选择了BF内置的标准测试脚本AS3AP,这项测试可用于对于ANSI结构化查询语言(SQL)关系型数据库进行测试,它可用于测试DBMS(单用户微机数据库管理系统),也可用于测试高性能并行或者分布式数据库。
-
系统功耗监测
我们使用UNI-T UT71E智能数字万用表对于被测服务器系统的整体功耗进行了监测,利用随机附带的接口程序,我们可以记录被测服务器任意时间段内的功率变化。
本次测试,我们运行了代表系统执行某个任务速度的SPEC base测试,测试过程分为浮点运算与整数运算两部分。
浮点性能测试中包含了14个程序,分别代表量子色动力学(168)、浅水模型(171)、3D势场多栅格解算器(172)、抛物/椭圆偏微分方程(173)、3D图形库(177)、流体动力学(178)、神经元网络(179)、有限元模拟:地震模型(183)、面部识别(187)、计算化学(188)、数论(189)、有限元模拟:碰撞(191)、粒子加速器(200)、污染物扩散(301)。
SPECfp_base2000 [IT168评测中心] |
|||
---|---|---|---|
对比平台 | 宝德PR4850Q | 四路Xeon 7130 | 增长幅度 |
开启线程数量 | 16 | 8 | - |
168.wupwise | 146 | 92.3 | 58.2% |
171.swim | 52.5 | 53.3 | -1.5% |
172.mgrid | 50.3 | 49.8 | 1% |
173.applu | 46.9 | 45 | 4.2% |
177.mesa | 305 | 90.3 | 237.8% |
178.galgel | 368 | 153 | 140.5% |
179.art | 252 | 82.5 | 205.5% |
183.equake | 58.9 | 47.3 | 144% |
187.facerec | 144 | 95.8 | 24.5% |
188.ammp | 220 | 100 | 120% |
189.lucas | 53.6 | 53.1 | 0.9% |
191.fma3d | 71.1 | 60.5 | 17.5% |
200.sixtrack | 123 | 56.7 | 116.9% |
301.apsi | 134 | 101 | 32.7% |
总分 | 114 | 72.2 | 57.9% |
整数性能测试中包括11个C程序和1个C++程序(252.eon),它们分别代表数据压缩(164、256)、电路布线(175)、C编译器(176)、 最低成本网络流解算机(181)、象棋模拟程序(186)、自然语言处理(197)、光线追踪(252)、Perl应用(253)、计算机群论(254)、面向对象的数据库应用(255)等应用。
SPECint_base2000 [IT168评测中心] |
|||
---|---|---|---|
对比平台 | 宝德PR4850Q | 四路Xeon 7130 | 增长幅度 |
开启线程数量 | 16 | 8 | - |
164.gzip | 196 | 126 | 55.6% |
175.vpr | 203 | 95.2 | 113.2% |
176.gcc | 294 | 182 | 61.5% |
181.mcf | 98.6 | 93.4 | 5.6% |
186.crafty | 245 | 110 | 123% |
197.parser | 226 | 149 | 51.7% |
252.eon | 340 | 187 | 81.8% |
253.perlbmk | 336 | 151 | 122.5% |
254.gap | 122 | 126 | -3.2% |
255.vortex | 422 | 223 | 89.2% |
256.bzip2 | 197 | 134 | 47% |
300.twolf | 355 | 141 | 151.8% |
总分 | 233 | 138 | 68.8% |
SPEC CPU2000 Speed测试显示采用了Caneland平台的宝德PR4850Q服务器出现了大幅的性能提升:浮点运算能力总体提升57.9%,整数运行总体提升68.8%。
在内存缓存测试环节,我们选择Sisoftware.Sandra.Enterprise.SP1 v2007对其进行测试。
SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。新推出的2007版对于原有的几个基准测试模块进行了升级——比如在Arithmetic benchmarks中增加了对SSE3 & SSE4 SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,另外还升级了File System benchmark和Removable Storage benchmark两个子项目。对于新的硬件的支持当然也是该软件此次升级的重要内容之一。
另外,SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台,这也是我们选择这款软件的原因之一。
SiSoftware.Sandra.Enterprise.SP1 v2007 Cache and Memory |
||
---|---|---|
对比平台 | 宝德PR4850Q | 四路Xeon 7130 |
Combined Index | 128267 | 68754 |
Speed Factor | 169 | 79.6 |
2KB | 490737 | 389624 |
4KB | 503207 | 391622 |
8KB | 562258 | 405148 |
16KB | 791520 | 305540 |
32KB | 862573 | 298434 |
64KB | 931061 | 290690 |
128KB | 954453 | 263676 |
256KB | 906100 | 214869 |
512KB | 718419 | 214218 |
1MB | 277057 | 205152 |
4MB | 265020 | 168360 |
16MB |
214113 |
53114 |
64MB | 10784 | 7579 |
256MB | 7455 | 6360 |
1GB | 7073 | 5088 |
从上表中我们可以看到,在内存缓存测试环节,宝德PR4850Q相对以往的四路Xeon 7130平台也表现出更高的性能。
另外,本次送测的机器仅仅使用了2个内存盒插入16条1G内存,如果将服务器支持的4个内存盒里部署16条内存,所取得的成绩将会更加优越。
在Web服务器测试环节,我们选择了动态CGI应用进行测试。在整个动态测试过程中,吞吐量尚未达到被测服务器网卡的吞吐量上限,测试结果主要反映处理器、内存等部分的性能。
从上图显示的数据对比可以看到,宝德PR4850Q服务器,相对四路Xeon7130服务器平台,在CGI动态性能处理上有一定的提升:
四路Xeon7130服务器平台在处理CGI动态请求时,峰值达到8063 Requests Per Second,宝德PR4850Q的峰值则达到更高的8321 Requests Per Second。
我们在被测服务器上安装了Microsoft SQL 2000 SP4,按照测试要求建立了数据库。BF在测试之前会在数据库中生成9个表,其中包括4个500万行的表格,每行包括100字节的数据,因此每个表格容量大约是476MB,整个数据库容量为1.86GB。我们用60个客户端模拟1600个用户,并且以8个一组依次增加,在这个数据库中进行查询、添加、删除、修改等操作。在测试期间,数据的吞吐量很小,因此磁盘吞吐量和网络吞吐量都不会成为瓶颈。
从图中我们可以看到,宝德PR4850Q相对四路Xeon 7130服务器平台有非常明显的提升:
1)宝德PR4850Q的数据库请求处理峰值达到64888TPS,四路Xeon 7130数据库请求处理峰值为53416TPS,宝德PR4850Q的数据库请求处理性能峰值提升幅度达到21.5%;
2)宝德PR4850Q的数据库请求处理平均值达到52611TPS,四路Xeon 7130数据库请求处理平均值为46053TPS,宝德PR4850Q的数据库请求处理性能平均值提升幅度达到14.2%。
在内存只配置两条可利用总线、磁盘采用Raid1的前提下,宝德PR4850Q数据库性能相对前一代四路Xeon 7130尚且表现出明显的性能提升。
【IT168评测中心】自Intel发布基于Core全新架构、代号为Tigerton的Xeon MP 7300以替代原Xeon MP 7100平台以来,众厂家均积极响应并以将平台配置升级至性能和架构均更加优秀的的7300平台系统。
宝德PR4850Q延续自其原MP服务器主打PR4850D,结合上文纵观整系统,不难发现其突出的优点:
免工具安装的内部设计为系统维护人员提供了便利,大排量风扇则为服务器整系统提供了强劲的温控设备,MP整系统、最大32条内存、8盘位的存储空间、4网卡设计为系统提供了强大而均衡的性能扩展空间,7条PCI-E的扩展槽同样为用户的多应用整合提供了便利。
虽然本次作为对比的四路Xeon 7130平台在主频上占有很大的优势,但在包括处理器性能测试在内的各应用测试中,宝德仍然保持了相对领先的性能优势。
不过由于本次送测的样机由于时间相对仓促,厂商在存储与内存等方面并未给出一个更好的配置方案,如果能够将各方面配置均衡,在诸如内存缓存、网络文件服务器、网络数据库应用等方面还有不少提升空间。