服务器 频道

高密度计算 宝德PR2760T服务器首发评测

    【IT168评测中心】如今我们都在讨论低碳,特别是IT行业来说更强调环保性。对于服务器来说,由于大部分时间都属于资源浪费的状态,虚拟化这样实用的技术才能大有用武之地。而在同样高度的空间里,比如2U服务器,如何能够实现更大的计算性能呢?高密度产品的出现解决了这个问题,比如我们今天要测试的宝德四子星PR2760T服务器。

11
从前方面板部局中可以看到,该产品最多可以支持12个3.5英寸热插拔硬盘

11
前方左侧的两个子系统独立面板

11
在右侧依旧提供了两个子系统独立面板

11
这次送测的宝德四子星服务器PR2760T样机采用了双电源配置

  和我们常见的机架式服务器不同,四子星服务器的最大特点是在2U的高度内整合了4个服务器平台,这样最大限度的实现了运算效能。本次,我们收到的这款送测样机配备了Intel英特尔 Xeon E5620处理器。至强E5620是一款4核8线程的处理器,其主频为2.4GHz,拥有12MB的三级缓存与5.86GT/秒的QPI速度,TDP为80W。

  如何能够在2U的空间内整合4个平台呢?之前我们介绍过惠普的DL170h G6系列,而宝德这台服务器也实现了类似的设计,我们下面就一起来看看。 

22
从图中可以看到左右独立的两块主板,由于该机采用双层结构,所以一共是4个独立的子系统

宝德四子星服务器PR2760T内部细节Par1
每块主板都是一个独立的子系统,可以从背部面板实现插拔22
每个子系统都是双路设计22
 机身左右两部分各设计为一个独立的风道,每个风道配备了两个风扇22
送测服务器所配置的Nidec风扇

  我相信,大家在看过服务器内部的结构之后,更关心每个平台上都配备了什么样的硬件。虽然是双路平台,但是本次送测的产品只配备了单颗处理器,我们更有兴趣知道它每一个平台的性能如何。


想要一睹CPU真容,首先需要拆下做工精良的三热管散热器
CPU插槽开启状态图
送测服务器配备的Intel Xeon E5620 处理器

  我们有必要来介绍一下服务器使用的至强E5620处理器。从至强5600系列的整体规格来看,E5620是E系列的最低端型号,这主要是指它的主频较低,只有2.4GHz;Turbo之后的主频最高可以达到2.666GHz。和许多5600处理器一样,它也提供了12MB三级缓存,QPI速度为5.8GT/s,TDP为80W,是一颗4核心8线程的产品。

宝德四子星服务器PR2760T内部细节Par2
送测服务器配备的Kingston 2G DDR3 ECC1066内存,共4条提供了最大8GB的容量
此次送测的宝德四子星服务器PR2760T使用了Seagate的企业级硬盘
Seagate ST3750330NS硬盘单块容量750GB,其拥有7200转的转速与32M缓存
送测服务器配置了2个SUPERMICR服务器模块化电源,其型号为PWS-1K21P-1R
单个电源可以为用户提供1200W的最大总功率

  从硬件来看,宝德四子星PR2760T服务器的配置属于主流水平,没有太多花哨的内容。最后,我们要介绍的是主板使用的芯片。

宝德四子星服务器PR2760T内部细节Par3
Intel JL82576EB 千兆网卡芯片

宝德四子星服务器PR2760T内部细节Par3
整合了显卡芯片的多功能控制芯片

宝德四子星服务器PR2760T内部细节Par3
来自Intel的ICH10R南桥芯片

宝德四子星服务器PR2760T内部细节Par3
用于远程网络管理的Realtek RTL8201N百兆网络芯片

     通过以上的内容,我们对宝德四子星PR2760T服务器进行了详细的硬件规格介绍。接下来,我们准备通过测试软件来检测它的子系统性能和数据库性能。在测试之前,我们还是有必要了解一下服务器的软件配置情况。

  在2009年秋我们IT168评测中心网络实验室搬迁到新的机房之后,我们又对实验室的服务器测试平台进行了大幅度的升级,先是将已有的Cisco Catalyst 4506千兆交换机升级到3个模块,达到了一共120个千兆网络端口,还新购买了30台DELL PowerEdge T100服务器,配合原有的30台DELL PowerEdge SC430服务器以及30台PC作为网络测试的客户端,可以提供非常充足的测试压力。


网络实验室控制台

网络实验室机房

Cisco Catalyst 4506千兆交换机,120个千兆铜口

部分Dell PowerEdge SC430服务器

  在新的测试环境下,我们进一步完善了服务器性能测试方案:

  • SiSoftware Sandra v2010

  SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。从2007开始,Sandra的Arithmetic benchmarks增加了对SSE3&SSE4 SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,另外还升级了File System benchmark和Removable Storage benchmark两个子项目。对于新的硬件的支持当然也是该软件每次升级的重要内容之一,SiSoftware Sandra 2010对NUMA架构以及最新的Windows 7/Windows Server 2008 R2提供了更好的支持,此外测试项目和测试结果也有了略微的变化。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台。

  • Benchmark Factory for Databases 5.7.1g

  我们选择了Benchmark Factory for Databases 5.7.1g软件来进行测试,它是我们之前使用的4.6的升级版本。

  我们选择了BF内置的标准测试脚本AS3AP,这项测试可用于对于ANSI结构化查询语言(SQL)关系型数据库进行测试,它可用于测试DBMS(单用户微机数据库管理系统),也可用于测试高性能并行或者分布式数据库。关系性数据库就是用二维表格结构来表示实体及实体之间联系模型的数据库形式。

  BF通过一台独立的控制台控制我们的60台服务器充当的客户端产生数据库测试压力,由于客户端所有的资源都用来产生数据库操作,因此可以给服务器施加相当大的测试压力。

  •  CineBench R10 

  CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,在服务器测试平台中显示子系统不重要,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。

  本次评测的宝德四子星PR2760T服务器是一台特别的机器,它的每个平台搭配了一颗至强E5620处理器。测试结果并会与我们IT168评测中心的DELL PowerEdge 2900 III服务器进行对比,测试对比平台的详细参数如下: 

测试平台、测试环境
测试分组
类别
宝德四子星PR2760T服务器
双路Intel Westmere-EP
Xeon E5620
DELL PE2900 III服务器
双路Intel Harpertown
Xeon E5430
处理器子系统
处理器
双路Intel Xeon
双路Intel Xeon E5430
处理器架构
Intel 32nm WestmereIntel 45nm Penryn
处理器代号
GulftownHarpertown
处理器封装
Socket 1366 LGASocke 771 LGA
处理器规格
四核四核
处理器指令集
MMX,SSE,SSE2,SSE3,SSSE3,
SSE4.1,SSE4.2,EM64T,VT
MMX,SSE,SSE2,SSE3,SSSE3,
SSE4.1,EM64T,VT
主频2.4GHz2.66GHz
处理器外部总线2xQPI
2673MHz
5.86GT/s
单向11.73GB/s(每QPI)
双向23.46GB/s(每QPI)
FSB
333MHz
1333MT/s
10.6GB/s
L1 D-Cache
4x 32KB
8路集合关联
4x 32KB
8路集合关联
L1 I-Cache
4x 32KB
4路集合关联
4x 32KB
8路集合关联
L2 Cache
4x 256KB
8路集合关联
2x 6144KB
16路集合关联
L3 Cache
12MB
16路集合关联
 
主板型号
SupermicroTylersburg 5500
DELL PE2900 III
芯片组
Intel Tylersburg-EP
IOH:Intel 5500
ICH:Intel 82801JR(ICH10R)
MCH:Intel 5000X
ICH:Intel ESB6321
芯片特性2xQPI
VT-d
2xFSB1333
12MB Snoop Filter
VT-d
内存控制器
CPU集成三通道R-ECC DDR3 1333北桥集成四通道FBD DDR2 667
内存
2GB R-ECC DDR3 1333 SDRAM x42GB FBD DDR2 667 SDRAM x4
系统磁盘子系统
磁盘控制器
Intel ICH10R SATA RAID Controller
DELL Perc 5/i RAID Controller
磁盘控制器规格
6x SATA 3Gb/s
AHCI w/ NCQ
RAID 0/1/3/5
8xSAS 3Gbps
磁盘控制器设置
NCQ
-
磁盘控制器驱动
Intel Matrix Storage Manager 8.9.0.1023LSI SAS
3.8.0.64
磁盘
Seagate
Barracuda ES.2
ST3750330NS
Seagate
Cheetah 15K.5
ST314655SS
磁盘规格
7200RPM
750GB
SATAS 3Gbps
32MB Cache
15000RPM
146GB
SAS 3Gbps
16MB Cache
磁盘设置
SATA 3Gbps
100GB系统分区
SAS 3Gbps
20GB系统分区
网络子系统
Intel 82576 Gigabit Dual Port Network ControllerBroadcom BCM5708C
PCI-E千兆网卡 x2
网卡设置
PCI Express x4
I/OAT
Intel Teaming
Load Balancing
PCI Express x1
Broadcom NIC Teaming
Load Balancing
网卡驱动
Intel PRO Set
10.3.49.00
Broadcom NetXtreme 2
11.04.01
软件环境
操作系统Microsoft
Windows Server 2008 R2 Enterprise Edition x64
Microsoft
Windows Server 2008 Enterprise Edition SP1 x64

CPU-Z软件检测信息
Westmere-EP  Xeon E5620处理器,主频2.4GHz,软件识别QPI总线频率2900MHz
CPU-Z软件检测信息
这部分相比Nehalem-EP来说没什么变化(6核心的会有变化)
CPU-Z软件检测信息
Intel Tylersburg芯片组,采用Intel 5500 + ICH10R芯片组
CPU-Z软件检测信息
CPU-Z软件检测信息
24GB R-ECC DDR3 1333内存,三通道设置(测试时我们更换了新的内存,获取更好的性能)

  下面是Everest软件主板芯片组信息的扫描。 

Everest软件检测信息
宝德送测的这台服务器每平台配备了单颗处理器,这里我们可以看到8个线程,其中4个是通过SMT功能实现的
Everest软件检测信息
处理器QPI相关信息
Everest软件检测信息
出于三通道及运行测试程序的考虑,我们对服务器的内存进行了更换,大家看到的内存容量为24GB
Everest软件检测信息
Everest软件检测信息
Tylersburg 5500芯片组信息,南桥依然是我们熟悉的ICH10R

  SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,它可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台。我们利用了其中多个性能测试模块对于被测系统的性能进行了快速的测试。

SiSoftware Sandra Pro Business 2010
测试对象
宝德四子星PR2760T服务器
双路Intel Westmere-EP
Xeon E5620
2.4GHz
DELL PE2900 III
双路Intel Harptown
Xeon E5430
2.66GHz
Processor Arithmetic Benchmark
处理器架构测试
Dhrystone ALU
68620MIPS
91006MIPS
Dhrystone ALU vs SPEED27160MIPS/MHz34.21MIPS/MHz
Whetstone iSSE3
51880MFLOPS
78385MFLOPS
Dhrystone iSSE3 vs SPEED20530MFLOPS/MHz29.47MFLOPS/MHz
Processor Multi-Media Benchmark
处理器多媒体测试
Multi-Media Int x16 iSSE4.1
129.19MPixel/s
 
Multi-Media Int x8 iSSE4.1 199.33MPixel/s
Multi-Media Int x16 iSSE4.1 vs SPEED
51.12kkPixels/s/MHz 
Multi-Media Int x8 iSSE4.1 vs SPEED 74.94kPixels/s/MHz
Multi-Media Float x8 iSSE2
96.31MPixel/s
 
Multi-Media Float x4 iSSE2
 
108.69MPixel/s
Multi-Media Float x8 iSSE2 vs SPEED
38.11kPixels/s/MHz 
Multi-Media Float x4 iSSE2 vs SPEED
 40.86kPixels/s/MHz
Multi-Media Double x4 iSSE2
52.34MPixel/s
 
Multi-Media Double x2 iSSE2
 
55.75MPixel/s
Multi-Media Double x4 iSSE2 vs SPEED
20.71kPixels/s/MHz 
Multi-Media Double x2 iSSE2 vs SPEED
 20.96kPixels/s/MHz
Multi-Core Efficiency Benchmark
Inter-Core Bandwidth
33.24GB/s
20.54GB/s
Inter-Core Bandwidth vs SPEED
13.47MB/s/MHz7.91MB/s/MHz
Inter-Core Latency(越小越好)
18ns
90ns
Inter-Core Latency vs SPEED
(越小越好)
0.01ns/MHz0.03ns/MHz
.NET Arithmetic Benchmark
.NET架构测试
Dhrystone .NET
12170MIPS
10562MIPS
Dhrystone .NET vs SPEED
4.82MIPS/MHz3.97MIPS/MHz
Whetstone .NET
35900MFLOPS
45399MFLOPS
Whetstone .NET vs SPEED
14.20MFLOPS/MHz17.07MFLOPS/MHz
.NET Multi-Media Benchmark
.NET多媒体测试
Multi-Media Int x1 .NET
25.3MPixel/s
31.28MPixel/s
Multi-Media Int x1 .NET vs SPEED
10.01kPixels/s/MHz11.76kPixels/s/MHz
Multi-Media Float x1 .NET
10.73MPixel/s
8.68MPixel/s
Multi-Media Float x1 .NET vs SPEED
4.24kPixels/s/MHz3.26kPixels/s/MHz
Multi-Media Double x1 .NET
19.87MPixel/s
24.75MPixel/s
Multi-Media Double x1 .NET vs SPEED
7.86kPixels/s/MHz9.30kPixels/s/MHz

    从数值上看,两款平台的成绩差不多,处理器相关的测试中基准服务器略占优势,而在.NET测试中被测服务器则出现了领先。值得一提的是,本次我们测试的宝德四子星PR2760T服务器平台使用的是单颗处理器,而基准服务器是双路服务器。换句话说,单颗E5620的处理能力已经接近了双路E5430的处理器能力。虽然同为8核心平台,但是E5620有一半的核心是虚拟出的,这也从侧面证明了Westmere-EP新一代处理器的强大。

  SiSoftware Sandra缓存内存测试主要包括内存带宽、内存延迟等性能的测试。

SiSoftware Sandra Pro Business 2010
测试对象
宝德四子星PR2760T服务器
双路Intel Westmere-EP
Xeon E5620
2.4GHz
DELL PE2900 III
双路Intel Harptown
Xeon E5430
2.66GHz
Memory Bandwidth Benchmark
内存带宽测试
Int Buff'd iSSE2 Memory Bandwidth
19GB/s6.13GB/s
Int Buff'd iSSE2 Memory Bandwidth vs SPEED
18.26MB/s/MHz9.43MB/s/MHz
Float Buff'd iSSE2 Memory Bandwidth
19GB/s6.13GB/s
Float Buff'd iSSE2 Memory Bandwidth vs SPEED
18.26MB/s/MHz9.43MB/s/MHz
Memory Latency Benchmark
内存延迟测试
Memory(Random Access) Latency
(越小越好)
90ns108ns
Memory(Random Access) Latency vs SPEED
(越小越好)
0.08ns/MHz0.16ns/MHz
Speed Factor(越小越好)
60.2095.20
Internal Data Cache
4clocks
3clocks
L2 On-board Cache
9clocks
18clocks
L3 On-board Cache
51clocks
 
Cache and Memory Benchmark
缓存及内存测试
Cache/Memory Bandwidth
57.4GB/s
68.88GB/s
Cache/Memory Bandwidth vs SPEED
23.26MB/s/MHz26.52MB/s/MHz
Speed Factor(越小越好)
19111.90
Internal Data Cache196.6GB/s421.23GB/s
L2 On-board Cache126.2GB/s122.68GB/s

  和刚才的处理器测试相比,Westmere-EP处理器在内存测试中更是显示出了优势。由于整合了内存控制器,它的内存带宽和延迟表现都要好于基准平台。

  CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,我们的平台偏向于服务器多一些,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。

CineBench R10性能测试

CineBench R10
处理器
宝德四子星PR2760T服务器
双路Intel Westmere-EP
Xeon E5620
2.4GHz
DELL PE 2900 III
双路Intel Harpertown
Xeon E5430
显卡集成集成
CPU Benchmark
Rendering (1 CPU)3846 CB-CPU2931 CB-CPU
Rendering (x CPU)
14154 CB-CPU
16806 CB-CPU
Multiprocessor Speedup
3.68x
5.73x
OpenGL Benchmark
OpenGL Standard
211 CB-GFX
176 CB-GFX

   CineBench软件可以看出单路和双路处理器计算的明显区别。单处理器测试中,E5620处理器取得了明显的领先,多处理器中虚拟的核心还是不如物理的有效,略显落后一些。从MS的数值上我们可以清楚的看到单路和双路平台的差异。

  本次我们测试的宝德四子星PR2760T服务器并没有组建阵列,因此我们使用了单磁盘进行测试。如此一来,我们基准服务器也使用的是单磁盘,更能看出不同磁盘控制器的性能差异。

Iometer磁盘子系统性能测试
IO读
Iometer磁盘子系统性能测试
IO写
Iometer磁盘子系统性能测试
MBps吞吐量读取Iometer磁盘子系统性能测试
MBps吞吐量写入

  由于两台服务器都使用的是单磁盘,所以成绩看起来并没有阵列卡那么好看。不过从整体性能来看,被测服务器出了在IOps读取速度上落后之外,在IOps写入特别是吞吐量读写的测试中都要高一些,看来ICH10R的南桥能力也不弱。

  我们在被测服务器上安装了Microsoft SQL 2005 SP1,按照测试要求建立了数据库。BF在测试之前会在数据库中生成9个表,其中包括4个500万行的表格,每行包括100字节的数据,因此每个表格容量大约是476MB,整个数据库容量为1.86GB。我们用60个客户端模拟1000个用户,在这个数据库中进行查询、添加、删除、修改等操作。

SQL 2005数据库测试

  虽然两台服务器都是单磁盘,但是在数据库上还是体现出了明显的差距,这也说明E5620在性能上还是领先的。我们看到,被测服务器可以达到接近90000TPS的成绩,这个成绩和单路SMT至强5600系列的成绩是相符的。相比之下我们的双路基准平台只有不到60000TPS的成绩,差距在50%左右。

  【IT168评测中心】高密度计算一直是许多服务器厂商追求的目标,刀片服务器的出现在很大程度上解决了这个问题。同样,我们看到越来越多的厂商在机架式服务器中开始尝试高密度计算,比如之前我们介绍的惠普DL170G6,再比如本次我们测试的宝德四子星PR2760T。

11
宝德四子星PR2760T服务器送测样机

  作为宝德特色的四子星来说,PR2760T服务器有着许多看点,最大的优势还在于在2U的高度内整合了4个至强5600平台,从而在保证运算能力的前提下节省了空间。双路至强5600平台的使用大大提升了服务器性能,而冗余电源的设计更为服务器的稳定运行作出了贡献。

  就性能来说,由于本次我们测试的宝德四子星PR2760T每个平台使用的是单颗处理器,所以看起来成绩有些单薄。但与我们的基准平台相比,单颗E5620已经可以和双路E5430媲美,这也从另一个角度说明了Westmere-EP平台的性能不俗。

  总体而言,本次我们测试的宝德四子星PR2760T服务器是一台能够胜任高运算要求的高密度服务器,无论是从应用还是托管的角度来说都非常适合中小企业选购。

0
相关文章