【IT168评测中心】如今我们都在讨论低碳,特别是IT行业来说更强调环保性。对于服务器来说,由于大部分时间都属于资源浪费的状态,虚拟化这样实用的技术才能大有用武之地。而在同样高度的空间里,比如2U服务器,如何能够实现更大的计算性能呢?高密度产品的出现解决了这个问题,比如我们今天要测试的宝德四子星PR2760T服务器。
从前方面板部局中可以看到,该产品最多可以支持12个3.5英寸热插拔硬盘
前方左侧的两个子系统独立面板
在右侧依旧提供了两个子系统独立面板
这次送测的宝德四子星服务器PR2760T样机采用了双电源配置
和我们常见的机架式服务器不同,四子星服务器的最大特点是在2U的高度内整合了4个服务器平台,这样最大限度的实现了运算效能。本次,我们收到的这款送测样机配备了Intel英特尔 Xeon E5620处理器。至强E5620是一款4核8线程的处理器,其主频为2.4GHz,拥有12MB的三级缓存与5.86GT/秒的QPI速度,TDP为80W。
如何能够在2U的空间内整合4个平台呢?之前我们介绍过惠普的DL170h G6系列,而宝德这台服务器也实现了类似的设计,我们下面就一起来看看。
从图中可以看到左右独立的两块主板,由于该机采用双层结构,所以一共是4个独立的子系统
每块主板都是一个独立的子系统,可以从背部面板实现插拔
每个子系统都是双路设计
机身左右两部分各设计为一个独立的风道,每个风道配备了两个风扇
送测服务器所配置的Nidec风扇
我相信,大家在看过服务器内部的结构之后,更关心每个平台上都配备了什么样的硬件。虽然是双路平台,但是本次送测的产品只配备了单颗处理器,我们更有兴趣知道它每一个平台的性能如何。
想要一睹CPU真容,首先需要拆下做工精良的三热管散热器
CPU插槽开启状态图
送测服务器配备的Intel Xeon E5620 处理器
我们有必要来介绍一下服务器使用的至强E5620处理器。从至强5600系列的整体规格来看,E5620是E系列的最低端型号,这主要是指它的主频较低,只有2.4GHz;Turbo之后的主频最高可以达到2.666GHz。和许多5600处理器一样,它也提供了12MB三级缓存,QPI速度为5.8GT/s,TDP为80W,是一颗4核心8线程的产品。
送测服务器配备的Kingston 2G DDR3 ECC1066内存,共4条提供了最大8GB的容量
此次送测的宝德四子星服务器PR2760T使用了Seagate的企业级硬盘
Seagate ST3750330NS硬盘单块容量750GB,其拥有7200转的转速与32M缓存
送测服务器配置了2个SUPERMICR服务器模块化电源,其型号为PWS-1K21P-1R
单个电源可以为用户提供1200W的最大总功率
从硬件来看,宝德四子星PR2760T服务器的配置属于主流水平,没有太多花哨的内容。最后,我们要介绍的是主板使用的芯片。
Intel JL82576EB 千兆网卡芯片
整合了显卡芯片的多功能控制芯片
来自Intel的ICH10R南桥芯片
用于远程网络管理的Realtek RTL8201N百兆网络芯片
通过以上的内容,我们对宝德四子星PR2760T服务器进行了详细的硬件规格介绍。接下来,我们准备通过测试软件来检测它的子系统性能和数据库性能。在测试之前,我们还是有必要了解一下服务器的软件配置情况。
在2009年秋我们IT168评测中心网络实验室搬迁到新的机房之后,我们又对实验室的服务器测试平台进行了大幅度的升级,先是将已有的Cisco Catalyst 4506千兆交换机升级到3个模块,达到了一共120个千兆网络端口,还新购买了30台DELL PowerEdge T100服务器,配合原有的30台DELL PowerEdge SC430服务器以及30台PC作为网络测试的客户端,可以提供非常充足的测试压力。
网络实验室控制台
在新的测试环境下,我们进一步完善了服务器性能测试方案:
SiSoftware Sandra v2010
SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。从2007开始,Sandra的Arithmetic benchmarks增加了对SSE3&SSE4 SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,另外还升级了File System benchmark和Removable Storage benchmark两个子项目。对于新的硬件的支持当然也是该软件每次升级的重要内容之一,SiSoftware Sandra 2010对NUMA架构以及最新的Windows 7/Windows Server 2008 R2提供了更好的支持,此外测试项目和测试结果也有了略微的变化。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台。
Benchmark Factory for Databases 5.7.1g
我们选择了Benchmark Factory for Databases 5.7.1g软件来进行测试,它是我们之前使用的4.6的升级版本。
我们选择了BF内置的标准测试脚本AS3AP,这项测试可用于对于ANSI结构化查询语言(SQL)关系型数据库进行测试,它可用于测试DBMS(单用户微机数据库管理系统),也可用于测试高性能并行或者分布式数据库。关系性数据库就是用二维表格结构来表示实体及实体之间联系模型的数据库形式。
BF通过一台独立的控制台控制我们的60台服务器充当的客户端产生数据库测试压力,由于客户端所有的资源都用来产生数据库操作,因此可以给服务器施加相当大的测试压力。
CineBench R10
CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,在服务器测试平台中显示子系统不重要,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。
本次评测的宝德四子星PR2760T服务器是一台特别的机器,它的每个平台搭配了一颗至强E5620处理器。测试结果并会与我们IT168评测中心的DELL PowerEdge 2900 III服务器进行对比,测试对比平台的详细参数如下:
测试平台、测试环境 | |||||
测试分组 | |||||
类别 | 宝德四子星PR2760T服务器 双路Intel Westmere-EP Xeon E5620 | DELL PE2900 III服务器 双路Intel Harpertown Xeon E5430 | |||
处理器子系统 | |||||
处理器 | 双路Intel Xeon | 双路Intel Xeon E5430 | |||
处理器架构 | Intel 32nm Westmere | Intel 45nm Penryn | |||
处理器代号 | Gulftown | Harpertown | |||
处理器封装 | Socket 1366 LGA | Socke 771 LGA | |||
处理器规格 | 四核 | 四核 | |||
处理器指令集 | MMX,SSE,SSE2,SSE3,SSSE3, SSE4.1,SSE4.2,EM64T,VT | MMX,SSE,SSE2,SSE3,SSSE3, SSE4.1,EM64T,VT | |||
主频 | 2.4GHz | 2.66GHz | |||
处理器外部总线 | 2xQPI 2673MHz 5.86GT/s 单向11.73GB/s(每QPI) 双向23.46GB/s(每QPI) | FSB 333MHz 1333MT/s 10.6GB/s | |||
L1 D-Cache | 4x 32KB 8路集合关联 | 4x 32KB 8路集合关联 | |||
L1 I-Cache | 4x 32KB 4路集合关联 | 4x 32KB 8路集合关联 | |||
L2 Cache | 4x 256KB 8路集合关联 | 2x 6144KB 16路集合关联 | |||
L3 Cache | 12MB 16路集合关联 | ||||
主板型号 | SupermicroTylersburg 5500 | DELL PE2900 III | |||
芯片组 | Intel Tylersburg-EP IOH:Intel 5500 ICH:Intel 82801JR(ICH10R) | MCH:Intel 5000X ICH:Intel ESB6321 | |||
芯片特性 | 2xQPI VT-d | 2xFSB1333 12MB Snoop Filter VT-d | |||
内存控制器 | 每CPU集成三通道R-ECC DDR3 1333 | 北桥集成四通道FBD DDR2 667 | |||
内存 | 2GB R-ECC DDR3 1333 SDRAM x4 | 2GB FBD DDR2 667 SDRAM x4 | |||
系统磁盘子系统 | |||||
磁盘控制器 | Intel ICH10R SATA RAID Controller | DELL Perc 5/i RAID Controller | |||
磁盘控制器规格 | 6x SATA 3Gb/s AHCI w/ NCQ RAID 0/1/3/5 | 8xSAS 3Gbps | |||
磁盘控制器设置 | NCQ | - | |||
磁盘控制器驱动 | Intel Matrix Storage Manager 8.9.0.1023 | LSI SAS 3.8.0.64 | |||
磁盘 | Seagate Barracuda ES.2 ST3750330NS | Seagate Cheetah 15K.5 ST314655SS | |||
磁盘规格 | 7200RPM 750GB SATAS 3Gbps 32MB Cache | 15000RPM 146GB SAS 3Gbps 16MB Cache | |||
磁盘设置 | SATA 3Gbps 100GB系统分区 | SAS 3Gbps 20GB系统分区 | |||
网络子系统 | |||||
Intel 82576 Gigabit Dual Port Network Controller | Broadcom BCM5708C PCI-E千兆网卡 x2 | ||||
网卡设置 | PCI Express x4 I/OAT Intel Teaming Load Balancing | PCI Express x1 Broadcom NIC Teaming Load Balancing | |||
网卡驱动 | Intel PRO Set 10.3.49.00 | Broadcom NetXtreme 2 11.04.01 | |||
软件环境 | |||||
操作系统 | Microsoft Windows Server 2008 R2 Enterprise Edition x64 | Microsoft Windows Server 2008 Enterprise Edition SP1 x64 |
Westmere-EP Xeon E5620处理器,主频2.4GHz,软件识别QPI总线频率2900MHz
这部分相比Nehalem-EP来说没什么变化(6核心的会有变化)
Intel Tylersburg芯片组,采用Intel 5500 + ICH10R芯片组
24GB R-ECC DDR3 1333内存,三通道设置(测试时我们更换了新的内存,获取更好的性能)
宝德送测的这台服务器每平台配备了单颗处理器,这里我们可以看到8个线程,其中4个是通过SMT功能实现的
处理器QPI相关信息
出于三通道及运行测试程序的考虑,我们对服务器的内存进行了更换,大家看到的内存容量为24GB
Tylersburg 5500芯片组信息,南桥依然是我们熟悉的ICH10R
SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,它可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台。我们利用了其中多个性能测试模块对于被测系统的性能进行了快速的测试。
SiSoftware Sandra Pro Business 2010 | |||
测试对象 | 宝德四子星PR2760T服务器 双路Intel Westmere-EP Xeon E5620 2.4GHz | DELL PE2900 III 双路Intel Harptown Xeon E5430 2.66GHz | |
Processor Arithmetic Benchmark 处理器架构测试 | |||
Dhrystone ALU | 68620MIPS | 91006MIPS | |
Dhrystone ALU vs SPEED | 27160MIPS/MHz | 34.21MIPS/MHz | |
Whetstone iSSE3 | 51880MFLOPS | 78385MFLOPS | |
Dhrystone iSSE3 vs SPEED | 20530MFLOPS/MHz | 29.47MFLOPS/MHz | |
Processor Multi-Media Benchmark 处理器多媒体测试 | |||
Multi-Media Int x16 iSSE4.1 | 129.19MPixel/s | ||
Multi-Media Int x8 iSSE4.1 | 199.33MPixel/s | ||
Multi-Media Int x16 iSSE4.1 vs SPEED | 51.12kkPixels/s/MHz | ||
Multi-Media Int x8 iSSE4.1 vs SPEED | 74.94kPixels/s/MHz | ||
Multi-Media Float x8 iSSE2 | 96.31MPixel/s | ||
Multi-Media Float x4 iSSE2 | 108.69MPixel/s | ||
Multi-Media Float x8 iSSE2 vs SPEED | 38.11kPixels/s/MHz | ||
Multi-Media Float x4 iSSE2 vs SPEED | 40.86kPixels/s/MHz | ||
Multi-Media Double x4 iSSE2 | 52.34MPixel/s | ||
Multi-Media Double x2 iSSE2 | 55.75MPixel/s | ||
Multi-Media Double x4 iSSE2 vs SPEED | 20.71kPixels/s/MHz | ||
Multi-Media Double x2 iSSE2 vs SPEED | 20.96kPixels/s/MHz | ||
Multi-Core Efficiency Benchmark | |||
Inter-Core Bandwidth | 33.24GB/s | 20.54GB/s | |
Inter-Core Bandwidth vs SPEED | 13.47MB/s/MHz | 7.91MB/s/MHz | |
Inter-Core Latency(越小越好) | 18ns | 90ns | |
Inter-Core Latency vs SPEED (越小越好) | 0.01ns/MHz | 0.03ns/MHz | |
.NET Arithmetic Benchmark .NET架构测试 | |||
Dhrystone .NET | 12170MIPS | 10562MIPS | |
Dhrystone .NET vs SPEED | 4.82MIPS/MHz | 3.97MIPS/MHz | |
Whetstone .NET | 35900MFLOPS | 45399MFLOPS | |
Whetstone .NET vs SPEED | 14.20MFLOPS/MHz | 17.07MFLOPS/MHz | |
.NET Multi-Media Benchmark .NET多媒体测试 | |||
Multi-Media Int x1 .NET | 25.3MPixel/s | 31.28MPixel/s | |
Multi-Media Int x1 .NET vs SPEED | 10.01kPixels/s/MHz | 11.76kPixels/s/MHz | |
Multi-Media Float x1 .NET | 10.73MPixel/s | 8.68MPixel/s | |
Multi-Media Float x1 .NET vs SPEED | 4.24kPixels/s/MHz | 3.26kPixels/s/MHz | |
Multi-Media Double x1 .NET | 19.87MPixel/s | 24.75MPixel/s | |
Multi-Media Double x1 .NET vs SPEED | 7.86kPixels/s/MHz | 9.30kPixels/s/MHz |
从数值上看,两款平台的成绩差不多,处理器相关的测试中基准服务器略占优势,而在.NET测试中被测服务器则出现了领先。值得一提的是,本次我们测试的宝德四子星PR2760T服务器平台使用的是单颗处理器,而基准服务器是双路服务器。换句话说,单颗E5620的处理能力已经接近了双路E5430的处理器能力。虽然同为8核心平台,但是E5620有一半的核心是虚拟出的,这也从侧面证明了Westmere-EP新一代处理器的强大。
SiSoftware Sandra缓存内存测试主要包括内存带宽、内存延迟等性能的测试。
SiSoftware Sandra Pro Business 2010 | |||
测试对象 | 宝德四子星PR2760T服务器 双路Intel Westmere-EP Xeon E5620 2.4GHz | DELL PE2900 III 双路Intel Harptown Xeon E5430 2.66GHz | |
Memory Bandwidth Benchmark 内存带宽测试 | |||
Int Buff'd iSSE2 Memory Bandwidth | 19GB/s | 6.13GB/s | |
Int Buff'd iSSE2 Memory Bandwidth vs SPEED | 18.26MB/s/MHz | 9.43MB/s/MHz | |
Float Buff'd iSSE2 Memory Bandwidth | 19GB/s | 6.13GB/s | |
Float Buff'd iSSE2 Memory Bandwidth vs SPEED | 18.26MB/s/MHz | 9.43MB/s/MHz | |
Memory Latency Benchmark 内存延迟测试 | |||
Memory(Random Access) Latency (越小越好) | 90ns | 108ns | |
Memory(Random Access) Latency vs SPEED (越小越好) | 0.08ns/MHz | 0.16ns/MHz | |
Speed Factor(越小越好) | 60.20 | 95.20 | |
Internal Data Cache | 4clocks | 3clocks | |
L2 On-board Cache | 9clocks | 18clocks | |
L3 On-board Cache | 51clocks | ||
Cache and Memory Benchmark 缓存及内存测试 | |||
Cache/Memory Bandwidth | 57.4GB/s | 68.88GB/s | |
Cache/Memory Bandwidth vs SPEED | 23.26MB/s/MHz | 26.52MB/s/MHz | |
Speed Factor(越小越好) | 19 | 111.90 | |
Internal Data Cache | 196.6GB/s | 421.23GB/s | |
L2 On-board Cache | 126.2GB/s | 122.68GB/s |
和刚才的处理器测试相比,Westmere-EP处理器在内存测试中更是显示出了优势。由于整合了内存控制器,它的内存带宽和延迟表现都要好于基准平台。
CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,我们的平台偏向于服务器多一些,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。
CineBench R10 | |||
处理器 | 宝德四子星PR2760T服务器 双路Intel Westmere-EP Xeon E5620 2.4GHz | DELL PE 2900 III 双路Intel Harpertown Xeon E5430 | |
显卡 | 集成 | 集成 | |
CPU Benchmark | |||
Rendering (1 CPU) | 3846 CB-CPU | 2931 CB-CPU | |
Rendering (x CPU) | 14154 CB-CPU | 16806 CB-CPU | |
Multiprocessor Speedup | 3.68x | 5.73x | |
OpenGL Benchmark | |||
OpenGL Standard | 211 CB-GFX | 176 CB-GFX |
CineBench软件可以看出单路和双路处理器计算的明显区别。单处理器测试中,E5620处理器取得了明显的领先,多处理器中虚拟的核心还是不如物理的有效,略显落后一些。从MS的数值上我们可以清楚的看到单路和双路平台的差异。
本次我们测试的宝德四子星PR2760T服务器并没有组建阵列,因此我们使用了单磁盘进行测试。如此一来,我们基准服务器也使用的是单磁盘,更能看出不同磁盘控制器的性能差异。
IO读
IO写
MBps吞吐量读取
MBps吞吐量写入
由于两台服务器都使用的是单磁盘,所以成绩看起来并没有阵列卡那么好看。不过从整体性能来看,被测服务器出了在IOps读取速度上落后之外,在IOps写入特别是吞吐量读写的测试中都要高一些,看来ICH10R的南桥能力也不弱。
我们在被测服务器上安装了Microsoft SQL 2005 SP1,按照测试要求建立了数据库。BF在测试之前会在数据库中生成9个表,其中包括4个500万行的表格,每行包括100字节的数据,因此每个表格容量大约是476MB,整个数据库容量为1.86GB。我们用60个客户端模拟1000个用户,在这个数据库中进行查询、添加、删除、修改等操作。
虽然两台服务器都是单磁盘,但是在数据库上还是体现出了明显的差距,这也说明E5620在性能上还是领先的。我们看到,被测服务器可以达到接近90000TPS的成绩,这个成绩和单路SMT至强5600系列的成绩是相符的。相比之下我们的双路基准平台只有不到60000TPS的成绩,差距在50%左右。
【IT168评测中心】高密度计算一直是许多服务器厂商追求的目标,刀片服务器的出现在很大程度上解决了这个问题。同样,我们看到越来越多的厂商在机架式服务器中开始尝试高密度计算,比如之前我们介绍的惠普DL170G6,再比如本次我们测试的宝德四子星PR2760T。
宝德四子星PR2760T服务器送测样机
作为宝德特色的四子星来说,PR2760T服务器有着许多看点,最大的优势还在于在2U的高度内整合了4个至强5600平台,从而在保证运算能力的前提下节省了空间。双路至强5600平台的使用大大提升了服务器性能,而冗余电源的设计更为服务器的稳定运行作出了贡献。
就性能来说,由于本次我们测试的宝德四子星PR2760T每个平台使用的是单颗处理器,所以看起来成绩有些单薄。但与我们的基准平台相比,单颗E5620已经可以和双路E5430媲美,这也从另一个角度说明了Westmere-EP平台的性能不俗。
总体而言,本次我们测试的宝德四子星PR2760T服务器是一台能够胜任高运算要求的高密度服务器,无论是从应用还是托管的角度来说都非常适合中小企业选购。