【IT168 评测中心】在我们的印象中,存储服务器都是布满硬盘仓。就拿一台2U的服务器为例,一般来说12个3.5英寸硬盘仓或者8个2.5英寸硬盘仓已经算是数量很多的了。而对于4U的服务器来说,这个数字又能到多少呢?是不是仅仅翻了一倍?今天,一款来自宝德的存储服务器带给了我们答案,让人惊奇的是它居然提供了36个3.5英寸硬盘仓。
宝德PR4036NS服务器
宝德PR4036NS服务器是来自小巨人S系列的新一代云存储服务器,它的最大特点就是提供了前后硬盘仓的设计,这样可以提供更多的硬盘位。宝德总是这么富有创意,从双子星到四子星,宝德推出的独特并且实用的服务器一向为业界所关注,而本次宝德PR4036NS服务器就是一款颇具特色的产品。当然如果从前面看来,你或许还不知道它的奥秘在哪里。
宝德PR4036NS服务器风度的硬盘位
亮点来了,宝德PR4036NS服务器出了在正面提供24个硬盘位置外,在机身背面还有12个硬盘位。这样的设计的确不多见,这相当于为服务器提供了多余50%的存储空间,自然在磁盘容量上也比同类产品更胜一筹。
宝德PR4036NS服务器服务器前置指示灯及电源按键
由于硬盘位占据了前面板的所有位置,宝德PR4036NS服务器只是在左下角提供了一个简单的电源开关及状态指示灯,为服务器提供基本的状态指示功能。
对于这台设计独特的4U服务器,相信大家都有着浓厚的兴趣。究竟它的内部结构是什么样的,如此众多的硬盘,在功耗及散热方面又有哪些的保障呢?我们下面就一起来看看。
宝德PR4036NS服务器
宝德PR4036NS服务器的内部设计很简单,我们收到的这款测试样机只有单路的处理器。因为主要涉及存储应用,所以的服务器的硬件配置并不是很高。
宝德PR4036NS服务器散热系统
散热方面,宝德PR4036NS服务器提供了7个模块化的风扇,用于处理器、内存等系统的整体散热。不过对于这样双层的设计,我们并没有看到它在底层的24个硬盘是如何散热的,这也是我们最大的疑惑。
超微1400W功率电源
既然搭配了如此众多的硬盘,服务器的供电系统也必须是非常强悍才行。这里我们看到,宝德PR4036NS服务器使用的是双电源冗余设计,搭配的电源都是来自超微的1400W大功率产品。这样绝对保证了服务器的稳定性。
看过了供电及散热系统,想必大家对于服务器的处理器、内存、磁盘等内容也很关心,我们这里也顺便介绍一下。
至强E5506处理器
作为Nehalem-EP系列的产品,至强5500系列包括X、E和L三个规格的产品。至强E5506的主频为2.13GHz,基于Nehalem-EP微架构,L3缓存为4MB,标称TDP为80W。和至强550X多款产品一样,E5506也没有提供对于超线程功能的支持(SMT),这对于性能来说会有一定的影响。
来自威刚的4GB DDR3内存,说实话,威刚内存在服务器中并不多见
容量为1TB的西数黑盘
服务器自带的阵列卡,型号未知
如此,我们对于宝德PR4036NS服务器的硬件介绍就到这里了。接下来,我们将对其性能进行详细的测试,当然针对服务器的特点,测试主要是基于单机性能及存储性能进行。
服务器平台信息 | |
产品名称 | 宝德PR4036NS服务器 |
平台类型 | 单路Intel Xeon E5506 |
处理器子系统 | |
---|---|
处理器型号 | Intel Xeon E5506 |
处理器架构 | Intel 45nm Nehalem |
代号 | Nehalem-EP |
处理器封装 | Socket 1156 LGA |
核心/线程数量 | 四核 |
主频 | MMX,SSE,SSE2,SSE3,SSSE3, SSE4.1,SSE4.2,EM64T,VT |
处理器指令集 | 2.13GHz |
外部总线 | 2x QPI 2400MHz 4.8GT/s 单向9.6GB/s(每QPI) 双向19.2GB/s(每QPI) |
L1 Code Cache | 4x 32KB 8路集合关联 |
L1 Data Cache | 4x 32KB 4路集合关联 |
L2 Cache | 4x 256KB 8路集合关联 |
L3 Cache | 4MB @ 2664MHz 16路集合关联 |
服务器主板 | |
主板型号 | 宝德PR4036NS |
主板芯片组 | Intel Tylersburg-EP IOH:Intel 5500(Tylersburg-36D) ICH:Intel 82801JR(ICH10R) |
北桥芯片特性 | 2x QPI 24 PCI Express Gen2 Lanes VT-d Gen 2 |
内存子系统 | |
内存控制器 | 每CPU集成三通道R-ECC DDR3 1333 主板实现双通道 |
内存类型 | 4GB ECC DDR3 1066 SDRAM x4 |
存储子系统 | |
磁盘控制器 | 宝德PR4036NS |
磁盘控制器规格 | 36× SATA 3Gbps Hardware RAID 0/1/5/6 |
控制器驱动 | LSI MegaSR 13.06.0212.2009 |
硬盘型号数量 | 西数1TB WD1002FBYS |
硬盘规格 | 7200RPM 1TB SATA 3Gbps 32MB Cache |
软件环境 | |
操作系统 | Microsoft Windows Server 2008 Enterprise R2 x64 |
本次测试我们选择了常见的Microsoft Windows Server 2008 Enterprise Edition x64操作系统作为平台,所有测试基于这个平台展开。
对于服务器的测试,我们主要从产品满足用户应用的角度出发,分功能和性能两个方面来考察。其中性能测试主要体现的是服务器在提供特定服务时的具体的事务处理能力,而在功能上,主要反映的是服务器的可靠性、可扩展性以及易用性等方面的特征。另外,由于不论是最终用户还是处理器厂商,大家对于服务器的能耗问题都给以了很高的重视,为此,我们也继续将能耗作为考察服务器使用成本的重要指标。
▲网络测试环境
贴近应用的性能测试
在实际的应用中,不同的应用条件对于服务器子系统性能的要求也有一定的偏重,因此同一服务器在不同应用中所表现出的性能状况常会出现较大差异。为了能准确反映出服务器的性能状况,我们选择了Web、文件服务器和数据库等三种较为普遍的应用作为测试重点。之所以选用以上三种应用作为性能测试点,这几项应用相对较为普遍是原因之一,此外我们也考虑到这三种应用对于服务器子系统的要求也各有偏重,这样可以更全面的考察服务器各子系统的性能状况。
讲求实用的功能测试
可靠性、可扩展性和易用性同样也是用户关心的内容,但不同的用户对这三方面的需求会有所不同。比如一些中高端服务器产品,在应用中多采用专用机房或托管方式,这时其易用性中的可管理性方面就显得非常重要,远程管理会让工程师及时了解服务器工作状况,实现及时有效的管理和维护。而对于入门级服务器来说,由于很多用户会随着业务的增长会对其处理能力、存储容量有进一步的要求,这时其可扩展性就显得更为重要。可靠性是服务器的一个关键特性,它反映了服务器在应用过程中系统能否确保长时间正常工作,这也是服务器与普通PC之间的重要区别。对于以上三个方面,我们都制定了详细项目进行逐一考察。
兼顾使用成本的能效测试
服务器的售价反映的它是一次性的购买成本,而后期的使用成本是一个不容小视的问题,作为一个要求7×24连续工作的设备,它所产生的电费将是一笔不小的开销。实际上在评判服务器的运算能力时,一定不能将功耗问题视而不见,性能功耗比是衡量服务器运算效能的一个重要指标,测试中我们利用功率分析仪对服务器在加电关机、开机空载以及满负载三种状态下的功耗进行测定,为服务器的能效以及使用成本的估算提供数据支持。
为了进行网络产品的测试,IT168评测中心专门组建了网络实验室,并搭建了一个有60台客户端的网络测试环境,通过控制端并利用专业的网络测试软件,可以构建出多样化的网络访问模型,能够产生真实的多用户网络应用环境。可以对服务器类设备进行不同应用下的高压力性能测试,以直观的结果反映出服务器产品在用于不同应用时其真实的性能状况。
我们采用Cisco Catalyst 4506千兆交换机作为测试环境的交换设备,60台客户端采用的是DELL PowerEdge SC430以及DELL PowerEdge T100两种塔式的单路服务器,能产生足够大的网络访问压力,因而可以测试服务器类设备在实现不同应用时的极限性能。
▲网络实验室控制台
▲Cisco Catalyst 4506千兆交换机,120个千兆网口
▲用于产生用户访问压力的Dell PowerEdge SC430服务器
对于服务器性能方面的考察,我们主要分为子系统测试和应用性能测试。在子系统测试中我们按处理器、内存以及磁盘等各个子系统进行了分项测试,当然各子系统的测试成绩也是相辅相成,也需要其它子系统的支持,并非是完全独立的,只是对考察的子系统有所偏重而已。
- 处理器子系统测试
对服务器处理器子系统的考察,我们主要采用的是业界公认的SPEC CPU 2006测试,该项测试通过对数十个典型应用程序的运行,来测试系统处理器子系统在应用中的整、浮点运算效率。SPEC CPU 2006测试具有很好的开放性,因此在业界为广大用户所接受,可以利用这一公开的测试结果进行系统间运算性能的比较。
此外SiSoftware Sandra也有测试子项可用于处理器运算性能测试,其结果通常以每秒完成的指令数来表现。也可以用作不同处理器间运算效率的比较。
SPEC CPU 2006 v1.1
SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。
SPEC CPU 2006是SPEC组织推出的CPU子系统评估软件最新版,我们之前使用的是SPEC CPU 2000。和上一个版本一样,SPEC CPU 2006包括了CINT2006和CFP2006两个子项目,前者用于测量和对比整数性能,后者则用于测量和对比浮点性能,SPEC CPU 2006中对SPEC CPU 2000中的一些测试进行了升级,并抛弃/加入了一些测试,因此两个版本测试得分并没有可比较性。
SPEC CPU测试中,测试系统的处理器、内存子系统和使用到的编译器(SPEC CPU提供的是源代码,并且允许测试用户进行一定的编译优化)都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2006的影响非常的小。
SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。
我们在被测服务器中安装了Intel C++ 11.1.034 Compiler、Intel Fortran 11.1.034 Compiler这两款SPEC CPU 2006必需的编译器,通过最新出现的QxS编译参数,Intel Compiler 10版本开始支持对Intel SSE4指令集进行优化(假如只支持SSE3,则使用QxT编译参数)。我们另外安装了Microsoft Visual Studio 2003 SP1提供必要的库文件。按照SPEC的要求我们根据自己的情况编辑了新的Config文件,使用了较多的编译选项。我们根据被测系统选择实际可同时处理的线程数量,最后得到SPEC rate base测试结果(基于base标准编译,SPEC base rate测试代表系统同时处理多个任务的能力)。
和其它测试部件不同,SPEC CPU 2006需要大量的系统物理内存,我们的SPEC测试在64位的Windows Server 2008 R2 下完成,对于每个运算核心,最低配置1.5GB内存。
- 内存子系统测试
对于内存子系统的考察,也是利用SiSoftware Sandra来实现,在该软件中有相应组件可进行内存带宽、内存延迟等方面的测试。
SiSoftware Sandra v2010
SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。从2007开始,Sandra的Arithmetic benchmarks增加了对SSE3&SSE4 SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,另外还升级了File System benchmark和Removable Storage benchmark两个子项目。对于新的硬件的支持当然也是该软件每次升级的重要内容之一,SiSoftware Sandra 2010对NUMA架构以及最新的Windows 7/Windows Server 2008 R2提供了更好的支持,此外测试项目和测试结果也有了略微的变化。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台。
- 存储子系统测试
对存储子系统的考察,是利用IOMeter这一软件来完成。
IOMeter 2006.07.27
IOMeter是一款功能非常强大的IO测试软件,它除了可以在本机运行测试本机的磁盘IO性能之外,还提供了模拟网络应用的能力。为了大家能更好的通过我们的测试数据进行不同系统之间的对比,我们在测试中都使用相同的脚本。其中的最大IO能力的测试中我们所采用的了数据块大小为512B,100%读取操作,随机率为0%。而另一测试数据块大小则选择了64KB,100%读取操作,随机率为0%,用于检测磁盘系统的最大吞吐量。
- 网络应用性能测试
应用性能测试则利用IT168的网络测试环境,模拟大量的客户端来实现对服务器进行访问,来测试服务器分别在提供Web、文件服务器和数据库服务时的性能表现。
WebBench性能测试
WebBench是针对服务器作为Web Server时的性能进行测试,我们在服务器上安装了IIS6.0组件,以提供测试所需的Web服务。在测试中我们使用了网络实验室中的60台客户端,分别使用了WebBench 5.0内置的动态CGI以及静态页面脚本对服务器进行了测试。
静态测试是由客户端读取预先放置在服务器Web Server下的Web页面(wbtree),这项测试主要考察的是服务器磁盘系统以及网络连接性能。
动态测试偏重于对服务器CPU子系统的性能测试,它对于Web服务器提供了足够的负载。当WebBench测试开始后,客户端会以每四台一组依次连接到服务器并发送CGI请求。当测试结束后,控制台会收集数据并绘制出服务器CGI响应数的变化曲线。CGI测试的成绩高低,主要取决于服务器处理器子系统性能的优劣。处理器子系统包括CPU、内存以及内存控制器,CPU频率、缓存以及内存容量大小和内存带宽,都会影响该项成绩。
NetBench 7.03性能测试
NetBench是针对文件服务器的性能测试软件,影响NetBench性能的主要是服务器的磁盘子系统,这里所使用的磁盘RAID卡对于测试结果将会有明显的影响。测试中我们在被测服务器上设立了文件服务器,NetBench通过网络实验室中60个客户端来模拟网络中的PC向文件服务器所发出的文件传输请求,文件服务器则将存储在磁盘上的文件数据发送给相应的客户端。同Webbench测试一样,NetBench测试开始后客户端会以每四台一组依连接到服务器并发送文件传输请求。测试结束后控制台收集数据并绘制出服务器能够达到的数据传输变化曲线。
Benchmark Factory for Databases 5.7.1g
数据库是服务器最为常见的一种应用,为了考察服务器在作为数据库的硬件平台时的性能表现,我们采用了Benchmark Factory for Databases 5.7.1g,利用Benchmark Factory内置的标准测试脚本AS3AP,可用于对于ANSI结构化查询语言(SQL)关系型数据库进行测试,不仅可用于测试DBMS(单用户微机数据库管理系统),也可用于测试高性能并行或者分布式数据库。
Benchmark Factory在测试之前会在数据库中生成多个表,其中包括4个500万行的表,每行包括100字节的数据,因此每个表容量大约是476MB,整个数据库容量为1.86GB。我们用实验室的60个客户端模拟1000个用户,在这个数据库中进行查询、添加、删除、修改等操作。可以给被测试的服务器施加相当大的测试压力。
SiSoftware Sandra Pro Business 2010 | |
产品名称 | 宝德PR4036NS服务器 |
平台类型 | 单路Intel Nehaleme-EP |
处理器型号 | Intel Xeon E5506 |
Processor Arithmetic Benchmark 处理器算术运算测试 | |
---|---|
Dhrystone ALU | 52603MIPS |
Dhrystone ALU vs SPEED | 24.66MIPS/MHz |
Whetstone iSSE3 | 26967MFLOPS |
Dhrystone iSSE3 vs SPEED | 12.64MFLOPS/MHz |
Processor Multi-Media Benchmark 处理器多媒体测试 | |
Multi-Media Int x16 iSSE4.1 | 90.46MPixel/s |
Multi-Media Int x16 iSSE4.1 vs SPEED | 42.41kPixels/s/MHz |
Multi-Media Float x8 iSSE2 | 69.09MPixel/s |
Multi-Media Float x8 iSSE2 vs SPEED | 32.39kPixels/s/MHz |
Multi-Media Double x4 iSSE2 | 36.06MPixel/s |
Multi-Media Double x4 iSSE2 vs SPEED | 16.91kPixels/s/MHz |
Multi-Core Efficiency Benchmark 处理器效能测试 | |
Inter-Core Bandwidth | 10.05GB/s |
Inter-Core Bandwidth vs SPEED | 4.82MB/s/MHz |
Inter-Core Latency(越小越好) | 78ns |
Inter-Core Latency vs SPEED(越小越好) | 0.04ns/MHz |
.NET Arithmetic Benchmark .NET算术运算测试 | |
Dhrystone .NET | 8544MIPS |
Dhrystone .NET vs SPEED | 4.01MIPS/MHz |
Whetstone .NET | 18348MFLOPS |
Whetstone .NET vs SPEED | 8.60MFLOPS/MHz |
.NET Multi-Media Benchmark .NET多媒体测试 | |
Multi-Media Int x1 .NET | 18.02MPixel/s |
Multi-Media Int x1 .NET vs SPEED | 8.45kPixels/s/MHz |
Multi-Media Float x1 .NET | 5.21MPixel/s |
Multi-Media Float x1 .NET vs SPEED | 2.44kPixels/s/MHz |
Multi-Media Double x1 .NET | 9.78MPixel/s |
Multi-Media Double x1 .NET vs SPEED | 4.59kPixels/s/MHz |
从以上测试结果来看,宝德PR4036NS服务器由于使用的是单路处理器,各项测试结果看起来比我们常见的双路成绩要低一些。
SiSoftware Sandra Pro Business 2010 | |
产品名称 | 宝德PR4036NS服务器 |
平台类型 | 单路Intel Nehaleme-EP |
处理器型号 | Xeon 5506 |
Memory Bandwidth Benchmark 内存带宽测试 | |
---|---|
Int Buff'd iSSE2 Memory Bandwidth | 14.10GB/s |
Float Buff'd iSSE2 Memory Bandwidth | 14.12GB/s |
Memory Latency Benchmark 内存延迟测试 | |
Memory(Random Access) Latency (越小越好) | 109ns |
Speed Factor (越小越好) | 57.10 |
Internal Data Cache | 4clocks |
L2 On-board Cache | 10clocks |
L3 On-board Cache | 49clocks |
Cache and Memory Benchmark 缓存及内存测试 | |
Cache/Memory Bandwidth | 45.83GB/s |
Cache/Memory Bandwidth vs SPEED | 22.00MB/s/MHz |
Speed Factor (越小越好) | 22.10 |
Integrated Data Cache | 173.75GB/s |
L2 On-board Cache | 146.01GB/s |
从Nehalem-EP开始,Intel在处理器内部整合了内存控制器,这样使得平台的内存带宽得到了明显的提升。本次的被测服务器使用的是三通道内存,测试成绩还不错。
CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,我们的平台偏向于服务器多一些,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。
我们截取了CineBench R10中的处理器测试成绩来进行。由于单路处理器的原因,我们看到的MS值为3.68,如果有HT技术的话不仅仅是这个数值。
以下截图反映的是宝德PR4036NS服务器的磁盘读写性能。测试时,我们将宝德PR4036NS服务器自带的SATA硬盘组建的RAID5阵列,条带大小为64KB,预读取,后写入。从测试结果来看,宝德PR4036NS服务器可以达到500MB/s的吞吐速度,对于SATA硬盘来说这样的成绩已经非常不容易了,相比SAS硬盘来说它的转速低了一倍,能有如此表现堪称上品。
磁盘IO读写性能
磁盘读写吞吐性能
【IT168 评测中心】宝德PR4036NS服务器的确是一台颇具特色的服务器,从它的构造来看,海量的磁盘存储能力使得它相比同类型产品具备了50%的容量提升,而这完全来自于宝德独特的设计理念。分层设计的服务器其实目前看到的也比较多,比如宝德自家的四子星或者是惠普的四路节点服务器都是基于这样的概念。这种设计的好处是可以有效利用现有空间,提供更高的存储及计算密度。
宝德PR4036NS服务器
从我们测试的结果来看,宝德PR4036NS服务器在存储性能上的确有过人之处,在SATA硬盘的情况下实现了SAS硬盘的存储效能,配合服务器冗余的供电系统及强大的散热系统,我们觉得宝德PR4036NS服务器对于专业存储应用来说是非常适合的。