【IT168评测中心】在两个多月Intel推出Nehalem-EP平台——也就是Xeon 5500系列处理器之后,很快就已经遍地开花,各大厂商都推出了采用Nehalem-EP平台的服务器。然而我们之前见到的都是属于标准的服务器:主要用作网站服务器、数据库服务器用途,文件服务器或存储服务器的类型比较少。这并不是说Nehalem-EP就不适合做这些工作,服务器厂商宝德(PowerLeader)就推出了一款存储服务器,型号为PR2012NS。
从型号来看,后缀NS或许是Network Storage的意思。PR2012NS应该是PR2012S的升级产品,它们都属于宝德以S命名的“小巨人”系列。
从外形上就可以说它是一台存储服务器,八九不离十:宝德PR2012NS提供了多达12个3.5英寸热插拔硬盘槽,说不是存储服务器都没人信。
在2005年度服务器横评之后,我们认为当时的网络实验室无法满足今后继续发展的服务器测试的需要。所以,2006年我们IT168评测中心又斥资几十万对于IT168网络实验室的服务器测试平台进行了大幅度的升级,为思科Catalyst4500千兆交换机(WS-X4013+ Supervisor Engine II-Plus和WS-X4548-GB-RJ45)增加了一个思科全千兆24口模块WS-X4424-GB-RJ45,可同时连接72个千兆铜缆设备和2个光缆设备。另外,我们还购置了29台Dell PowerEdge SC430塔式服务器和原来的32台主流配置PC一起为服务器测试平台的提供负载。2007年,我们又采购性能更强的部分客户端,来确保为新一代的服务器提供足够的测试负载。2009年初,我们又对所有客户端的内存子系统进行了全面的升级。
Catalyst4500千兆交换机
部分Dell PowerEdge SC430服务器
在新的测试环境下,我们进一步完善了服务器性能测试方案:
Iometer 2006.7.27
Iometer是一款功能非常强大的IO测试软件,它除了可以在本机运行测试本机的IO(磁盘)性能之外,还提供了模拟网络应用的能力。在这次的测试中,我们仅仅让它在本机运行测试服务器的磁盘性能。为了全面测试被测服务器的IO性能,我们分别选择了不同的测试脚本。
Max_throughput(read):文件尺寸为64KB,100%读取操作,随机率为0%,用于检测磁盘系统的最大读取吞吐量
Max_IO(read):文件尺寸为512B,100%读取操作,随机率为0%,用于检测磁盘系统的最大读取操作IO处理能力
Max_throughput(write):文件尺寸为64KB,0%读取操作,随机率为0%,用于检测磁盘系统的最大写入吞吐量
Max_IO(write):文件尺寸为512B,0%读取操作,随机率为0%,用于检测磁盘系统的最大写入操作IO处理能力
SiSoftware Sandra v2009
SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。从2007开始,Sandra的Arithmetic benchmarks增加了对SSE3 & SSE4 SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,另外还升级了File System benchmark和Removable Storage benchmark两个子项目。对于新的硬件的支持当然也是该软件每次升级的重要内容之一。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台,这也是我们选择这款软件的原因之一。
NetBench v7.03
NetBench是针对文件服务器的性能测试软件,影响NetBench性能的主要是服务器的磁盘子系统,服务器磁盘控制器、条带大小、读写缓存、硬盘类型、组建磁盘阵列模式、内存容量、网络拓朴结构等都会对测试结果有明显的影响。我们在被测服务器上设立了文件服务器,NetBench通过网络实验室中60个客户端来模拟网络中的PC向文件服务器所发出的文件传输请求,文件服务器则将存储在磁盘上的文件数据发送给相应的客户端。在测试过程中,客户端会以每四台一组的步进依次增加并且向服务器发送文件传输请求,测试结束后控制台收集数据并绘制出服务器的数据传输变化曲线。
Benchmark Factory 4.6
大部分的服务器应用都同数据库有着密切的联系,因此我们今年开始着手在在服务器测试中加入对于数据库性能的测试。我们选择了Benchmark Factory 4.6软件和Microsoft SQL2005 SP3来测试不同的硬件平台在数据库应用中的表现。
我们选择了Benchmark Factory内置的标准测试脚本AS3AP,这项测试可用于对于ANSI结构化查询语言(SQL)关系型数据库进行测试,它可用于测试DBMS(单用户微机数据库管理系统),也可用于测试高性能并行或者分布式数据库。
系统功耗监测
我们使用UNI-T UT71E智能数字万用表对于被测服务器系统的整体功耗进行了监测,利用随机附带的接口程序,我们可以记录被测服务器任意时间段内的功率变化。
CineBench R10
CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,在服务器测试平台中显示子系统不重要,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。
ScienceMark 2.0
ScienceMark 2.0可以用来评估测试对象在执行科学计算时的运算效能,这部分效能主要和处理器子系统和内存子系统相关。我们主要用来评估测试对象的内存子系统的性能。
一开始的测试样机配置的是单路Xeon E5504,2GB内存,3个SATA Barracuda ES.2硬盘并使用内置的南桥阵列,配置比较低,无法充分体现出机器应有的特性,在协商下,宝德很快送来了两个Xeon E5520处理器、8GB内存、另外的5个Barracuda ES.2硬盘以及一块Promise FastTrak EX8650 SAS阵列卡,最后的对比平台的详细参数如下:
测试平台、测试环境 | |||||
测试分组 | |||||
类别 | PowerLeader PR2012NS 单路Intel Gainestown Xeon E5520 | DELL PE 2900 III基准 双路Intel Harpertown Xeon E5430 | |||
处理器子系统 | |||||
处理器 | 单路Intel Xeon E5520 | 双路Intel Xeon E5430 | |||
处理器架构 | Intel 45nm Nehalem | Intel 45nm Penryn | |||
处理器代号 | Gainestown | Harpertown | |||
处理器封装 | Socket 1366 LGA | Socke 771 LGA | |||
处理器规格 | 四核八线程 | 四核 | |||
处理器指令集 | MMX,SSE,SSE2,SSE3,SSSE3, SSE4.1,SSE4.2,EM64T,VT | MMX,SSE,SSE2,SSE3,SSSE3, SSE4.1,EM64T,VT | |||
主频 | 2.27GHz | 2.66GHz | |||
处理器外部总线 | 2x QPI 2934MHz 5.86GT/s 单向11.72GB/s(每QPI) 双向23.44GB/s(每QPI) | FSB 333MHz 1333MT/s 10.6GB/s | |||
L1 D-Cache | 4x 32KB 8路集合关联 | 4x 32KB 8路集合关联 | |||
L1 I-Cache | 4x 32KB 4路集合关联 | 4x 32KB 8路集合关联 | |||
L2 Cache | 4x 256KB 8路集合关联 | 2x 6144KB 16路集合关联 | |||
L3 Cache | 8MB @ 2133.6MHz 16路集合关联 | ||||
主板 | |||||
主板型号 | Intel S5500BC | DELL PE 2900 III | |||
芯片组 | Intel Tylersburg-EP IOH:Intel 5500(Tylersburg-24D) ICH:Intel 82801JR(ICH10R) | MCH:Intel 5000X ICH:Intel ESB6321 | |||
芯片特性 | 2x QPI 24 PCI Express Gen2 Lanes VT-d Gen 2 | 2x FSB1333 PCI Express Gen1 Lanes 12MB Snoop Filter VT-d Gen 1 | |||
内存控制器 | 每CPU集成三通道R-ECC DDR3 1066 主板实现双通道R-ECC DDR3 | 北桥集成四通道FBD DDR2 667 | |||
内存 | 2GB R-ECC DDR3 1066 SDRAM x4 | 2GB FBD DDR2 667 SDRAM x4 | |||
系统磁盘子系统 | |||||
磁盘控制器 | Promise FastTrak EX8650 SAS RAID Controller | DELL Perc 5/i RAID Controller | |||
磁盘控制器规格 | Intel 81348 IOP 800MHz Intel XScale(ARM) 256MB ECC DDR2 RAM 8x SAS 3Gb/s RAID 0/1/1E/5/6/10/50/60 PCI Express x8 | Intel IOP333 | |||
磁盘控制器设置 | RAID 5 | RAID 5 | |||
磁盘控制器驱动 | SuperTrak TX8650 & TX8658 Windows STORPort driver FCS v4.01.0000.08 | LSI SAS 3.8.0.64 | |||
磁盘 | Seagate Barracuda ES.2 ST3500320NS x8 | Seagate Cheetah 15K.5 ST314655SS x3 | |||
磁盘规格 | 7200RPM 500GB SATA 3Gb/s 32MB Cache | 15000RPM 146GB SAS 3Gb/s 16MB Cache | |||
磁盘设置 | SATA 3Gb/s 50GB系统分区 | SAS 3Gb/s 20GB系统分区 | |||
网络子系统 | |||||
网卡 | Intel 82574L Gigabit Network Controller x2 | Broadcom BCM5708C PCI-E千兆网卡 x2 | |||
网卡设置 | PCI Express x1 @ ICH10R Intel NIC Teaming Load Balancing | PCI Express x1 @ ESB6321 Broadcom NIC Teaming Load Balancing | |||
网卡驱动 | Intel PRO Set 14.0 | Broadcom NetXtreme 2 11.04.01 | |||
软件环境 | |||||
操作系统 | Microsoft Windows Server 2008 Enterprise Edition SP1 x64 | Microsoft Windows Server 2008 Enterprise Edition SP1 x64 |
为了完全体现新架构的实力,我们使用了Windows Server 2008 Enterprise Edition SP1 x64操作系统,可以更好地支持Nehalem-EP的ccNUMA架构。
为什么是单路处理器呢?这关系到一个小插曲:
所有插槽上Promise FastTrak EX8650阵列卡都会和机器充突,在最好的情况下(如图),我们要考虑:要处理器还是要阵列卡?我们选择了要阵列卡——因为这是一台存储服务器,因此最后测试只使用了单路Xeon X5520。我们同时认为,对于存储服务器来说,单路Nehalem-EP的性能已经足够了。
Intel Xeon E5520处理器:主频2.27GHz,QPI频率2.933GHz,四核八线程,支持三通道DDR3-1066
采用了5500也就是Tylersburg-24D芯片的主板
尽管Nehalem处理器支持三通道DDR3,然而主板只实现了双通道内存配置
SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,它可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台。我们利用了其中多个性能测试模块对于被测系统的性能进行了快速的测试。
有一点需要说明的是,Sandra的处理器架构性能测试是根据处理器所能支持的所有指令集中选择进行的,不同的处理器支持的指令集不同,测试使用到的指令集也就不同。例如,Nehalem在这个测试当中就可以使用SSE4.2,而Penryn就只能使用SSE4.1,而用Opteron可能就只能到SSE3了。一般而言,由于可以使用SSE4,Intel的处理器理论性能会比较好。
SiSoftware Sandra Pro Business 2009 | ||
---|---|---|
测试对象 | PowerLeader PR2012NS 单路Intel Gainestown Xeon E5520 双通DDR3-1066 | DELL PE2900 III 双路Intel Harpertown Xeon E5430 2.66GHz |
Processor Arithmetic Benchmark 处理器架构测试 | ||
Dhrystone ALU | 58452MIPS | 91006MIPS |
Dhrystone ALU vs SPEED | 25.78MIPS/MHz | 34.21MIPS/MHz |
Whetstone iSSE3 | 50437MFLOPS | 78385MFLOPS |
Dhrystone iSSE3 vs SPEED | 22.25MFLOPS/MHz | 29.47MFLOPS/MHz |
Processor Multi-Media Benchmark 处理器多媒体测试 | ||
Multi-Media Int x16 iSSE4.1 | 121.48MPixel/s | |
Multi-Media Int x8 iSSE4.1 | 199.33MPixel/s | |
Multi-Media Int x16 iSSE4.1 vs SPEED | 53.61MPixel/s/MHz | |
Multi-Media Int x8 iSSE4.1 vs SPEED | 74.94MPixel/s/MHz | |
Multi-Media Float x8 iSSE2 | 93.68MPixel/s | |
Multi-Media Float x4 iSSE2 | 108.69MPixel/s | |
Multi-Media Float x8 iSSE2 vs SPEED | 41.34kPixels/s/MHz | |
Multi-Media Float x4 iSSE2 vs SPEED | 40.86kPixels/s/MHz | |
Multi-Media Double x4 iSSE2 | 51.56MPixel/s | |
Multi-Media Double x2 iSSE2 | 55.75MPixel/s | |
Multi-Media Double x4 iSSE2 vs SPEED | 22.76kPixels/s/MHz | |
Multi-Media Double x2 iSSE2 vs SPEED | 20.96kPixels/s/MHz | |
Multi-Core Efficiency Benchmark | ||
Inter-Core Bandwidth | 30.66GB/s | 20.54GB/s |
Inter-Core Bandwidth vs SPEED | 13.85MB/s/MHz | 7.91MB/s/MHz |
Inter-Core Latency (越小越好) | 19ns | 90ns |
Inter-Core Latency vs SPEED (越小越好) | 0.01ns/MHz | 0.03ns/MHz |
.NET Arithmetic Benchmark .NET架构测试 | ||
Dhrystone .NET | 12551MIPS | 10562MIPS |
Dhrystone .NET vs SPEED | 5.54MIPS/MHz | 3.97MIPS/MHz |
Whetstone .NET | 32046MFLOPS | 45399MFLOPS |
Whetstone .NET vs SPEED | 14.14MFLOPS/MHz | 17.07MFLOPS/MHz |
.NET Multi-Media Benchmark .NET多媒体测试 | ||
Multi-Media Int x1 .NET | 23.93MPixel/s | 31.28MPixel/s |
Multi-Media Int x1 .NET vs SPEED | 10.56kPixels/s/MHz | 11.76kPixels/s/MHz |
Multi-Media Float x1 .NET | 10.19MPixel/s | 8.68MPixel/s |
Multi-Media Float x1 .NET vs SPEED | 4.50kPixels/s/MHz | 3.26kPixels/s/MHz |
Multi-Media Double x1 .NET | 19.54MPixel/s | 24.75MPixel/s |
Multi-Media Double x1 .NET vs SPEED | 8.62kPixels/s/MHz | 9.30kPixels/s/MHz |
SiSoftware Sandra对比
有些让人惊讶,也属意料之中的是,单路Xeon E5520处理器的性能几乎追上了双路Xeon E5430,前者频率2.27GHz,四核带超线程,后者则是四核的2.66GHz。
SiSoftware Sandra缓存内存测试主要包括内存带宽、内存延迟等性能的测试。
SiSoftware Sandra Pro Business 2009 | ||
---|---|---|
测试对象 | PowerLeader PR2012NS 单路Intel Gainestown Xeon E5520 双通DDR3-1066 | DELL PE2900 III 双路Intel Harpertown Xeon E5430 2.66GHz |
Memory Bandwidth Benchmark 内存带宽测试 | ||
Int Buff'd iSSE2 Memory Bandwidth | 13.39GB/s | 6.13GB/s |
Int Buff'd iSSE2 Memory Bandwidth vs SPEED | 9.43MB/s/MHz | |
Float Buff'd iSSE2 Memory Bandwidth | 13.37GB/s | 6.13GB/s |
Float Buff'd iSSE2 Memory Bandwidth vs SPEED | 9.43MB/s/MHz | |
Memory Latency Benchmark(Random) 内存延迟测试(随机) | ||
Memory(Random Access) Latency (越小越好) | 92ns | 108ns |
Speed Factor (越小越好) | 52.90 | 95.20 |
Internal Data Cache | 4clocks | 3clocks |
L2 On-board Cache | 10clocks | 18clocks |
L3 On-board Cache | 47clocks | |
Memory Latency Benchmark(Linear) 内存延迟测试(线性) | ||
Memory(Linear Access) Latency (越小越好) | 10ns | 20ns |
Speed Factor (越小越好) | 5.90 | 17.30 |
Internal Data Cache | 4clocks | 3clocks |
L2 On-board Cache | 10clocks | 13clocks |
L3 On-board Cache | 12clocks | |
Cache and Memory Benchmark 缓存及内存测试 | ||
Cache/Memory Bandwidth | 45.97GB/s | 68.88GB/s |
Cache/Memory Bandwidth vs SPEED | 20.76MB/s/MHz | 26.52MB/s/MHz |
Speed Factor (越小越好) | 32.10 | 111.90 |
Internal Data Cache | 190.37GB/s | 421.23GB/s |
L2 On-board Cache | 169.01GB/s | 122.68GB/s |
SiSoftware Sandra对比
在只有单路处理器的情况下,内存也受到了影响:只支持双通道DDR3-1066,从理论带宽上来看,略不及基准平台的四通道FBD DDR2-667,不过Nehalem结构的内置内存控制器在延迟上有优势,并且不用受FSB总线的制约,因此总体表现上比基准平台略好。
ScienceMark v2.0 Membench
ScienceMark v2.0是一款用于测试系统特别是处理器在科学计算应用中的性能的软件,MemBenchmark是其中针对处理器缓存、系统内存而设计的功能模块,它可以测试系统内存带宽、L1 Cache延迟、L2 Cache延迟和系统内存延迟,另外还可以测试不同指令集的性能差异。
首先我们进行的是ScienceMark的测试,主要考察系统的缓存和内存子系统情况。L1/L2 Cache的成绩主要是跟处理器频率相关,因为目前的处理器当中L1 Cache都是和处理器核心同频率的,而L2 Cache基本上也是——当前的处理器L2都是全速的(放置在处理器内但不在同一个芯片上的Pentium II为半速L2,而Pentium之前的处理器L2则和处理器分离,速度更低)。越快的频率,L1/L2性能就越好。而内存带宽主要由两部分相关:比较大的部分是内存架构,小部分是内存操作指令(集),例如使用最新的SSE指令集比通常的ALU指令集会得到更大的吞吐量,而不同的SSE版本性能也有不同。
ScienceMark Membench | ||
---|---|---|
厂商 | Intel | Intel |
产品型号 | PowerLeader PR2012NS 单路Intel Gainestown Xeon E5520 双通DDR3-1066 | PowerEdge 2900 III Intel Harpertown Xeon E5430 2.66GHz |
内存技术参数 | 2GB R-ECC DDR3-1066 SDRAM x4 | 4GB R-ECC DDR3-1333 SDRAM x6 |
L1带宽(MB/s) | 47877.41 | 55376.16 |
L2带宽(MB/s) | 19561.78 | 16757.55 |
内存带宽(MB/s) | 11164.05 | 4485.09 |
L1 Cache Latency(ns) | ||
32 Bytes Stride | 2 cycles 0.88 ns | 1.13 ns |
L1 Algorithm Bandwidth(MB/s) | ||
Compiler | 41882.88 | 25201.96 |
REP MOVSD | 43462.18 | 25467.15 |
ALU Reg Copy | 12066.51 | 13093.65 |
MMX Reg Copy | 24173.31 | 25242.19 |
SSE PAlign | 47831.35 | 52826.21 |
SSE2 PAlign | 47877.41 | 55376.16 |
L2 Cache Latency(ns) | ||
4 Bytes Stride | 3 cycles 1.32 ns | 1.13 ns |
16 Bytes Stride | 3 cycles 1.32 ns | 1.50 ns |
64 Bytes Stride | 8 cycles 3.53 ns | 4.51 ns |
256 Bytes Stride | 8 cycles 3.53 ns | 4.51 ns |
512 Bytes Stride | 7 cycles 3.09 ns | 4.89 ns |
L2 Algorithm Bandwidth(MB/s) | ||
Compiler | 17933.59 | 11880.48 |
REP MOVSD | 19561.78 | 12536.88 |
ALU Reg Copy | 8790.63 | 8577.86 |
MMX Reg Copy | 14070.54 | 13408.31 |
SSE PAlign | 18695.39 | 16719.97 |
SSE2 PAlign | 18729.30 | 16757.55 |
Memory Latency(ns) | ||
4 Bytes Stride | 3 cycles 1.32 ns | 1.13 ns |
16 Bytes Stride | 5 cycles 2.21 ns | 4.89 ns |
64 Bytes Stride | 20 cycles 8.82 ns | 19.17 ns |
256 Bytes Stride | 83 cycles 36.62 ns | 59.77 ns |
512 Bytes Stride | 92 cycles 40.59 ns | 68.04 ns |
Memory Algorithm Bandwidth(MB/s) | ||
Compiler | 8773.21 | 3178.45 |
REP MOVSD | 9548.37 | 3220.23 |
ALU Reg Copy | 6358.01 | 2789.34 |
MMX Reg Copy | 7075.57 | 2972.91 |
MMX Reg 3dNow | - | - |
MMX Reg SSE | 10775.99 | 3978.53 |
SSE PAlign | 10502.70 | 4128.59 |
SSE PAlign SSE | 11160.97 | 4390.48 |
SSE2 PAlign | 10500.44 | 4326.42 |
SSE2 PAlign SSE | 11164.05 | 4441.71 |
MMX Block 4kb | 8970.33 | 4063.30 |
MMX Block 16kb | 9541.38 | 4479.88 |
SSE Block 4kb | 8946.53 | 4074.79 |
SSE Block 16kb | 9563.62 | 4485.09 |
从前面可知,单路双通道的PR2012NS理论带宽不如基准平台,不过,SM测试上成绩仍然是基准平台的两倍左右。
CineBench R10
CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,我们的平台偏向于服务器多一些,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。
CineBench R10 64bit | ||
处理器 | PowerLeader PR2012NS 单路Intel Gainestown Xeon E5520 双通DDR3-1066 | 双路Intel Harpertown Xeon E5430 |
显卡 | - | - |
CPU Benchmark | ||
Rendering (1 CPU) | 3369 CB-CPU | 2931 CB-CPU |
Rendering (x CPU) | 14030 CB-CPU | 16806 CB-CPU |
Multiprocessor Speedup | 4.16x | 5.73x |
OpenGL Benchmark | ||
OpenGL Standard | 185 CB-GFX | 176 CB-GFX |
服务器测试成绩
在需求浮点能力的三维应用上,超线程带来的逻辑处理器不如实际上的物理处理器,不过仍然发挥了相当的作用(多处理器加速比大于4),此外单处理器性能上低频率的5520也比5430要好。
Iometer 2006.07.27
我们的基准服务器采用了三块15000RPM的Seagate Cheetah 15K.5硬盘。宝德PR2012NS则是用八块7200RPM的Seagate Barracuda ES.2(3.5英寸外形因子)。基准平台使用了LSI MegaRAID SAS 8408E硬件阵列卡组建了RAID 5阵列,而PR2012NS则使用了一块Promise FastTrak EX8650阵列卡,阵列卡对比上,PR2012NS要更强,不过,就磁盘上来说,各有优劣。
IO读
IO写
读吞吐量
写吞吐量
可以看出,虽然在数量上更多(八个硬盘RAID 5),然而7200RPM的SATA硬盘显然和15000RPM的SAS硬盘有着根本的差距:随机IOps,基准平台仍然要好一些。而在传输速率上,向来是具有更高磁密度的SATA硬盘占优,而在数量更多的情况下,PR2012NS显得非常快。
NetBench v7.03
NetBench 7.03 Ent_dm.tst测试脚本模拟的是企业级文件服务器应用,它不但要求被测服务器的磁盘子系统可以提供足够的吞吐量,还需要其具有较高的IO处理能力,并且需要较为平衡的读取能力和写入能力。
虽然看起来不如我们的基准平台,然而实际上PR2012NS的性能是很不错的,比以往测试过的Nehalem服务器都要好一些。不NetBench测试和磁盘子系统的随机能力和传输能力都有关系,因此Iometer表现较好的到这里未必表现就好。我们认为,将SATA硬盘更换成15000RPM的SAS硬盘性能会有明显的提升。关于NetBench性能与处理器、内存、磁盘的关系可以看这里《评测机密:文件服务器性能提升N大要义》。
Benchmark Factory 4.6
我们在被测服务器上安装了Microsoft SQL 2005 SP1,按照测试要求建立了数据库。BF在测试之前会在数据库中生成9个表,其中包括4个500万行的表格,每行包括100字节的数据,因此每个表格容量大约是476MB,整个数据库容量为1.86GB。我们用60个客户端模拟1000个用户,在这个数据库中进行查询、添加、删除、修改等操作。
SQL2005数据库性能测试
结果很令人惊讶,凭借着新的架构:IMC、QPI和HTT,在只有单个处理器、频率更低、只有双通道等条件下,PR2012NS的数据库性能仍然要比基准平台高出50%左右,PR2012NS看来做数据库服务器也很合适。
我们利用UNI-T UT71E智能数字万用表和相配套的软件对于对于被测服务器在几种不同的状态下的功耗进行了监测,主要包括如下项目:
P1:连接电源但不开机状态
P2:系统启动完毕,5分钟内无动作,但不休眠
P3:系统启动完毕,处理器满载、磁盘以最大吞吐量工作
功耗
在大部分性能都比基准平台更高的情况下,PR2012NS的功耗却很低,一方面,它是单路配置,内存相对也少,二来,散热方面也不用耗费大量的电能。
【IT168评测中心】宝德PR2012NS是一台主要面向网络存储的服务器,因此在处理器配置上略有简化而在存储方面有所加强。PR2012NS采用了5500 IOH(Tylersburg-24D),并且在内存支持上显得比较一般:每个处理器只能支持两个通道。存储方面,PR2012NS提供了多达12个的3.25"热插拔硬盘槽(PR2012NS是一台2U机架服务器),同时兼容SAS和SATA硬盘。
我们的测试样机配置的是一块8口的Promise FastTrak EX8650阵列卡,因此无法将12个硬盘槽应用完全,不过12口、16口的阵列卡推出也很久了,宝德也完全可以提供。
在测试中,存储方面的性能比一般的Nehalem服务器要高,不过程度有限,这是采用了SATA硬盘的缘故。应用企业级SATA硬盘的好处是成本比较低,并且可以很容易获得较大的容量(测试平台在组建RAID 5阵列后的容量是3.5TB)。PR2012NS在数据库等方面的性能让人印象比较深刻,基于强大的性能,PR2012NS适合在担当存储服务器的同时也能承受更多的其他工作。