【IT168评测中心】在台北Computx 2008中,华硕所参展的产品中有六项产品以杰出的创新科技设计赢得了展会的非常好的选择奖,其中有一款是服务器产品,这就是华硕的第五代绿色服务器RS160-E5。
ASUS RS160-E5服务器也是一款1U机架服务器
华硕RS160-E5是华硕服务器在“绿色、节能”的2008年整体策略下精心研发,推出的省电、高效、环保、静音的绿色服务器典范之作。Computx 2008评选委员会相关评审表示,华硕第五代绿色服务器RS160-E5以80+高效率的服务器电源的搭载、PWM (Power Management) 风扇的配备、加之SAS硬盘升级套件PIKE等独特设计,对绿色进行了全方位的完美诠释,为用户带来大幅度的节约效益,也因此得到了评审们的一致青睐。
ASUS RS160-E5服务器
假如熟悉华硕型号的话,可以从RS160-E5上看出很多信息,例如RS就是Rack Server机架服务器(TS的话就是Tower Server,塔式服务器)的意思,RS后面的第一位数字代表着机架的规格:1就是1U,2就是2U,最后面的数字则代表代数:5就代表着第五代。RS160-E5就是华硕在2008年下半年推出的第五代以绿色计算为主要目标的1U机架服务器产品。
我们测试的这台华硕服务器真正的型号其实是RS160-E5-PA4……好长
这个型号标识在侧面……在打开服务器箱子的时候察看倒是挺方便的,可是不利于平常放在机架里面时的察看
4个3.5英寸热插拔SAS硬盘槽,当然,也可以支持SATA硬盘
自带薄式笔记本光驱。一般服务器都会备有光驱以方便安装系统以及软件
正常的后面板配置,提供了两个全高的扩展卡面板位置,当然,需要使用RISER装置
RS160-E5的盖子分成两部分,主板部分可以很轻易拆下来,而硬盘部分则还需要进行额外的工作
80Plus服务器是节能的一个关键点之一,80Plus和非80Plus的转换效率可以相差20%以上,一台实际300W的服务器耗电就会相差达125W!
FSP全汉提供的460W服务器电源,通过80Plus认证。80Plus是指在各种负载下电源的转换效率都在80%以上
San Ace的4cm冗余风扇模块,最大功率较高:1.4A x 12 V = 16.8W
主流的15000RPM Seagate Cheetah 15K.5,型号ST373455SS,容量73.4GB
Intel Xeon E5410处理器,频率较低,为2.33GHz
ASUS RS160-E5采用的主板芯片组为5100,而不是主流的5000系列,这个5100系列的特别之处就在于:它支持DDR2内存而不是FB DDR2内存。而且只支持双通道(5000系列支持四通道)
因此ASUS就配置了4条1GB的R-ECC DDR2 667内存,不过这并不符合我们的SPEC CPU测试要求,经过联系后华硕更换了6条2GB的R-ECC DDR2 667内存
华硕服务器专用的SAS方案:PIKE,具有三种选择:PIKE1064E、PIKE1068E和PIKE1078
PIKE1064就是采用LSISAS1604E芯片,提供4个SAS 3Gbps端口;PIKE1078就是采用1078芯片,除了能提供8个SAS端口之外,还能支持硬件RAID 5/6
这个PIKE卡是放在专门的服务器主板上的,如图最上方的白色插槽;目前支持这个插槽的主板并不多,关于RS160-E5使用的ASUS DSAN-DX主板,可以看这里:《淡定 华硕DSAN-DX主板测试之服务器篇》
测试结果并会与我们IT168评测中心的DELL PowerEdge 2900 III服务器进行对比,测试对比平台的详细参数如下:
测试平台、测试环境 | |||||
测试分组 | |||||
类别 | ASUS RS160-E5-PA4服务器 | 双路Xeon E5430基准平台 | |||
处理器子系统 | |||||
处理器 | 双路Intel Xeon E5410 | 双路Intel Xeon E5430 | |||
处理器架构 | Intel 45nm Penryn | Intel 45nm Penryn | |||
处理器代号 | Harpertown | Harpertown | |||
处理器封装 | Socke 771 LGA | Socke 771 LGA | |||
处理器规格 | 四核 | 四核 | |||
处理器指令集 | MMX,SSE,SSE2,SSE3,SSSE3, SSE4.1,EM64T,VT | MMX,SSE,SSE2,SSE3,SSSE3, SSE4.1,EM64T,VT | |||
主频 | 2.33GHz | 2.66GHz | |||
处理器外部总线 | FSB:1333MHz | FSB:1333MHz | |||
L1 I-Cache | 4x 32KB 8路集合关联 | 4x 32KB 8路集合关联 | |||
L1 D-Cache | 4x 32KB 8路集合关联 | 4x 32KB 8路集合关联 | |||
L2 Cache | 2x 6144KB 24路集合关联 | 2x 6144KB 24路集合关联 | |||
主板 | |||||
主板型号 | ASUS DSAN-DX | DELL PE2900 III | |||
北桥芯片组(MCH) | Intel 5100 | Intel 5000X | |||
北桥芯片特性 | - | 12MB Snoop Filter | |||
内存控制器 | 北桥集成双通道DDR2 | 北桥集成四通道FBD DDR2 | |||
内存 | 2GB R-ECC DDR2 667 SDRAM x4 | 2GB FBD DDR2 667 SDRAM x8 | |||
系统磁盘子系统 | |||||
磁盘控制器 | ASUS PIKE1064E SAS Controller | DELL PERC 5/i Integrated RAID Controller | |||
磁盘控制器规格 | LSI HostRAID SAS 3Gbps x4 | 256MB RAM SAS 3Gbps x8 | |||
磁盘控制器设置 | RAID 0 | RAID 5 | |||
磁盘控制器驱动 | LSI MegaRAID SAS 3.8.0.32 | LSI MegaRAID SAS 3.8.0.32 | |||
磁盘 | Seagate Cheetah 15K.5 ST373455SS x4 | Seagate Cheetah 15K.5 ST3146855SS x3 | |||
磁盘规格 | 15000RPM 73GB SAS 3Gbps 16MB Cache | 15000RPM 146GB SAS 3Gbps 16MB Cache | |||
磁盘设置 | SATA 3Gbps 30GB系统分区 | SAS 3Gbps 20GB系统分区 | |||
网络子系统 | |||||
网卡 | Broadcom BCM5721C PCI-E千兆网卡 x2 | Broadcom BCM5708C PCI-E千兆网卡 x2 | |||
网卡设置 | Broadcom NIC Teaming Load Balancing | Broadcom NIC Teaming Load Balancing | |||
网卡驱动 | Broadcom NetXtreme 2 11.04.01 | Broadcom NetXtreme 2 11.04.01 | |||
软件环境 | |||||
操作系统 | Microsoft Windows Server 2003 R2 Enterprise Edition SP2 | Microsoft Windows Server 2003 R2 Enterprise Edition SP2 |
测试方法介绍
SPEC CPU2006 v1.01
SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。
SPEC CPU 2006是SPEC组织推出的一套CPU子系统评估软件,它包括CINT2006和CFP2006两个子项目,前者用于测量和对比整数性能,而后者则用于测量和对比浮点性能。计算系统中的处理器、内存和编译器都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2006的影响比较小。
SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、DCC以及科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。
SPEC CPU 2006的运行有着比较特别的要求,我们将会在后面详细解释。
ScienceMark v2.0 Membench
ScienceMark v2.0是一款用于测试系统特别是处理器在科学计算应用中的性能的软件,MemBenchmark是其中针对处理器缓存、系统内存而设计的功能模块,它可以测试系统内存带宽、L1 Cache延迟、L2 Cache延迟和系统内存延迟,另外还可以测试不同指令集的性能差异。
CineBench R10
CineBench是基于Cinem3D物理建模软件的一个测试程序,主要针对处理器子系统、内存子系统和显示子系统,可以完善地支持多核/多线程。对于服务器来说显示子系统并不重要,因此主要用它来测试处理器子系统和内存子系统。
SiSoftware Sandra 2009
SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。我们使用了SiSoftware Sandra的2009版,它可以支持各种最新的CPU指令集,并能良好地支持多核、多线程,我们主要用其来评估平台的理论计算性能。
IOMeter 2006.07.27
IOMeter是一款功能非常强大的IO测试软件,它除了可以在本机运行测试本机的IO(磁盘)性能之外,还提供了模拟网络应用的能力。在这次的测试中,我们仅仅让它在本机运行测试服务器的磁盘性能。为了全面测试被测服务器的IO性能,我们分别选择了不同的测试脚本。
Max_throughput(read):文件尺寸为64KB,100%读取操作,随机率为0%,用于检测磁盘系统的最大读取吞吐量
Max_IO(read):文件尺寸为512B,100%读取操作,随机率为0%,用于检测磁盘系统的最大读取操作IO处理能力
Max_throughput(write):文件尺寸为64KB,0%读取操作,随机率为0%,用于检测磁盘系统的最大写入吞吐量
Max_IO(write):文件尺寸为512B,0%读取操作,随机率为0%,用于检测磁盘系统的最大写入操作IO处理能力
NetBench v7.03
NetBench是针对文件服务器的性能测试软件,影响NetBench性能的主要是服务器的磁盘子系统,服务器磁盘控制器、条带大小、读写缓存、硬盘类型、组建磁盘阵列模式、内存容量、网络拓朴结构等都会对测试结果有明显的影响。我们在被测服务器上设立了文件服务器,NetBench通过网络实验室中60个客户端来模拟网络中的PC向文件服务器所发出的文件传输请求,文件服务器则将存储在磁盘上的文件数据发送给相应的客户端。在测试过程中,客户端会以每四台一组的步进依次增加并且向服务器发送文件传输请求,测试结束后控制台收集数据并绘制出服务器的数据传输变化曲线。
Benchmark Factory 4.6
大部分的服务器应用都同数据库有着密切的联系,因此在服务器测试当中这是一个很重要的测试。我们选择了Benchmark Factory 4.6软件和Microsoft SQL Server 2005来测试不同的硬件平台在数据库应用中的表现。
我们选择了BF内置的标准测试脚本AS3AP,这项测试可用于对于ANSI结构化查询语言(SQL)关系型数据库进行测试,它可用于测试DBMS(单用户微机数据库管理系统),也可用于测试高性能并行或者分布式数据库。
Intel Xeon E5410处理器,频率较低,为2.33GHz
缓存架构
DSAN-DX主板,使用5100 + ICH9R芯片组组合
CPU-Z提示错误……DSAN-DX只支持通常的R-ECC DDR2-667 SDRAM,而不是FB-DDR2
SiSoftware Sandra Pro Business 2009
SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。从Sandra 2007开始支持SSE4指令集。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台,这也是我们选择这款软件的原因之一。
SiSoftware Sandra Pro Business 2009 | |||
测试对象 | ASUS RS160-E5-PA4 | DELL PE 2900 III | |
Processor Arithmetic Benchmark | |||
Dhrystone ALU | 79817MIPS | 91006MIPS | |
Dhrystone ALU vs SPEED | 34.21MIPS/MHz | 34.21MIPS/MHz | |
Whetstone iSSE3 | 68675MFLOPS | 78385MFLOPS | |
Dhrystone iSSE3 vs SPEED | 29.44MFLOPS/MHz | 29.47MFLOPS/MHz | |
Processor Multi-Media Benchmark | |||
Multi-Media Int x8 iSSE4.1 | 174.91MPixel/s | 199.33MPixel/s | |
Multi-Media Int x8 iSSE4.1 vs SPEED | 74.97kPixels/s/MHz | 74.94kPixels/s/MHz | |
Multi-Media Float x4 iSSE2 | 95.33MPixel/s | 108.69MPixel/s | |
Multi-Media Float x4 iSSE2 vs SPEED | 40.86kPixels/s/MHz | 40.86kPixels/s/MHz | |
Multi-Media Double x2 iSSE2 | 48.91MPixel/s | 55.75MPixel/s | |
Multi-Media Double x2 iSSE2 vs SPEED | 20.96kPixels/s/MHz | 20.96kPixels/s/MHz | |
Multi-Core Efficiency Benchmark | |||
Inter-Core Bandwidth | 18.86GB/s | 20.54GB/s | |
Inter-Core Bandwidth vs SPEED | 8.28MB/s/MHz | 7.91MB/s/MHz | |
Inter-Core Latency | 96ns | 90ns | |
Inter-Core Latency vs SPEED | 0.04ns/MHz | 0.03ns/MHz | |
Memory Bandwidth Benchmark | |||
Int Buff'd iSSE2 Memory Bandwidth | 5.74GB/s | 6.13GB/s | |
Int Buff'd iSSE2 Memory Bandwidth vs SPEED |
| 9.43MB/s/MHz | |
Float Buff'd iSSE2 Memory Bandwidth | 5.75GB/s | 6.13GB/s | |
Float Buff'd iSSE2 Memory Bandwidth vs SPEED |
| 9.43MB/s/MHz | |
Memory Latency Benchmark | |||
Memory(Random Access) Latency | 106ns | 108ns | |
Memory(Random Access) Latency vs SPEED |
| 0.16ns/MHz | |
Speed Factor | 82.10 | 95.20 | |
Internal Data Cache Latency | 3clocks | 3clocks | |
L2 On-board Cache Latency | 18clocks | 18clocks | |
Cache and Memory Benchmark | |||
Cache/Memory Bandwidth | 69.30GB/s | 68.88GB/s | |
Cache/Memory Bandwidth vs SPEED | 30.42MB/s/MHz | 26.52MB/s/MHz | |
Speed Factor | 85.30 | 111.90 | |
Internal Data Cache | 371.06GB/s | 421.23GB/s | |
L2 On-board Cache | 122.83GB/s | 122.68GB/s | |
.NET Arithmetic Benchmark | |||
Dhrystone .NET | 11278MIPS | 10562MIPS | |
Dhrystone .NET vs SPEED | 4.83MIPS/MHz | 3.97MIPS/MHz | |
Whetstone .NET | 39126MFLOPS | 45399MFLOPS | |
Whetstone .NET vs SPEED | 16.77MFLOPS/MHz | 17.07MFLOPS/MHz | |
.NET Multi-Media Benchmark | |||
Multi-Media Int x1 .NET | 27.05MPixel/s | 31.28MPixel/s | |
Multi-Media Int x1 .NET vs SPEED | 11.60kPixels/s/MHz | 11.76kPixels/s/MHz | |
Multi-Media Float x1 .NET | 7.52MPixel/s | 8.68MPixel/s | |
Multi-Media Float x1 .NET vs SPEED | 3.22kPixels/s/MHz | 3.26kPixels/s/MHz | |
Multi-Media Double x1 .NET | 21.36MPixel/s | 24.75MPixel/s | |
Multi-Media Double x1 .NET vs SPEED | 9.15kPixels/s/MHz | 9.30kPixels/s/MHz |
SiSoftware Sandra对比
由于处理器频率较低以及采用了双通道内存的缘故,因此ASUS RS160-E5的处理器子系统和内存带宽的理论性能都比基准平台要低。
ScienceMark v2.0 Membench
ScienceMark v2.0是一款用于测试系统特别是处理器在科学计算应用中的性能的软件,MemBenchmark是其中针对处理器缓存、系统内存而设计的功能模块,它可以测试系统内存带宽、L1 Cache延迟、L2 Cache延迟和系统内存延迟,另外还可以测试不同指令集的性能差异。
ScienceMark v2.0 Membench L1测试成绩
ScienceMark v2.0 Membench L2测试成绩
ScienceMark v2.0 Membench 内存测试成绩
首先我们进行的是ScienceMark的测试,主要考察系统的缓存和内存子系统情况。L1/L2 Cache的成绩主要是跟处理器频率相关,因为目前的处理器当中L1 Cache都是和处理器核心同频率的,而L2 Cache基本上也是——当前的处理器L2都是全速的(放置在处理器内但不在同一个芯片上的Pentium II为半速L2,而Pentium之前的处理器L2则和处理器分离,速度更低)。越快的频率,L1/L2性能就越好。而内存带宽主要由两部分相关:比较大的部分是内存架构,小部分是内存操作指令(集),例如使用最新的SSE指令集比通常的ALU指令集会得到更大的吞吐量,而不同的SSE版本性能也有不同。
ScienceMark Membench | |||
厂商 | ASUS | DELL | |
产品型号 | RS160-E5-PA4 Intel Harpertown Xeon E5410 2.33GHz | PowerEdge 2900 III Intel Harpertown Xeon E5430 2.66GHz | |
内存技术参数 | 2GB R-ECC DDR2-667 SDRAM x4 | 2GB FBD-ECC DDR2-667 SDRAM x4 | |
L1带宽(MB/s) | 56099.40 | 55376.16 | |
L2带宽(MB/s) | 16792.98 | 16757.55 | |
内存带宽(MB/s) | 3958.06 | 4485.09 | |
L1 Cache Latency(ns) | |||
32 Bytes Stride | 1.29 | 1.13 | |
L1 Algorithm Bandwidth(MB/s) | |||
Compiler | 25286.79 | 25201.968 | |
REP MOVSD | 25551.32 | 25467.15 | |
ALU Reg Copy | 12892.69 | 13093.65 | |
MMX Reg Copy | 25467.68 | 25242.19 | |
SSE PAlign | 48672.40 | 52826.21 | |
SSE2 PAlign | 56099.40 | 55376.16 | |
L2 Cache Latency(ns) | |||
4 Bytes Stride | 1.29 | 1.13 | |
16 Bytes Stride | 1.71 | 1.50 | |
64 Bytes Stride | 5.14 | 4.51 | |
256 Bytes Stride | 5.14 | 4.51 | |
512 Bytes Stride | 5.52 | 4.89 | |
L2 Algorithm Bandwidth(MB/s) | |||
Compiler | 11710.92 | 18800.48 | |
REP MOVSD | 12362.96 | 12536.88 | |
ALU Reg Copy | 8665.88 | 8577.86 | |
MMX Reg Copy | 13447.87 | 13408.31 | |
SSE PAlign | 16785.88 | 16719.97 | |
SSE2 PAlign | 16792.98 | 16757.55 | |
Memory Latency(ns) | |||
4 Bytes Stride | 1.29 | 1.13 | |
16 Bytes Stride | 5.14 | 4.89 | |
64 Bytes Stride | 19.71 | 19.17 | |
256 Bytes Stride | 63.43 | 59.77 | |
512 Bytes Stride | 69.85 | 68.04 | |
Memory Algorithm Bandwidth(MB/s) | |||
Compiler | 3406.39 | 3178.45 | |
REP MOVSD | 3445.44 | 3220.23 | |
ALU Reg Copy | 3151.39 | 2789.34 | |
MMX Reg Copy | 3233.72 | 2972.91 | |
MMX Reg 3dNow | - | - | |
MMX Reg SSE | 3931.55 | 3978.53 | |
SSE PAlign | 3906.19 | 4128.59 | |
SSE PAlign SSE | 3958.06 | 4390.48 | |
SSE2 PAlign | 3902.21 | 4326.42 | |
SSE2 PAlign SSE | 3957.96 | 4441.71 | |
MMX Block 4kb | 3212.33 | 4063.30 | |
MMX Block 16kb | 3464.20 | 4479.88 | |
SSE Block 4kb | 3169.49 | 4074.79 | |
SSE Block 16kb | 3486.68 | 4485.09 |
CineBench R10
CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,我们的平台偏向于服务器多一些,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。
CineBench R10 | |||
处理器 | ASUS RS160-E5-PA4 双路Xeon E5410 | DELL PE 2900 III Xeon E5430 | |
显卡 | - | - | |
CPU Benchmark | |||
Rendering (1 CPU) | 2575 CB-CPU | 2931 CB-CPU | |
Rendering (x CPU) | 15653 CB-CPU | 16806 CB-CPU | |
Multiprocessor Speedup | 6.08x | 5.73x | |
OpenGL Benchmark | |||
OpenGL Standard | 135 CB-GFX | 176 CB-GFX |
测试成绩对比
基于2.33GHz的Xeon E5410的频率,这个结果也是可以理解的。在多次测试中,我们发现不同主频的处理器在Multiprocessor Speedup数字上式不同的。这个数字用来体现多处理器系统在协同渲染工作上的效率,我们的发现是在相同架构下频率越低,这个数字就越高。例如2.33GHz的华硕服务器就比基准平台要高,这是因为处理器频率越高,对FSB总线的压力就越大——现在Core微架构Xeon处理器是所有处理器核心按照两个两个分组,所有组之间都需要使用同一个FSB总线(同一个核心内)或者不同的FSB总线(通过北桥/MCH)通信,自然在通信压力越高的情况下,协同效率就越低。这也是Intel下一代处理器Nehalem在这方面大有改进的原因,关于Nehalem以及多处理器架构可以参看笔者的这个文章《2008年度评测报告:深入Nehalem微架构》。
SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。
SPEC CPU 2006是SPEC组织推出的一套CPU子系统评估软件,它包括CINT2006和CFP2006两个子项目,前者用于测量和对比整数性能,而后者则用于测量和对比浮点性能。计算系统中的处理器、内存和编译器都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2006的影响比较小。
SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、DCC以及科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。
为了运行SPEC CPU 2006测试,我们统一安装了Windows Server 2008 Enterprise x64 Edition SP1操作系统,在主流的x64处理器下,原生64应用要比32位下快。我们还安装了Visual Studio 2005 SP1、Intel C++/Fortran Compiler 10.0.025编译器,对于支持SSE3指令集的处理器,我们使用了QxO编译指令进行了优化。编译时未使用SmartHeap商业优化库。
SPEC测试代表了绝大多CPU密集型的运算,包括编程语言、压缩、人工智能、基因序列搜索、视频压缩及各种力学的计算等,包含了多种科学计算,可以用来衡量系统执行这些任务的快慢。SPEC base测试包括浮点(fp)与整数运算(int)两部分。
整数运算主要包含编译、压缩、人工智能、视频压缩转换、XML处理等,此外,各种日常操作也主要是基于整数操作。SPEC CPU 2006的整数运算包含了400.perlbench PERL编程语言、401.bzip2 压缩、403.gcc C编译器、429.mcf 组合优化、445.gobmk 人工智能:围棋、456.hmmer 基因序列搜索、458.sjeng 人工智能:国际象棋、462.libquantum 物理:量子计算、464.h264ref 视频压缩、471.omnetpp 离散事件仿真、473.astar 寻路算法、483.xalancbmk XML处理共12项。
SPEC CPU 2006整数测试成绩
浮点运算包括的全部都是科学运算,科学运算需要用到大量的高精度浮点数据,如410.bwaves 流体力学、416.gamess 量子化学、433.milc 量子力学、434.zeusmp 物理:计算流体力学、435.gromacs 生物化学/分子力学、436.cactusADM 物理:广义相对论、437.leslie3d 流体力学、444.namd 生物/分子、447.dealII 有限元分析、450.soplex 线形编程、优化、453.povray 影像光线追踪、454.calculix 结构力学、459.GemsFDTD 计算电磁学、465.tonto 量子化学、470.lbm 流体力学、481.wrf 天气预报、482.sphinx3 语音识别共17项测试。
SPEC CPU 2006浮点运算测试成绩
由于较低的频率和内存通道上的差别,ASUS RS160-E5的SPEC CPU 2006测试整体上低于我们的基准平台,不过差别很小——2%以内,非常之小。在子项目上则是互有输赢,这表明了通常的DDR2内存确实有优胜于FB-DDR2的地方,也是由于这个原因(同时还由于FBD的发热量较大),Nehalem处理器包括服务器版本在内将不再使用FBD而转投DDR3……看起来FBD真是一个悲剧,虽然比起RAMBUS要好上了一些。
我们的基准服务器采用了三块15000RPM的Seagate Cheetah 15K.5硬盘,RS160-E5采用4块Seagate Cheetah 15K.5硬盘,都是同一个系列,不过,基准平台使用了LSI MegaRAID SAS 8408E硬件阵列卡组建了RAID 5阵列,而RS160-E5使用的是ASUS PIKE1064E SAS控制卡,只支持RAID 0/1/1E功能,它使用的是1064E芯片的ARM处理器资源,性能介于硬件阵列和软件阵列之间,一般LSI称之为HostRAID功能。我们最后将4个硬盘配置为RAID 0。
IO读
IO写
读吞吐量
写吞吐量
和大多数南桥的SATA RAID功能一样,基于SAS控制芯片的RAID也是属于传输速率很高、IO性能一般的一类,并且随着IO队列深度的加大而具有较明显的性能降低。也是因为这样的缘故,在购买LSI MegaSAS 3041E-R控制卡之后一段时间笔者还是又购买了一块LSI MegaRAID 8708E阵列卡。RS160-E5想使用硬件阵列功能的可以选配PIKE1078附件代替我们样机配置的PIKE1064E,它可以支持硬件RAID 5/6。
NetBench v7.03
NetBench 7.03 Ent_dm.tst测试脚本模拟的是企业级文件服务器应用,它不但要求被测服务器的磁盘子系统可以提供足够的吞吐量,还需要其具有较高的IO处理能力,并且需要较为平衡的读取能力和写入能力。
NetBench性能测试
基于前面IOmeter的测试结果,RS160-E5的测试性能比基准平台低30%左右也就不足为奇了。一般而言,假如配了3个以及以上的硬盘,用户应该选择硬件阵列。
Benchmark Factory 4.6
我们在被测服务器上安装了Microsoft SQL 2005 SP1,按照测试要求建立了数据库。BF在测试之前会在数据库中生成9个表,其中包括4个500万行的表格,每行包括100字节的数据,因此每个表格容量大约是476MB,整个数据库容量为1.86GB。我们用60个客户端模拟1000个用户,在这个数据库中进行查询、添加、删除、修改等操作。
SQL2005数据库性能测试
数据库测试是一个综合性的测试,在较少客户端的时候,其性能依赖于处理器以及内存系统,在较多客户端的时候,则开始依赖于磁盘子系统,在处理器(E5410 vs E5430)、内存(双通道vs四通道)、磁盘阵列(HostRAID vs Hard RAID)的多种因素下,ASUS RS160-E5全面低于我们的基准平台。
服务器整体功耗
我们利用UNI-T UT71E智能数字万用表和相配套的软件对于对于被测服务器在几种不同的状态下的功耗进行了监测,主要包括如下项目:
P1:连接电源但不开机状态
P2:系统启动完毕,5分钟内无动作,但不休眠
P3:系统启动完毕,处理器满载、磁盘以最大吞吐量工作
服务器功耗测试
基于80Plus、DDR2内存以及较低的处理器频率,因此ASUS RS160-E5确实不负绿色服务器的名头,空载功率非常低,比基准平台低近100W,满载情况下也要低80W左右。
【IT168评测中心】华硕RS160-E系列是华硕所推的“绿色、节能”概念的系列服务器,我们测试的RS160-E5是其中第五代产品,搭载了80Plus高效率服务器电源载、PWM (Power Management) 散热风扇,并具有SAS硬盘升级套件PIKE等独特设计。
ASUS RS160-E5服务器也是一款1U机架服务器
ASUS RS160-E5服务器
由于RS160-E5采用了5100芯片组,它只支持双通道DDR2内存,对性能会有些影响,不过DDR2内存的功耗也比FBD要低,在功耗测试当中,RS160-E5表现相当好。相对地,性能方面则做出了一些折中,RS160-E5还具有升级改进的空间,通过简单地更换为支持硬件阵列的PIKE套件就可以。总体而言,性能和功耗方面RS160-E5都具有不错的实力(潜力)。