【IT168评测中心】随着Intel的Tick-Tock平台战略的进行,Intel的第二代45nm产品Nehalem架构已经在今年发布,然而和以往不同,今次Nehalem架构的处理器首先发布的是桌面产品,而不是服务器产品,因此在今年内到明年中期,市面上将仍然是45nm Penryn Xeon的天下。
因此我们今年的双路四核服务器横评里面仍然是Penryn处理器占了大多数(Intel平台),我们收到的华硕RS162-E4就是这样。
华硕RS162-E4是一台只有1U高度的机架式服务器,虽然个头很小,内部却是采用了45nm Xeon DP X5460处理器(代号Harpertown),频率达到了3.16GHz,在45nm Penryn当中也算是很高的型号了,我们估计其性能会很出色,下面我们就先来解析它的硬件配置,再来看看它的性能表现。
华硕RS162-E4可以支持4个3.25英寸的标准SAS/SATA热插拔式硬盘
华硕RS162-E4背部具有两个热插拔电源的位置,这在1U机架服务器里面是不太多见的
华硕RS162-E4前面板具有两个USB口,多个开关以及充足的指示灯
华硕RS162-E4还附带了一个笔记本式的DVD-ROM,应有尽有
华硕RS162-E4的散热是标准的前进后出,由服务器中前方的7个风扇建立风道,涵盖了所有的设备
华硕RS162-E4的电源采用了AcBel康舒电源,康舒也是著名的电源品牌,和台达差不多。这个电源最大功率700W,输出12.2V(比12V要高一些)达到了56A
华硕RS162-E4采用了两个ES工程样品处理器,在后面我们将会了解到,它们实际上是Intel Xeon X5460,X系列和通常的E系列的区别在于X系列提供了更高的频率,同时热设计功耗也更高,E系列为80W,而X系列为120W
内存则使用了Seagate的Cheetah 15K.5,总共四个组成RAID 0阵列
ST373455SS,15000RPM、73.4GB的SAS硬盘,15K.5在现在应该是主流配置,尽管15K.6已经推出了
华硕RS162-E4:ATI ES1000显卡芯片,PCI接口,在服务器当中相当流行
华硕RS162-E4:LSI SAS1068芯片,顾名思义,它可以提供8个SAS 3Gbps接口
华硕RS162-E4:Intel HY82563EB是一个千兆网络芯片
华硕RS162-E4:低矮外形(1U、2U)的服务器都必须使用这种Riser来提供各种扩展卡插槽
在本次服务器横向评测当中,被评测服务器产品将会与我们IT168评测中心的DELL PowerEdge 2900 III服务器进行对比,测试对比平台的详细参数如下:
测试平台、测试环境 | |||||
测试分组 | |||||
类别 | ASUS R162-E4服务器 | 双路Xeon E5430基准平台 DELL PE2900 III服务器 | |||
处理器子系统 | |||||
处理器 | 双路Intel Xeon X5460 | 双路Intel Xeon E5430 | |||
处理器架构 | Intel 45nm Penryn | Intel 45nm Penryn | |||
处理器代号 | Harpertown | Harpertown | |||
处理器封装 | Socke 771 LGA | Socke 771 LGA | |||
处理器规格 | 四核 | 四核 | |||
处理器指令集 | MMX,SSE,SSE2,SSE3,SSSE3, SSE4.1,EM64T,VT | MMX,SSE,SSE2,SSE3,SSSE3, SSE4.1,EM64T,VT | |||
主频 | 3.16GHz | 2.66GHz | |||
处理器外部总线 | FSB:1333MHz | FSB:1333MHz | |||
L1 D-Cache | 4x 32KB 8路集合关联 | 4x 32KB 8路集合关联 | |||
L1 I-Cache | 4x 32KB 8路集合关联 | 4x 32KB 8路集合关联 | |||
L2 Cache | 4x 32KB 8路集合关联 | 2x 6144KB 16路集合关联 | |||
L3 Cache | - | - | |||
主板 | |||||
主板型号 | ASUS DSBF-DR12/SAS | DELL PE2900 III | |||
北桥芯片组(MCH) | Intel 5000P | Intel 5000X | |||
北桥芯片特性 | - | 12MB Snoop Filter | |||
内存控制器 | 北桥集成四通道FBD DDR2 | 北桥集成四通道FBD DDR2 | |||
内存 | 2GB FBD DDR2 667 SDRAM x4 | 2GB FBD DDR2 667 SDRAM x4 | |||
系统磁盘子系统 | |||||
磁盘控制器 | LSI 1068E SAS Controller | DELL Perc 5/i RAID Controller | |||
磁盘控制器规格 | SAS 3Gbps | SAS 3Gbps | |||
磁盘控制器设置 | HostRAID 0 | RAID 5 | |||
磁盘控制器驱动 | LSI SAS 1.28.3.00 | LSI SAS 3.8.0.32 | |||
磁盘 | Seagate Cheetah 15K.5 ST373455SS x4 | Seagate Cheetah 15K.5 ST314655SS x3 | |||
磁盘规格 | 15000RPM 73.4GB SAS 3Gbps 16MB Cache | 15000RPM 146GB SAS 3Gbps 16MB Cache | |||
磁盘设置 | SATA 3Gbps 30GB系统分区 | SAS 3Gbps 20GB系统分区 | |||
网络子系统 | |||||
网卡 | Intel PRO/1000 EB Network Connection with I/O Acceleration x2 | Broadcom BCM5708C PCI-E千兆网卡 x2 | |||
网卡设置 | Intel NIC Teaming Load Balancing IOAT | Broadcom NIC Teaming Load Balancing | |||
网卡驱动 | Intel PRO Set 13.4 | Broadcom NetXtreme 2 11.04.01 | |||
软件环境 | |||||
操作系统 | Microsoft Windows Server 2003 R2 Enterprise Edition SP2 | Microsoft Windows Server 2003 R2 Enterprise Edition SP2 |
两平台同样为双路四核配置,不过ASUS RS-162-E4的处理器要强出不少,而DELL基准平台的主板则要好上一些。磁盘子系统方面DELL平台是硬SAS阵列卡,而ASUS RS162-E4是SAS卡上附带的HostRAID功能,只能支持RAID 0、1、0+1,我们组建了4个硬盘的RAID 0阵列,从性能上看,要比基准平台的RAID 5要高,不过安全性上有所不及,对于真正用户来说,建议使用RAID 0+1的配置。
我们在上述配置的两服务器平台上分别安装了Microsoft Windows 2003 R2 Enterprise Server 5.02.3790 (Service Pack 2),Server 2003从R2开始支持Intel的IOAT功能,可以进一步降低网络的CPU占用率以及提升性能。我们正确安装了各个硬件的驱动程序,确保服务器工作在非常好的的状态。
在网络与系统优化方面,我们将两平台采用同样的系统设置,并使用了端口聚合功能,以查看其最大性能表现。在测试中,我们打开了所有有关节能方面的特性,如EIST、C1E等功能。
测试方法介绍
SPEC CPU2006 v1.01
SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。
SPEC CPU 2006是SPEC组织推出的一套CPU子系统评估软件,它包括CINT2000和CFP2000两个子项目,前者用于测量和对比整数性能,而后者则用于测量和对比浮点性能。计算系统中的处理器、内存和编译器都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2000的影响比较小。
SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、DCC以及科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。
SPEC CPU 2006的运行有着比较特别的要求,我们将会在后面详细解释。
ScienceMark v2.0 Membench
ScienceMark v2.0是一款用于测试系统特别是处理器在科学计算应用中的性能的软件,MemBenchmark是其中针对处理器缓存、系统内存而设计的功能模块,它可以测试系统内存带宽、L1 Cache延迟、L2 Cache延迟和系统内存延迟,另外还可以测试不同指令集的性能差异。
CineBench R10
CineBench是基于Cinem3D物理建模软件的一个测试程序,主要针对处理器子系统、内存子系统和显示子系统,可以完善地支持多核/多线程。对于服务器来说显示子系统并不重要,因此主要用它来测试处理器子系统和内存子系统。
SiSoftware Sandra 2009
SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。我们使用了SiSoftware Sandra的2009版,它可以支持各种最新的CPU指令集,并能良好地支持多核、多线程,我们主要用其来评估平台的理论计算性能。
IOMeter 2006.07.27
IOMeter是一款功能非常强大的IO测试软件,它除了可以在本机运行测试本机的IO(磁盘)性能之外,还提供了模拟网络应用的能力。在这次的测试中,我们仅仅让它在本机运行测试服务器的磁盘性能。为了全面测试被测服务器的IO性能,我们分别选择了不同的测试脚本。
Max_throughput(read):文件尺寸为64KB,100%读取操作,随机率为0%,用于检测磁盘系统的最大读取吞吐量
Max_IO(read):文件尺寸为512B,100%读取操作,随机率为0%,用于检测磁盘系统的最大读取操作IO处理能力
Max_throughput(write):文件尺寸为64KB,0%读取操作,随机率为0%,用于检测磁盘系统的最大写入吞吐量
Max_IO(write):文件尺寸为512B,0%读取操作,随机率为0%,用于检测磁盘系统的最大写入操作IO处理能力
NetBench v7.03
NetBench是针对文件服务器的性能测试软件,影响NetBench性能的主要是服务器的磁盘子系统,服务器磁盘控制器、条带大小、读写缓存、硬盘类型、组建磁盘阵列模式、内存容量、网络拓朴结构等都会对测试结果有明显的影响。我们在被测服务器上设立了文件服务器,NetBench通过网络实验室中60个客户端来模拟网络中的PC向文件服务器所发出的文件传输请求,文件服务器则将存储在磁盘上的文件数据发送给相应的客户端。在测试过程中,客户端会以每四台一组的步进依次增加并且向服务器发送文件传输请求,测试结束后控制台收集数据并绘制出服务器的数据传输变化曲线。
Benchmark Factory 4.6
大部分的服务器应用都同数据库有着密切的联系,因此我们今年开始着手在在服务器测试中加入对于数据库性能的测试。我们选择了Benchmark Factory 4.6软件和Microsoft SQL Server 2005来测试不同的硬件平台在数据库应用中的表现。
我们选择了BF内置的标准测试脚本AS3AP,这项测试可用于对于ANSI结构化查询语言(SQL)关系型数据库进行测试,它可用于测试DBMS(单用户微机数据库管理系统),也可用于测试高性能并行或者分布式数据库。
华硕RS162-E4采用了两个ES工程样品处理器,正式销售的时候肯定不能出现这样的产品。它们实际上是Intel Xeon X5460
华硕RS162-E4采用了Xeon X5460处理器,主频高达3.16GHz。在闲置的时候,它会自动降低到2G运行,并会降低相应的电压等参数来降低功耗
Xeon X5460基于Intel 45nm Penryn:Harpertwon架构
缓存架构
ASUS自家的DSBF-DR12/SAS主板
8GB FB-DDR2 667 SDRAM
SiSoftware Sandra Pro Business 2009
SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。从Sandra 2007开始支持SSE4指令集。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台,这也是我们选择这款软件的原因之一。
SiSoftware Sandra Pro Business 2009 | ||
测试对象 | ASUS RS162-E4 双路Xeon X5460 | DELL PE2900 III 双路Xeon E5430 |
Processor Arithmetic Benchmark 处理器架构测试 | ||
Dhrystone ALU | 107913MIPS | 91006MIPS |
Dhrystone ALU vs SPEED | 34.16MIPS/MHz | 34.21MIPS/MHz |
Whetstone iSSE3 | 91917MFLOPS | 78385MFLOPS |
Dhrystone iSSE3 vs SPEED | 29.10MFLOPS/MHz | 29.47MFLOPS/MHz |
Processor Multi-Media Benchmark 处理器多媒体测试 | ||
Multi-Media Int x8 iSSE4.1 | 236.57MPixel/s | 199.33MPixel/s |
Multi-Media Int x8 iSSE4.1 vs SPEED | 74.89kPixels/s/MHz | 74.94kPixels/s/MHz |
Multi-Media Float x4 iSSE2 | 128.95MPixel/s | 108.69MPixel/s |
Multi-Media Float x4 iSSE2 vs SPEED | 40.82kPixels/s/MHz | 40.86kPixels/s/MHz |
Multi-Media Double x2 iSSE2 | 65.98MPixel/s | 55.75MPixel/s |
Multi-Media Double x2 iSSE2 vs SPEED | 20.89kPixels/s/MHz | 20.96kPixels/s/MHz |
Multi-Core Efficiency Benchmark | ||
Inter-Core Bandwidth | 24.75GB/s | 20.54GB/s |
Inter-Core Bandwidth vs SPEED | 8.02MB/s/MHz | 7.91MB/s/MHz |
Inter-Core Latency (越小越好) | 94ns | 90ns |
Inter-Core Latency vs SPEED (越小越好) | 0.03ns/MHz | 0.03ns/MHz |
Memory Bandwidth Benchmark 内存带宽测试 | ||
Int Buff'd iSSE2 Memory Bandwidth | 5.74GB/s | 6.13GB/s |
Int Buff'd iSSE2 Memory Bandwidth vs SPEED | 8.83MB/s/MHz | 9.43MB/s/MHz |
Float Buff'd iSSE2 Memory Bandwidth | 5.74GB/s | 6.13GB/s |
Float Buff'd iSSE2 Memory Bandwidth vs SPEED | 8.83MB/s/MHz | 9.43MB/s/MHz |
Memory Latency Benchmark 内存延迟测试 | ||
Memory(Random Access) Latency (越小越好) | 113ns | 108ns |
Memory(Random Access) Latency vs SPEED (越小越好) | 0.17ns/MHz | 0.16ns/MHz |
Speed Factor | 118.10 | 95.20 |
Internal Data Cache | 3clocks | 3clocks |
L2 On-board Cache | 18clocks | 18clocks |
Cache and Memory Benchmark 缓存及内存测试 | ||
Cache/Memory Bandwidth | 85.37GB/s | 68.88GB/s |
Cache/Memory Bandwidth vs SPEED | 27.67MB/s/MHz | 26.52MB/s/MHz |
Speed Factor | 114.30 | 111.90 |
Internal Data Cache | 510.42GB/s | 421.23GB/s |
L2 On-board Cache | 161.64GB/s | 122.68GB/s |
.NET Arithmetic Benchmark .NET架构测试 | ||
Dhrystone .NET | 11675MIPS | 10562MIPS |
Dhrystone .NET vs SPEED | 3.70MIPS/MHz | 3.97MIPS/MHz |
Whetstone .NET | 54799MFLOPS | 45399MFLOPS |
Whetstone .NET vs SPEED | 17.35MFLOPS/MHz | 17.07MFLOPS/MHz |
.NET Multi-Media Benchmark .NET多媒体测试 | ||
Multi-Media Int x1 .NET | 37.89MPixel/s | 31.28MPixel/s |
Multi-Media Int x1 .NET vs SPEED | 11.99kPixels/s/MHz | 11.76kPixels/s/MHz |
Multi-Media Float x1 .NET | 10.38MPixel/s | 8.68MPixel/s |
Multi-Media Float x1 .NET vs SPEED | 3.29kPixels/s/MHz | 3.26kPixels/s/MHz |
Multi-Media Double x1 .NET | 29.68MPixel/s | 24.75MPixel/s |
Multi-Media Double x1 .NET vs SPEED | 9.39kPixels/s/MHz | 9.30kPixels/s/MHz |
SiSoftware Sandra对比
测试平台的处理器子系统、内存子系统架构上都很相似,ASUS RS162-E4采用的X5460在频率上比我们的基准测试平台要高上不少,因此L1、L2以及处理器间带宽上ASUS平台表现良好。
内存带宽方面,Sandra结果表示ASUS平台的性能不及我们实验室的基准平台,部分是由于主板的问题,部分是由于芯片组的问题。我们的DELL平台采用了5000X芯片组,带有12MB Snoop Filter缓存,可以降低内存存取,从而提升FSB总线和内存总线的效率。在一些情况下,它就表现为内存带宽的提升。
ScienceMark v2.0 Membench
ScienceMark v2.0是一款用于测试系统特别是处理器在科学计算应用中的性能的软件,MemBenchmark是其中针对处理器缓存、系统内存而设计的功能模块,它可以测试系统内存带宽、L1 Cache延迟、L2 Cache延迟和系统内存延迟,另外还可以测试不同指令集的性能差异。
ScienceMark v2.0 Membench L1测试成绩
ScienceMark v2.0 Membench L2测试成绩
ScienceMark v2.0 Membench 内存测试成绩
首先我们进行的是ScienceMark的测试,主要考察系统的缓存和内存子系统情况。L1/L2 Cache的成绩主要是跟处理器频率相关,因为目前的处理器当中L1 Cache都是和处理器核心同频率的,而L2 Cache基本上也是——当前的处理器L2都是全速的(放置在处理器内但不在同一个芯片上的Pentium II为半速L2,而Pentium之前的处理器L2则和处理器分离,速度更低)。越快的频率,L1/L2性能就越好。而内存带宽主要由两部分相关:比较大的部分是内存架构,小部分是内存操作指令(集),例如使用最新的SSE指令集比通常的ALU指令集会得到更大的吞吐量,而不同的SSE版本性能也有不同。
ScienceMark Membench | ||
厂商 | ASUS | DELL基准平台 |
产品型号 | RS162-E4 | PE2900 III |
内存技术参数 | 1GB FBD ECC DDR2-667 SDRAM x8 | 2GB FBD ECC DDR2-667 SDRAM x4 |
L1带宽(MB/s) | 55826.64 | 55688.67 |
L2带宽(MB/s) | 16724.85 | 16730.90 |
内存带宽(MB/s) | 3886.51 | 4479.89 |
L1 Cache Latency(ns) | ||
32 Bytes Stride | 0.95 | 1.13 |
L1 Algorithm Bandwidth(MB/s) | ||
Compiler | 25216.47 | 25244.97 |
REP MOVSD | 25323.26 | 25451.67 |
ALU Reg Copy | 12729.38 | 12826.15 |
MMX Reg Copy | 25283.57 | 25348.59 |
SSE PAlign | 52092.71 | 48552.33 |
SSE2 PAlign | 55826.64 | 55688.67 |
L2 Cache Latency(ns) | ||
4 Bytes Stride | 0.95 | 1.13 |
16 Bytes Stride | 1.27 | 1.50 |
64 Bytes Stride | 3.80 | 4.51 |
256 Bytes Stride | 3.80 | 4.51 |
512 Bytes Stride | 4.12 | 4.89 |
L2 Algorithm Bandwidth(MB/s) | ||
Compiler | 11694.72 | 11882.42 |
REP MOVSD | 12344.87 | 12530.11 |
ALU Reg Copy | 8627.35 | 8590.76 |
MMX Reg Copy | 13371.08 | 13403.55 |
SSE PAlign | 16314.58 | 16715.36 |
SSE2 PAlign | 16724.85 | 16730.90 |
Memory Latency(ns) | ||
4 Bytes Stride | 1.27 | 1.13 |
16 Bytes Stride | 5.07 | 4.51 |
64 Bytes Stride | 19.94 | 19.17 |
256 Bytes Stride | 67.43 | 60.90 |
512 Bytes Stride | 73.45 | 68.04 |
Memory Algorithm Bandwidth(MB/s) | ||
Compiler | 3419.12 | 3184.41 |
REP MOVSD | 3469.53 | 3220.63 |
ALU Reg Copy | 3193.86 | 2780.84 |
MMX Reg Copy | 3273.18 | 2966.63 |
MMX Reg 3dNow | --- | --- |
MMX Reg SSE | 3885.03 | 4022.10 |
SSE PAlign | 3884.45 | 4320.64 |
SSE PAlign SSE | 3886.51 | 4443.62 |
SSE2 PAlign | 3884.09 | 4321.07 |
SSE2 PAlign SSE | 3882.18 | 4442.27 |
MMX Block 4kb | 3187.37 | 4062.40 |
MMX Block 16kb | 3483.78 | 4476.12 |
SSE Block 4kb | 3168.25 | 4083.46 |
SSE Block 16kb | 3498.36 | 4476.69 |
从测试结果来看,ASUS平台的L1测试表现由于频率上的优势而要高于基准平台,而在L2方面虽然延迟表现要好于DELL平台,不过带宽测试却是略有不及,内存测试方面则更是要逊于,这仍然和前面Sandra测试一样,部分是由于主板调整的原因,部分是由于芯片组的原因。
CineBench R10
CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,我们的平台偏向于服务器多一些,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。
CineBench R10 | ||
处理器 | ASUS RS162-E4服务器 双路Xeon X5460 | DELL PE 2900 III服务器 双路Xeon E5430 |
显卡 | - | - |
CPU Benchmark | ||
Rendering (1 CPU) | 3473 CB-CPU | 2931 CB-CPU |
Rendering (x CPU) | 19993 CB-CPU | 16806 CB-CPU |
Multiprocessor Speedup | 5.76x | 5.73x |
OpenGL Benchmark | ||
OpenGL Standard | 180 CB-GFX | 176 CB-GFX |
ASUS RS162-E4服务器测试成绩对比
单处理器的渲染性能,ASUS RS162-E4要高18.5%,多处理器的渲染性能ASUS RS162-E4要高19%,大致和频率上的差距18.8%(3.16/2.66)相似,这个测试DELL 5000X芯片组没有表现出什么特别的优势。
SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。
SPEC CPU 2006是SPEC组织推出的一套CPU子系统评估软件,它包括CINT2000和CFP2000两个子项目,前者用于测量和对比整数性能,而后者则用于测量和对比浮点性能。计算系统中的处理器、内存和编译器都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2000的影响比较小。
SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、DCC以及科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。
为了运行SPEC CPU 2006测试,我们统一安装了Windows Server 2008 Enterprise x64 Edition SP1操作系统,在主流的x64处理器下,原生64应用要比32位下快。我们还安装了Visual Studio 2005 SP1、Intel C++/Fortran Compiler 10.0.025编译器,对于Intel处理器,我们使用了QxS对SSE4指令集进行了优化。编译时未使用SmartHeap商业优化库。
SPEC测试代表了绝大多CPU密集型的运算,包括编程语言、压缩、人工智能、基因序列搜索、视频压缩及各种力学的计算等,包含了多种科学计算,可以用来衡量系统执行这些任务的快慢。SPEC base测试包括浮点(fp)与整数运算(int)两部分。
整数运算主要包含编译、压缩、人工智能、视频压缩转换、XML处理等,此外,各种日常操作也主要是基于整数操作。SPEC CPU 2006的整数运算包含了400.perlbench PERL编程语言、401.bzip2 压缩、403.gcc C编译器、429.mcf 组合优化、445.gobmk 人工智能:围棋、456.hmmer 基因序列搜索、458.sjeng 人工智能:国际象棋、462.libquantum 物理:量子计算、464.h264ref 视频压缩、471.omnetpp 离散事件仿真、473.astar 寻路算法、483.xalancbmk XML处理共12项。
ASUS RS162-E4 SPEC CPU 2006整数测试成绩
浮点运算包括的全部都是科学运算,科学运算需要用到大量的高精度浮点数据,如410.bwaves 流体力学、416.gamess 量子化学、433.milc 量子力学、434.zeusmp 物理:计算流体力学、435.gromacs 生物化学/分子力学、436.cactusADM 物理:广义相对论、437.leslie3d 流体力学、444.namd 生物/分子、447.dealII 有限元分析、450.soplex 线形编程、优化、453.povray 影像光线追踪、454.calculix 结构力学、459.GemsFDTD 计算电磁学、465.tonto 量子化学、470.lbm 流体力学、481.wrf 天气预报、482.sphinx3 语音识别共17项测试。
ASUS RS162-E4 SPEC CPU 2006整数测试成绩
在分析结果之前,我们首先看到两个测试平台的处理器的频率差异:3.16GHz和2.66GHz,前者比后者高18.8%。
在整数运算中,测试成绩的差异和频率的差异相仿:17.8%。ASUS RS162-E4的得分为88.1分。一些测试项目超出了频率上的差异,这样的测试包括了:401.bzip2 压缩(49.7%)、456.hmmer 基因序列搜索(28.6%)、464.h264ref 视频压缩(21.6%)、483.xalancbmk XML处理器(27.0%)。
在浮点运算中,测试成绩的差异为13.5%,ASUS RS162-E4的得分为64.7分。现代Intel的CPU一般偏向于整数运算强一些。测试成绩提升超过频率上的差异的测试有:465.tonto 量子化学(31.7%)、482.sphinx3 语音识别(57.0%)。大部分测试提升都不多,433.milc 量子力学项目甚至还有所降低,这表明这些测试都是内存密集型测试。ASUS RS162-E4的内存效能不是很高,部分是由于基准平台的5000X带有Snoop Filter缓存的缘故,部分应该是主板优化的缘故。
我们两台测试对象服务器都采用了15000RPM的Seagate Cheetah 15K.5硬盘,性能相似,不同的是,ASUS RS162-E4是4块硬盘组建RAID 0阵列,而DELL基准服务器则是3块组建RAID 5阵列,在最终要的阵列卡方面,ASUS实际上是用的是SAS卡的HostRAID功能,而DELL则是实实在在地基于LSI MegaRAID SAS 8408E的硬件阵列功能。
IO读
IO写
硬件阵列功能在较高负荷的服务器上几乎是一个必备的功能,它很重要,4个硬盘的RAID 0的IOps不敌3个硬盘的RAID 5就是因为阵列卡的缘故。
IO吞吐量
IO吞吐量
相对地,吞吐量则对阵列卡要求不太高,例如桌面系统使用的SATA软阵列经常可以到300~500MB/s的性能,因此ASUS的RAID 0表现出很高的读取吞吐量。
NetBench v7.03
NetBench 7.03 Ent_dm.tst测试脚本模拟的是企业级文件服务器应用,它不但要求被测服务器的磁盘子系统可以提供足够的吞吐量,还需要其具有较高的IO处理能力,并且需要较为平衡的读取能力和写入能力。
NetBench测试主要考察缓存、内存、磁盘子系统,因此ASUS RS162-E4的X5460帮不上什么忙,硬RAID 5的性能要比RAID 0高50%左右。关于NetBench测试可以看这里《评测机密:文件服务器性能提升N大要义》。
Benchmark Factory 4.6
我们在被测服务器上安装了Microsoft SQL 2005 SP1,按照测试要求建立了数据库。BF在测试之前会在数据库中生成9个表,其中包括4个500万行的表格,每行包括100字节的数据,因此每个表格容量大约是476MB,整个数据库容量为1.86GB。我们用60个客户端模拟1000个用户,在这个数据库中进行查询、添加、删除、修改等操作。
数据库测试是一个综合性的测试……除了对网络带宽的压力不大之外。从测试数据来看,ASUS RS162-E4的X5460处理器让其性能要比我们的基准平台高10~15%左右。
华硕RS162-E4服务器整体功耗
我们利用UNI-T UT71E智能数字万用表和相配套的软件对于对于被测服务器在几种不同的状态下的功耗进行了监测,主要包括如下项目:
P1:连接电源但不开机状态
P2:系统启动完毕,5分钟内无动作,但不休眠
P3:系统启动完毕,处理器满载、磁盘以最大吞吐量工作
ASUS RS162-E4采用的高频率处理器实有代价的,Xeon X5460的频率高达3.16GHz,TDP为120W(TDP并不代表实际发热),因此整体散热等也要进行搭配,在测试中我们可以从老远听见处理其散热风扇发来巨大轰鸣声,因此ASUS RS162-E4的功耗比基准平台高也不出奇了。最高功耗上ASUS RS162-E4要高出30%。
【IT168评测中心】华硕RS162-E4配置了高频率Xeon X5460处理器,支持最多48GB FBD DDR2内存,提供4个3.25英寸热插拔硬盘曹。ASUS RS162-E4的性能是非常强的,在不同的应用上可以比我们的基准平台高出10%~20%性能。
华硕RS162-E4在1U机架内集成了两颗3.16GHz的45nm Xeon处理器
华硕RS162-E4的强劲性能是在1U空间内达到的,这让其可以实现非常高的计算密度。RS162-E4的缺点是磁盘子系统方面只能支持RAID 0、1和0+1,这降低了如文件服务器这样的一些应用的性能。除此之外,华硕很适合作科学计算和数据库。
华硕RS162-E4背部具有两个热插拔电源的位置,这在1U机架服务器里面是不太多见的
同时ASUS RS162-E4可以搭配热插拔冗余电源也在1U机架内很少见,RS162-E4可以说是能和通常2U服务器相当的机型。