【IT168 评测】服务器作为一种定制化的工具,各类别之间相差甚大,即使是同一系列的服务器,由于配置(包括处理器、内存、硬盘、Raid卡等等)差异,在性能上也会体现出很大的区别。处理器作为重要的组成部分之一,采购过程中,人们都习惯性的选择主频更高的,而对其中有多大的区别或许并不了解,IT168将通过对同一台服务器不同的处理器进行测试,为广大用户提供选购参考,今天我们采用的测试服务器为HP DL120 G7,测试的处理器为E3-1220和E3-1240。
惠普ProLiant DL120 G7是一款采用1U高度的机架式服务器,搭载了至强E3处理器平台。
惠普ProLiant DL120 G7服务器前后视图
前置USB接口和状态指示灯
惠普ProLiant DL120 G7的前面板设计比较简单,提供了4个3.5英寸的硬盘位,可以支持SATA或SAS硬盘,后面板设计也比较简单。
惠普ProLiant DL120 G7开箱图
惠普ProLiant DL120 G7的内部空间非常宽敞。它内部有4个风扇用来散热,其中3个负责给处理器、内存等关键部件散热,1个用作阵列卡的散热。为了有效提升散热效果,惠普ProLiant DL120 G7服务器在处理器和内存部分还有一个导风罩,可以更好的促进空气流动。
惠普ProLiant DL120 G7配备的电源
惠普ProLiant DL120 G7标配了台达400W电源,对于E3这样低功耗的平台来说,400W已经足够。
惠普ProLiant DL120 G7服务器内部拆解
至强E3-1220处理器
至强E3-1240处理器
这次我们对比的是Intel至强E3平台下的两款处理器,分别为E3-1220和E3-1240,其中E3-1240处理器,主频为3.3GHz,具备4核心8线程,TDP为80W;而E3-1220处理器主频为3.1GHz,4核心4线程,TDP同样为80W,为了单纯的比较主频对于服务器性能的影响,特意将E3-1240的超线程功能关掉,因而两颗处理器测试中均为4核心4线程,特此说明。
惠普ProLiant DL120 G7服务器内存
应对我们测试的要求,惠普ProLiant DL120 G7服务器一共配置了4条4GB DDR3 ECC内存,总容量16GB对于日常的E3处理器应用来说已经完全够用。
西部数据WD5003ABYX
惠普ProLiant DL120 G7服务器采用了西部数据WD5003ABYX硬盘,容量为500GB。测试中我们使用这些硬盘组建了RAID 5阵列。
惠普ProLiant DL120 G7服务器配备的阵列卡
惠普ProLiant DL120 G7服务器提供了一个P212阵列卡,并提供了对应的内存和电池。这块阵列卡可以实现RAID 5、RAID 6等常用阵列和RAID 0、RAID 1等基本阵列。
服务器扩展槽位置
惠普ProLiant DL120 G7服务器提供了4个扩展槽,分别是PCI-E X16、PCI-E X8和PCI-E X4。
板载的显示芯片
板载的英特尔千兆网络芯片
惠普特色的iLO3远程管理芯片
服务器测试环境介绍
为了进行网络产品的测试,IT168评测中心专门组建了网络实验室,并搭建了一个有60台客户端的网络测试环境,通过控制端并利用专业的网络测试软件,可以构建出多样化的网络访问模型,能够产生真实的多用户网络应用环境。可以对服务器类设备进行不同应用下的高压力性能测试,以直观的结果反映出服务器产品在用于不同应用时其真实的性能状况。
我们采用千兆交换机作为测试环境的交换设备,60台单路服务器作为客户端,能产生足够大的网络访问压力,因而可以测试服务器类设备在实现不同应用时的极限性能。
▲网络实验室控制台
▲千兆交换机,120个千兆网口
▲用于产生用户访问压力的塔式服务器
服务器测试工具介绍
对于服务器性能方面的考察,我们主要分为子系统测试和应用性能测试。在子系统测试中我们按处理器、内存以及磁盘等各个子系统进行了分项测试,当然各子系统的测试成绩也是相辅相成,也需要其它子系统的支持,并非是完全独立的,只是对考察的子系统有所偏重而已。
处理器子系统测试
对服务器处理器子系统的考察,我们主要采用的是业界公认的SPEC CPU 2006测试,该项测试通过对数十个典型应用程序的运行,来测试系统处理器子系统在应用中的整、浮点运算效率。SPEC CPU 2006测试具有很好的开放性,因此在业界为广大用户所接受,可以利用这一公开的测试结果进行系统间运算性能的比较。
此外SiSoftware Sandra也有测试子项可用于处理器运算性能测试,其结果通常以每秒完成的指令数来表现。也可以用作不同处理器间运算效率的比较。
SPEC CPU 2006 v1.1
SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。
SPEC CPU 2006是SPEC组织推出的CPU子系统评估软件最新版,我们之前使用的是SPEC CPU 2000。和上一个版本一样,SPEC CPU 2006包括了CINT2006和CFP2006两个子项目,前者用于测量和对比整数性能,后者则用于测量和对比浮点性能,SPEC CPU 2006中对SPEC CPU 2000中的一些测试进行了升级,并抛弃/加入了一些测试,因此两个版本测试得分并没有可比较性。
SPEC CPU测试中,测试系统的处理器、内存子系统和使用到的编译器(SPEC CPU提供的是源代码,并且允许测试用户进行一定的编译优化)都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2006的影响非常的小。
SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。
我们在被测服务器中安装了Intel C++ 11.1.034 Compiler、Intel Fortran 11.1.034 Compiler这两款SPEC CPU 2006必需的编译器,通过最新出现的QxS编译参数,Intel Compiler 10版本开始支持对Intel SSE4指令集进行优化(假如只支持SSE3,则使用QxT编译参数)。我们另外安装了Microsoft Visual Studio 2003 SP1提供必要的库文件。按照SPEC的要求我们根据自己的情况编辑了新的Config文件,使用了较多的编译选项。我们根据被测系统选择实际可同时处理的线程数量,最后得到SPEC rate base测试结果(基于base标准编译,SPEC base rate测试代表系统同时处理多个任务的能力)。
和其它测试部件不同,SPEC CPU 2006需要大量的系统物理内存,我们的SPEC测试在64位的Windows Server 2008 R2 下完成,对于每个运算核心,最低配置1.5GB内存。
内存子系统测试
对于内存子系统的考察,也是利用SiSoftware Sandra来实现,在该软件中有相应组件可进行内存带宽、内存延迟等方面的测试。
SiSoftware Sandra v2011
SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。从2007开始,Sandra的Arithmetic benchmarks增加了对SSE3&SSE4 SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,另外还升级了File System benchmark和Removable Storage benchmark两个子项目。对于新的硬件的支持当然也是该软件每次升级的重要内容之一,SiSoftware Sandra 2011对NUMA架构以及最新的Windows 7/Windows Server 2008 R2提供了更好的支持,此外测试项目和测试结果也有了略微的变化。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台。
惠普ProLiant DL120 G7服务器配置一览
产品名称 | 惠普DL120 G7服务器 | 惠普DL120 G7服务器 |
平台类型 | 单路 Sandy Bridge-E3 | 单路 Sandy Bridge-E3 |
处理器子系统 | ||
---|---|---|
处理器型号 | Intel Xeon E3-1220 | Intel Xeon E3-1240 |
处理器架构 | Intel 32nm Sandy Bridge | Intel 32nm Sandy Bridge |
代号 | Sandy Bridge | Sandy Bridge |
处理器封装 | Socket 1155 LGA | Socket 1155 LGA |
核心/线程数量 | 4/4 | 4/4 |
主频 | 3.1GHz | 3.3GHz |
处理器指令集 | MMX,SSE,SSE2,SSE3, | MMX,SSE,SSE2,SSE3, |
外部总线 | DMI 5.0GT/S | DMI 5.0GT/S |
L1 Code Cache | 4× 32KB 8路集合关联 | 4× 32KB 8路集合关联 |
L1 Data Cache | 4× 32KB 4路集合关联 | 4× 32KB 4路集合关联 |
L2 Cache | 4× 256KB 8路集合关联 | 4× 256KB 8路集合关联 |
L3 Cache | 8MB 16路集合关联 | 8MB 16路集合关联 |
服务器主板 | ||
型号主板 | 惠普ProLiant DL120 G7 | 惠普ProLiant DL120 G7 |
主板芯片组 | 惠普ProLiant DL120 G7 | 惠普ProLiant DL120 G7 |
北桥芯片特性 | 2×QPI VT-d Gen 2 | 2×QPI VT-d Gen 2 |
子系统内存 | ||
控制器内存 | 每集成双通道U-ECC DDR3 1333CPU | 每集成双通道U-ECC DDR3 1333CPU |
内存类型 | 4GB R-ECC DDR3 1333 SDRAM ×4条 | 4GB R-ECC DDR3 1333 SDRAM ×4条 |
存储子系统 | ||
磁盘控制器 | LSI Embedded MegaRAID SAS RAID Controller | LSI Embedded MegaRAID SAS RAID Controller |
磁盘控制器规格 | 4x SATA 3Gb/s MatrixRAID 0/1/3/5 | 4x SATA 3Gb/s MatrixRAID 0/1/3/5 |
控制器驱动 | LSI MegaSR 13.06.0212.2009 | LSI MegaSR 13.06.0212.2009 |
型号数量硬盘 | LSI MegaSR 13.06.0212.2009 | LSI MegaSR 13.06.0212.2009 |
规格硬盘 | 7200RPM 500GB SATA 3Gbps 16MB Cache | 7200RPM 500GB SATA 3Gbps 16MB Cache |
软件环境 | ||
操作系统 | Microsoft Windows Server 2008 Enterprise R2 x64 | Microsoft Windows Server 2008 Enterprise R2 x64 |
由于我们采用的是同一台服务器进行测试,并且关掉了E3-1240的超线程功能,因此,除了主频上的差异,其它并无区别。
处理器详细规格
至强E3-1240处理器是至强E3家族的中端产品,而E3-1220是E3系列的低端产品,下面我们通过CPU-Z软件来查看它的详细信息。
▲至强E3-1240处理器信息
至强E3-1220处理器信息
16GB内存容量
Sisoftware Sandra 2011处理器性能
SiSoftware Sandra Pro Business 2011 | ||
产品名称 | HP DL120 G7 | HP DL120 G7 |
平台类型 | 单路Intel SandyBridge | 单路Intel SandyBridge |
处理器型号 | 至强E3-1240(关超线程) | 至强E3-1220 |
Processor Arithmetic Benchmark 处理器算术运算测试 | ||
---|---|---|
总计本地功效 | 71GOPS | 66.64GOPS |
总计本地功效对比速度 | 19.22MOPS/MHz | 19.64MOPS/MHz |
Dhrystone iSSE4.2 | 103.54GIPS | 97.44GIPS |
Dhrystone iSSE4.2 vs SPEED | 28.04MIPS/MHz | 28.73MIPS/MHz |
Whetstone iSSE3 | 48.63GFLOPS | 45.57GFLOPS |
Dhrystone iSSE3 vs SPEED | 13.17MFLOPS/MHz | 13.43MFLOPS/MHz |
Processor Multi-Media Benchmark 处理器多媒体测试 | ||
总计多媒体功效 | 130.75MPixel/s | 123MPixel/s |
总计多媒体功效对比速度 | 35.41kPixels/s/MHz | 36.28kPixels/s/MHz |
Multi-Media Int x16 iSSE4.1 | 158.52MPixel/s | 149.2MPixel/s |
Multi-Media Int x16 iSSE4.1 vs SPEED | 42.94kPixels/s/MHz | 43.99kPixel/s/MHz |
Multi-Media Float x8 iSSE2 | 107.84MPixel/s | 101.51MPixel/s |
Multi-Media Float x8 iSSE2 vs SPEED | 29.21kPixels/s/MHz | 29.93kPixels/s/MHz |
Multi-Media Double x4 iSSE2 | 58.56MPixel/s | 54.86MPixel/s |
Multi-Media Double x4 iSSE2 vs SPEED | 15.86kPixels/s/MHz | 16.17kPixels/s/MHz |
Multi-Core Efficiency Benchmark 处理器效能测试 | ||
内联核带宽 | 8.63GB/s | 8GB/s |
内联核带宽对比速度 | 2.39MB/s/MHz | 2.44MB/s/MHz |
内联核延迟(越小越好) | 39.2ns | 42.0ns |
内联核延迟对比速度(越小越好) | 0.11ns/MHz | 0.12ns/MHz |
Java算数性能测试 | ||
总计 Java 功效 | 58.58GOPS | 57GOPS |
总计 Java 功效对比速度 | 16.31MOPSMHz | 16.81MOPSMHz |
Dhrystone Java | 108.55GIPS | 109.83GIPS |
Dhrystone Java对比速度 | 30.22MIPS/MHz | 32.38MIPS/MHz |
Whetstone Java | 31.6GFLOPS | 29.6GFLOPS |
Whetstone Java对比速度 | 8.80MFLOPSMHz | 8.73MFLOPS/MHz |
Java多媒体性能测试 | ||
总计多媒体Java功效 | 18MPixel/s | 17MPixel/s |
总计多媒体Java功效对比速度 | 4.88kPixels/s/MHz | 4.99kPixels/s/MHz |
多媒体整数 x1 Java | 20.68MPixel/s | 19.4MPixel/s |
多媒体整数 x1 Java对比速度 | 5.60kPixels/s/MHz | 5.72kPixels/s/MHz |
多媒体浮点数 x1 Java | 15.7MPixel/s | 14.79MPixel/s |
多媒体浮点数 x1 Java对比速度 | 4.25kPixels/s/MHz | 4.36kPixels/s/MHz |
多媒体双精度 x1 Java | 16MPixel/s | 14.76MPixel/s |
多媒体双精度 x1 Java对比速度 | 4.32kPixels/s/MHz | 4.35kPixels/s/MHz |
.NET Arithmetic Benchmark .NET算术运算测试 | ||
总计 .NET 功效 | 21.32GOPS | 19.77GOPS |
总计 .NET 功效对比速度 | 5.77MOPS/MHz | 6.00MOPS/MHz |
Dhrystone .NET | 15.26GIPS | 14.15GIPS |
Dhrystone .NET vs SPEED | 4.13MIPS/MHz | 4.30MIPS/MHz |
Whetstone .NET | 29.77GFLOPS | 27.63GFLOPS |
Whetstone .NET vs SPEED | 8.06MFLOPS/MHz | 8.39MFLOPS/MHz |
.NET Multi-Media Benchmark .NET多媒体测试 | ||
总计多媒体.NET功效 | 14.85MPixel/s | 14MPixel/s |
总计多媒体.NET功效对比速度 | 4.02kPixels/MHz | 4.14kPixels/s/MHz |
多媒体整数 x1 .NET | 28.24MPixel/s | 26.54MPixel/s |
多媒体整数x1 .NET vs SPEED | 7.65kPixels/s/MHz | 7.82kPixels/s/MHz |
多媒体浮点数 x1 .NET | 7.8MPixel/s | 7.41MPixel/s |
多媒体浮点数 x1 .NET vs SPEED | 2.12kPixels/s/MHz | 2.19kPixels/s/MHz |
多媒体双精度 x1 .NET | 15.63MPixel/s | 14.74MPixel/s |
多媒体双精度 x1 .NET vs SPEED | 4.23kPixels/s/MHz | 4.35kPixels/s/MHz |
测试成绩中我们可以看到,由于存在0.2GHz的主频差距,两款处理器之间的测试成绩略微存在差距,经粗略计算,各项测试成绩基本与主频成正比。
Sisoftware Sandra 2011内存缓存性能
SiSoftware Sandra Pro Business 2011 | ||
产品名称 | HP DL120 G7 | HP DL120 G7 |
平台类型 | Intel SandyBridge | Intel SandyBridge |
处理器型号 | 至强E3-1240(关超线程) | 至强E3-1220 |
Memory Bandwidth Benchmark 内存带宽测试 | ||
---|---|---|
总体内存性能 | 17.3GB/s | 17.27GB/s |
总体内存性能对比速度 | 13.29MB/sMHz | 13.28MB/sMHz |
整数 B/F iSSE2 内存带宽 | 17.3GB/s | 17.27GB/s |
整数 B/F iSSE2 内存带宽对比速度 | 13.30MB/sMHz | 13.28MB/sMHz |
整数 B/F iSSE2 内存带宽 | 17.29GB/s | 17.27GB/s |
整数 B/F iSSE2 内存带宽对比速度 | 13.29MB/sMHz | 13.28MB/sMHz |
Memory Latency Benchmark 内存延迟测试 | ||
内存延迟(越小越好) | 75.3ns | 76.6ns |
内存延迟对比速度 (越小越好) | 0.06ns/MHz | 0.06ns/MHz |
速度因素 (越小越好) | 68.10 | 64 |
内部数据高速缓存 | 4clocks | 4clocks |
二级板载高速缓存 | 11clocks | 11clocks |
三级板载高速缓存 | 35clocks | 35clocks |
Cache and Memory Benchmark 缓存及内存测试 | ||
缓存/内存带宽 | 95.33GB/s | 91.86GB/s |
缓存/内存带宽对比速度 | 27.18MB/s/MHz | 27.73MB/s/MHz |
速度因素(越小越好) | 38.10 | 35.90 |
内部数据高速缓存 | 410.2GB/s | 386GB/s |
二级板载高速缓存 | 345.3GB/s | 323.66GB/s |
三级板载高速缓存 | 172.8GB/s | 165GB/s |
由于内存测试和主频关系不大,我们看到内存带宽及内存延迟几乎没有差距,只是在缓存测试中有一些区别。
SPEC CPU 2006处理器子系统性能测试
SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。
SPEC CPU 2006是SPEC组织推出的一套CPU子系统评估软件,它包括CINT2006和CFP2006两个子项目,前者用于测量和对比整数性能,而后者则用于测量和对比浮点性能。计算系统中的处理器、内存和编译器都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2006的影响比较小。
SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、DCC以及科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。
为了运行SPEC CPU 2006测试,我们统一安装了Windows Server 2008 Enterprise x64 Edition SP1操作系统,在主流的x64处理器下,原生64应用要比32位下快。我们还安装了Visual Studio 2005 SP1、Intel C++/Fortran Compiler 10.0.025编译器,对于支持SSE3指令集的处理器,我们使用了QxO编译指令进行了优化。编译时未使用SmartHeap商业优化库。
SPEC测试代表了绝大多CPU密集型的运算,包括编程语言、压缩、人工智能、基因序列搜索、视频压缩及各种力学的计算等,包含了多种科学计算,可以用来衡量系统执行这些任务的快慢。SPEC base测试包括浮点(fp)与整数运算(int)两部分。
整数运算主要包含编译、压缩、人工智能、视频压缩转换、XML处理等,此外,各种日常操作也主要是基于整数操作。SPEC CPU 2006的整数运算包含了400.perlbench PERL编程语言、401.bzip2 压缩、403.gcc C编译器、429.mcf 组合优化、445.gobmk 人工智能:围棋、456.hmmer 基因序列搜索、458.sjeng 人工智能:国际象棋、462.libquantum 物理:量子计算、464.h264ref 视频压缩、471.omnetpp 离散事件仿真、473.astar 寻路算法、483.xalancbmk XML处理共12项。
SPEC CPU 2006整数测试成绩
浮点运算包括的全部都是科学运算,科学运算需要用到大量的高精度浮点数据,如410.bwaves 流体力学、416.gamess 量子化学、433.milc 量子力学、434.zeusmp 物理:计算流体力学、435.gromacs 生物化学/分子力学、436.cactusADM 物理:广义相对论、437.leslie3d 流体力学、444.namd 生物/分子、447.dealII 有限元分析、450.soplex 线形编程、优化、453.povray 影像光线追踪、454.calculix 结构力学、459.GemsFDTD 计算电磁学、465.tonto 量子化学、470.lbm 流体力学、481.wrf 天气预报、482.sphinx3 语音识别共17项测试。
SPEC CPU 2006浮点运算测试成绩
SPEC测试成绩中我们看到,二者测试成绩几乎相同,可见在不同的测试项目中,对主频的敏感度也并不相同,并不是主频高,测试成绩就一定好。
CineBench 11.5性能测试
CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,我们的平台偏向于服务器多一些,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器。
CineBench 11.5测试成绩
从CineBench 11.5测试成绩中可以看出,二者测试成绩几乎相同。
总结
从Sisoftware Sandra 2011、SPEC CPU 2006以及CineBench 11.5的测试成绩中,我们可以看到,虽然E3-1240的主频略高,但是也并没有表现出明显的优势。我们相信主频越高,在某些方面会越好,但是在实际的采购中,更需要结合自身的实际情况加以考虑,而不是一味的追求高主频,高主频需要面对的是高价格和高功耗。