服务器 频道

0.2GHz主频差距可有可无?E3处理器实测

      【IT168 评测】服务器作为一种定制化的工具,各类别之间相差甚大,即使是同一系列的服务器,由于配置(包括处理器、内存、硬盘、Raid卡等等)差异,在性能上也会体现出很大的区别。处理器作为重要的组成部分之一,采购过程中,人们都习惯性的选择主频更高的,而对其中有多大的区别或许并不了解,IT168将通过对同一台服务器不同的处理器进行测试,为广大用户提供选购参考,今天我们采用的测试服务器为HP DL120 G7,测试的处理器为E3-1220和E3-1240。

  惠普ProLiant DL120 G7是一款采用1U高度的机架式服务器,搭载了至强E3处理器平台。

惠普ProLiant DL120 G7服务器外观图

惠普ProLiant DL120 G7服务器外观图

  惠普ProLiant DL120 G7服务器前后视图

惠普ProLiant DL120 G7服务器外观图

  前置USB接口和状态指示灯

  惠普ProLiant DL120 G7的前面板设计比较简单,提供了4个3.5英寸的硬盘位,可以支持SATA或SAS硬盘,后面板设计也比较简单。

惠普ProLiant DL120 G7服务器外观图

  惠普ProLiant DL120 G7开箱图

  惠普ProLiant DL120 G7的内部空间非常宽敞。它内部有4个风扇用来散热,其中3个负责给处理器、内存等关键部件散热,1个用作阵列卡的散热。为了有效提升散热效果,惠普ProLiant DL120 G7服务器在处理器和内存部分还有一个导风罩,可以更好的促进空气流动。

惠普ProLiant DL120 G7服务器外观图

  惠普ProLiant DL120 G7配备的电源

  惠普ProLiant DL120 G7标配了台达400W电源,对于E3这样低功耗的平台来说,400W已经足够。

  惠普ProLiant DL120 G7服务器内部拆解

DELL T110 II服务器内部拆解

  至强E3-1220处理器

惠普ProLiant DL120 G7服务器内部拆解

  至强E3-1240处理器

  这次我们对比的是Intel至强E3平台下的两款处理器,分别为E3-1220和E3-1240,其中E3-1240处理器,主频为3.3GHz,具备4核心8线程,TDP为80W;而E3-1220处理器主频为3.1GHz,4核心4线程,TDP同样为80W,为了单纯的比较主频对于服务器性能的影响,特意将E3-1240的超线程功能关掉,因而两颗处理器测试中均为4核心4线程,特此说明。

惠普ProLiant DL120 G7服务器内部拆解

惠普ProLiant DL120 G7服务器内部拆解

  惠普ProLiant DL120 G7服务器内存

  应对我们测试的要求,惠普ProLiant DL120 G7服务器一共配置了4条4GB DDR3 ECC内存,总容量16GB对于日常的E3处理器应用来说已经完全够用。

惠普ProLiant DL120 G7服务器内部拆解

惠普ProLiant DL120 G7服务器内部拆解

  西部数据WD5003ABYX

  惠普ProLiant DL120 G7服务器采用了西部数据WD5003ABYX硬盘,容量为500GB。测试中我们使用这些硬盘组建了RAID 5阵列。

惠普ProLiant DL120 G7服务器内部拆解

  惠普ProLiant DL120 G7服务器配备的阵列卡

  惠普ProLiant DL120 G7服务器提供了一个P212阵列卡,并提供了对应的内存和电池。这块阵列卡可以实现RAID 5、RAID 6等常用阵列和RAID 0、RAID 1等基本阵列。

惠普ProLiant DL120 G7服务器内部拆解

  服务器扩展槽位置

  惠普ProLiant DL120 G7服务器提供了4个扩展槽,分别是PCI-E X16、PCI-E X8和PCI-E X4。

惠普ProLiant DL120 G7服务器内部拆解

  板载的显示芯片

惠普ProLiant DL120 G7服务器内部拆解

  板载的英特尔千兆网络芯片

惠普ProLiant DL120 G7服务器内部拆解

  惠普特色的iLO3远程管理芯片

  服务器测试环境介绍

  为了进行网络产品的测试,IT168评测中心专门组建了网络实验室,并搭建了一个有60台客户端的网络测试环境,通过控制端并利用专业的网络测试软件,可以构建出多样化的网络访问模型,能够产生真实的多用户网络应用环境。可以对服务器类设备进行不同应用下的高压力性能测试,以直观的结果反映出服务器产品在用于不同应用时其真实的性能状况。

  我们采用千兆交换机作为测试环境的交换设备,60台单路服务器作为客户端,能产生足够大的网络访问压力,因而可以测试服务器类设备在实现不同应用时的极限性能。

服务器测试环境介绍

  ▲网络实验室控制台

服务器测试环境介绍

  ▲千兆交换机,120个千兆网口

服务器测试环境介绍

  ▲用于产生用户访问压力的塔式服务器

  服务器测试工具介绍

  对于服务器性能方面的考察,我们主要分为子系统测试和应用性能测试。在子系统测试中我们按处理器、内存以及磁盘等各个子系统进行了分项测试,当然各子系统的测试成绩也是相辅相成,也需要其它子系统的支持,并非是完全独立的,只是对考察的子系统有所偏重而已。

  处理器子系统测试

  对服务器处理器子系统的考察,我们主要采用的是业界公认的SPEC CPU 2006测试,该项测试通过对数十个典型应用程序的运行,来测试系统处理器子系统在应用中的整、浮点运算效率。SPEC CPU 2006测试具有很好的开放性,因此在业界为广大用户所接受,可以利用这一公开的测试结果进行系统间运算性能的比较。

  此外SiSoftware Sandra也有测试子项可用于处理器运算性能测试,其结果通常以每秒完成的指令数来表现。也可以用作不同处理器间运算效率的比较。

  SPEC CPU 2006 v1.1

  SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。

  SPEC CPU 2006是SPEC组织推出的CPU子系统评估软件最新版,我们之前使用的是SPEC CPU 2000。和上一个版本一样,SPEC CPU 2006包括了CINT2006和CFP2006两个子项目,前者用于测量和对比整数性能,后者则用于测量和对比浮点性能,SPEC CPU 2006中对SPEC CPU 2000中的一些测试进行了升级,并抛弃/加入了一些测试,因此两个版本测试得分并没有可比较性。

  SPEC CPU测试中,测试系统的处理器、内存子系统和使用到的编译器(SPEC CPU提供的是源代码,并且允许测试用户进行一定的编译优化)都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2006的影响非常的小。

  SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。

  我们在被测服务器中安装了Intel C++ 11.1.034 Compiler、Intel Fortran 11.1.034 Compiler这两款SPEC CPU 2006必需的编译器,通过最新出现的QxS编译参数,Intel Compiler 10版本开始支持对Intel SSE4指令集进行优化(假如只支持SSE3,则使用QxT编译参数)。我们另外安装了Microsoft Visual Studio 2003 SP1提供必要的库文件。按照SPEC的要求我们根据自己的情况编辑了新的Config文件,使用了较多的编译选项。我们根据被测系统选择实际可同时处理的线程数量,最后得到SPEC rate base测试结果(基于base标准编译,SPEC base rate测试代表系统同时处理多个任务的能力)。

  和其它测试部件不同,SPEC CPU 2006需要大量的系统物理内存,我们的SPEC测试在64位的Windows Server 2008 R2 下完成,对于每个运算核心,最低配置1.5GB内存。

  内存子系统测试

  对于内存子系统的考察,也是利用SiSoftware Sandra来实现,在该软件中有相应组件可进行内存带宽、内存延迟等方面的测试。

  SiSoftware Sandra v2011

  SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。从2007开始,Sandra的Arithmetic benchmarks增加了对SSE3&SSE4 SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,另外还升级了File System benchmark和Removable Storage benchmark两个子项目。对于新的硬件的支持当然也是该软件每次升级的重要内容之一,SiSoftware Sandra 2011对NUMA架构以及最新的Windows 7/Windows Server 2008 R2提供了更好的支持,此外测试项目和测试结果也有了略微的变化。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台。

  惠普ProLiant DL120 G7服务器配置一览

产品名称惠普DL120 G7服务器惠普DL120 G7服务器
平台类型单路 Sandy Bridge-E3单路 Sandy Bridge-E3
处理器子系统
处理器型号Intel Xeon E3-1220Intel Xeon E3-1240
处理器架构Intel 32nm Sandy BridgeIntel 32nm Sandy Bridge
代号Sandy BridgeSandy Bridge
处理器封装Socket 1155 LGASocket 1155 LGA
核心/线程数量4/44/4
主频3.1GHz3.3GHz
处理器指令集

MMX,SSE,SSE2,SSE3,
SSE4.1,SSE4.2,EM64T,VT-x,AES,AVX

MMX,SSE,SSE2,SSE3,
SSE4.1,SSE4.2,EM64T,VT-x,AES,AVX

外部总线

DMI

5.0GT/S

DMI

5.0GT/S

L1 Code Cache4× 32KB 8路集合关联4× 32KB 8路集合关联
L1 Data Cache4× 32KB 4路集合关联4× 32KB 4路集合关联
L2 Cache4× 256KB 8路集合关联4× 256KB 8路集合关联
L3 Cache8MB 16路集合关联8MB 16路集合关联
服务器主板
型号主板惠普ProLiant DL120 G7惠普ProLiant DL120 G7
主板芯片组惠普ProLiant DL120 G7惠普ProLiant DL120 G7
北桥芯片特性2×QPI
VT-d Gen 2
2×QPI
VT-d Gen 2
子系统内存
控制器内存集成双通道U-ECC DDR3 1333CPU集成双通道U-ECC DDR3 1333CPU
内存类型4GB R-ECC DDR3 1333 SDRAM ×4条4GB R-ECC DDR3 1333 SDRAM ×4条
存储子系统
磁盘控制器
LSI Embedded MegaRAID SAS RAID Controller
LSI Embedded MegaRAID SAS RAID Controller
磁盘控制器规格4x SATA 3Gb/s
MatrixRAID 0/1/3/5
4x SATA 3Gb/s
MatrixRAID 0/1/3/5
控制器驱动LSI MegaSR
13.06.0212.2009
LSI MegaSR
13.06.0212.2009
型号数量硬盘LSI MegaSR
13.06.0212.2009
LSI MegaSR
13.06.0212.2009
规格硬盘7200RPM
500GB
SATA 3Gbps
16MB Cache
7200RPM
500GB
SATA 3Gbps
16MB Cache
软件环境
操作系统Microsoft Windows Server 2008 Enterprise R2 x64Microsoft Windows Server 2008 Enterprise R2 x64

   由于我们采用的是同一台服务器进行测试,并且关掉了E3-1240的超线程功能,因此,除了主频上的差异,其它并无区别。

  处理器详细规格

  至强E3-1240处理器是至强E3家族的中端产品,而E3-1220是E3系列的低端产品,下面我们通过CPU-Z软件来查看它的详细信息。

至强E3-1240处理器详细规格
▲至强E3-1240处理器信息 至强E3-1240处理器详细规格

  至强E3-1220处理器信息

至强E3-1240处理器详细规格

  16GB内存容量

  Sisoftware Sandra 2011处理器性能

SiSoftware Sandra Pro Business 2011
产品名称HP DL120 G7HP DL120 G7
平台类型单路Intel SandyBridge单路Intel SandyBridge
处理器型号至强E3-1240(关超线程)至强E3-1220
Processor Arithmetic Benchmark
处理器算术运算测试
总计本地功效71GOPS66.64GOPS
总计本地功效对比速度19.22MOPS/MHz19.64MOPS/MHz
Dhrystone iSSE4.2103.54GIPS97.44GIPS
Dhrystone iSSE4.2 vs SPEED28.04MIPS/MHz28.73MIPS/MHz
Whetstone iSSE348.63GFLOPS45.57GFLOPS
Dhrystone iSSE3 vs SPEED13.17MFLOPS/MHz13.43MFLOPS/MHz
Processor Multi-Media Benchmark
处理器多媒体测试
总计多媒体功效130.75MPixel/s123MPixel/s
总计多媒体功效对比速度35.41kPixels/s/MHz36.28kPixels/s/MHz
Multi-Media Int x16 iSSE4.1158.52MPixel/s149.2MPixel/s
Multi-Media Int x16 iSSE4.1 vs SPEED42.94kPixels/s/MHz43.99kPixel/s/MHz
Multi-Media Float x8 iSSE2107.84MPixel/s101.51MPixel/s
Multi-Media Float x8 iSSE2 vs SPEED29.21kPixels/s/MHz

29.93kPixels/s/MHz

Multi-Media Double x4 iSSE258.56MPixel/s54.86MPixel/s
Multi-Media Double x4 iSSE2 vs SPEED15.86kPixels/s/MHz

16.17kPixels/s/MHz

Multi-Core Efficiency Benchmark
处理器效能测试
内联核带宽8.63GB/s8GB/s
内联核带宽对比速度2.39MB/s/MHz2.44MB/s/MHz
内联核延迟(越小越好)39.2ns42.0ns
内联核延迟对比速度(越小越好)0.11ns/MHz0.12ns/MHz
Java算数性能测试
总计 Java 功效58.58GOPS

57GOPS

总计 Java 功效对比速度16.31MOPSMHz16.81MOPSMHz
Dhrystone Java108.55GIPS109.83GIPS
Dhrystone Java对比速度30.22MIPS/MHz32.38MIPS/MHz
Whetstone Java31.6GFLOPS29.6GFLOPS
Whetstone Java对比速度8.80MFLOPSMHz8.73MFLOPS/MHz
Java多媒体性能测试
总计多媒体Java功效18MPixel/s17MPixel/s
总计多媒体Java功效对比速度4.88kPixels/s/MHz4.99kPixels/s/MHz
多媒体整数 x1 Java20.68MPixel/s19.4MPixel/s
多媒体整数 x1 Java对比速度5.60kPixels/s/MHz5.72kPixels/s/MHz
多媒体浮点数 x1 Java15.7MPixel/s14.79MPixel/s
多媒体浮点数 x1 Java对比速度4.25kPixels/s/MHz4.36kPixels/s/MHz
多媒体双精度 x1 Java16MPixel/s14.76MPixel/s
多媒体双精度 x1 Java对比速度4.32kPixels/s/MHz4.35kPixels/s/MHz
.NET Arithmetic Benchmark
.NET算术运算测试
总计 .NET 功效21.32GOPS19.77GOPS
总计 .NET 功效对比速度5.77MOPS/MHz6.00MOPS/MHz
Dhrystone .NET15.26GIPS14.15GIPS
Dhrystone .NET vs SPEED4.13MIPS/MHz4.30MIPS/MHz
Whetstone .NET29.77GFLOPS27.63GFLOPS
Whetstone .NET vs SPEED8.06MFLOPS/MHz8.39MFLOPS/MHz
.NET Multi-Media Benchmark
.NET多媒体测试
总计多媒体.NET功效14.85MPixel/s14MPixel/s
总计多媒体.NET功效对比速度4.02kPixels/MHz4.14kPixels/s/MHz
多媒体整数 x1 .NET28.24MPixel/s26.54MPixel/s
多媒体整数x1 .NET vs SPEED7.65kPixels/s/MHz7.82kPixels/s/MHz
多媒体浮点数 x1 .NET7.8MPixel/s7.41MPixel/s
多媒体浮点数 x1 .NET vs SPEED2.12kPixels/s/MHz2.19kPixels/s/MHz
多媒体双精度 x1 .NET15.63MPixel/s14.74MPixel/s
多媒体双精度 x1 .NET vs SPEED4.23kPixels/s/MHz4.35kPixels/s/MHz

  测试成绩中我们可以看到,由于存在0.2GHz的主频差距,两款处理器之间的测试成绩略微存在差距,经粗略计算,各项测试成绩基本与主频成正比。

  Sisoftware Sandra 2011内存缓存性能

SiSoftware Sandra Pro Business 2011
产品名称

HP DL120 G7

HP DL120 G7
平台类型Intel SandyBridgeIntel SandyBridge
处理器型号至强E3-1240(关超线程)至强E3-1220
Memory Bandwidth Benchmark
内存带宽测试
总体内存性能17.3GB/s17.27GB/s
总体内存性能对比速度13.29MB/sMHz13.28MB/sMHz
整数 B/F iSSE2 内存带宽17.3GB/s17.27GB/s
整数 B/F iSSE2 内存带宽对比速度13.30MB/sMHz13.28MB/sMHz
整数 B/F iSSE2 内存带宽17.29GB/s17.27GB/s
整数 B/F iSSE2 内存带宽对比速度13.29MB/sMHz13.28MB/sMHz
Memory Latency Benchmark
内存延迟测试
内存延迟(越小越好)75.3ns76.6ns
内存延迟对比速度 (越小越好)0.06ns/MHz0.06ns/MHz
速度因素 (越小越好)68.1064
内部数据高速缓存4clocks4clocks
二级板载高速缓存

11clocks

11clocks
三级板载高速缓存35clocks35clocks
Cache and Memory Benchmark
缓存及内存测试
缓存/内存带宽95.33GB/s91.86GB/s
缓存/内存带宽对比速度27.18MB/s/MHz27.73MB/s/MHz
速度因素(越小越好)38.1035.90
内部数据高速缓存410.2GB/s386GB/s
二级板载高速缓存345.3GB/s323.66GB/s
三级板载高速缓存172.8GB/s165GB/s

  由于内存测试和主频关系不大,我们看到内存带宽及内存延迟几乎没有差距,只是在缓存测试中有一些区别。

  SPEC CPU 2006处理器子系统性能测试

  SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。

  SPEC CPU 2006是SPEC组织推出的一套CPU子系统评估软件,它包括CINT2006和CFP2006两个子项目,前者用于测量和对比整数性能,而后者则用于测量和对比浮点性能。计算系统中的处理器、内存和编译器都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2006的影响比较小。

  SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、DCC以及科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。

  为了运行SPEC CPU 2006测试,我们统一安装了Windows Server 2008 Enterprise x64 Edition SP1操作系统,在主流的x64处理器下,原生64应用要比32位下快。我们还安装了Visual Studio 2005 SP1、Intel C++/Fortran Compiler 10.0.025编译器,对于支持SSE3指令集的处理器,我们使用了QxO编译指令进行了优化。编译时未使用SmartHeap商业优化库。

  SPEC测试代表了绝大多CPU密集型的运算,包括编程语言、压缩、人工智能、基因序列搜索、视频压缩及各种力学的计算等,包含了多种科学计算,可以用来衡量系统执行这些任务的快慢。SPEC base测试包括浮点(fp)与整数运算(int)两部分。

  整数运算主要包含编译、压缩、人工智能、视频压缩转换、XML处理等,此外,各种日常操作也主要是基于整数操作。SPEC CPU 2006的整数运算包含了400.perlbench PERL编程语言、401.bzip2 压缩、403.gcc C编译器、429.mcf 组合优化、445.gobmk 人工智能:围棋、456.hmmer 基因序列搜索、458.sjeng 人工智能:国际象棋、462.libquantum 物理:量子计算、464.h264ref 视频压缩、471.omnetpp 离散事件仿真、473.astar 寻路算法、483.xalancbmk XML处理共12项。

SPEC CPU 2006处理器子系统性能测试

  SPEC CPU 2006整数测试成绩

  浮点运算包括的全部都是科学运算,科学运算需要用到大量的高精度浮点数据,如410.bwaves 流体力学、416.gamess 量子化学、433.milc 量子力学、434.zeusmp 物理:计算流体力学、435.gromacs 生物化学/分子力学、436.cactusADM 物理:广义相对论、437.leslie3d 流体力学、444.namd 生物/分子、447.dealII 有限元分析、450.soplex 线形编程、优化、453.povray 影像光线追踪、454.calculix 结构力学、459.GemsFDTD 计算电磁学、465.tonto 量子化学、470.lbm 流体力学、481.wrf 天气预报、482.sphinx3 语音识别共17项测试。

SPEC CPU 2006处理器子系统性能测试

  SPEC CPU 2006浮点运算测试成绩

  SPEC测试成绩中我们看到,二者测试成绩几乎相同,可见在不同的测试项目中,对主频的敏感度也并不相同,并不是主频高,测试成绩就一定好。

  CineBench 11.5性能测试

  CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,我们的平台偏向于服务器多一些,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器。

CineBench 11.5性能测试

  CineBench 11.5测试成绩

  从CineBench 11.5测试成绩中可以看出,二者测试成绩几乎相同。

  总结

  从Sisoftware Sandra 2011、SPEC CPU 2006以及CineBench 11.5的测试成绩中,我们可以看到,虽然E3-1240的主频略高,但是也并没有表现出明显的优势。我们相信主频越高,在某些方面会越好,但是在实际的采购中,更需要结合自身的实际情况加以考虑,而不是一味的追求高主频,高主频需要面对的是高价格和高功耗。

0
相关文章