服务器 频道

单路的较量 英特尔E3&E5处理器性能对比

        【IT168 评测】3月初,英特尔在北京发布了新一代服务器处理器——至强E5-2600/1600系列。其中,至强E5-2600定位在双路应用,包括了十余款产品,面向主流市场。同时发布的至强E5-1600系列则面向单路应用,服务器和工作站均可。这让我们不由得想起之前英特尔在单路服务器中布局的至强E3系列,究竟至强E3与E5有哪些区别,它们的性能有多大差异呢?

Intel至强Sandy Bridge处理器首发评测

  按照英特尔的定位,至强E5-1600仅支持单路处理器配置,但并不是为了取代E3产品。E3-1200微处理器的目标是主流的单路服务器市场,而Xeon E5-1600 CPU主要定位于高性能的单路服务器市场。E5的这个单处理器家族将包括三个型号:E5-1620、E5-1650和E5-1660。

至强E5-1600系列处理器细节大揭秘

  至强E5-1620是一个四核芯片,主频为3.6GHz,10MB三级缓存。其它的两个——Xeon E5-1650和E5-1660具有6颗CPU核,但是主频比E5-1620要低。E5-1650的主频为3.2GHz,并具有12MB的三级缓存。Intel E5-1660有3.3GHz主频和15MB的三级缓存。

  就规格来说,E5-1600产品集成了所有Sandy Bridge特性,其中包括Hyper-Threading、Turbo Boost、可信赖执行、VT-c/d/x以及AES和AVX。关于新一代至强的特性及与E3处理器规格的比较,我们在之前的文章中已经介绍了许多,这里不再赘述了,有兴趣的读者请查看下面的链接:

英特尔至强E5服务器深度解析与首发评测

  同样是定位单路,E5与E3的性能差距究竟有多大?类似的架构下,E3与E5仅仅在于核心上的差异,那么这些差异真的明显吗?下面我们将通过测试具体验证一下。 

${PageNumber}

  本次我们选取了至强E3-1240和至强E5-1650处理器进行测试。这两款处理器在主频上较为接近,具备对比价值。

惠普ProLiant DL120 G7服务器内部拆解
至强E3-1240处理器
至强E3-1240处理器详细规格
至强E3-1240处理器信息

  我们先来看看至强E3-1240处理器,它的主频为3.3GHz,睿频之后可以达到3.7GHz。这款处理器具备4核心8线程,TDP为80W。

被测至强E3与E5处理器介绍
至强E5-1650处理器实物图
被测至强E3与E5处理器介绍
至强E5-1650处理器信息

  被测E5-1650处理器主频为3.2GHz,同样采用32nm工艺,核心数量为6个,线程数为12个,TDP为130W。

${PageNumber}

 

测试平台信息
产品名称至强E5-1650至强E3-1240
处理器子系统
处理器型号Intel Xeon E3-1220Intel Xeon E3-1240
处理器架构Intel 32nm Sandy BridgeIntel 32nm Sandy Bridge
代号Sandy BridgeSandy Bridge
处理器封装Socket 2011 LGASocket 1155 LGA
核心/线程数量6/124/8
主频3.2GHz3.3GHz
处理器指令集

MMX,SSE,SSE2,SSE3,
SSE4.1,SSE4.2,EM64T,VT-x,AES,AVX

MMX,SSE,SSE2,SSE3,
SSE4.1,SSE4.2,EM64T,VT-x,AES,AVX

外部总线

DMI

5.0GT/S

DMI

5.0GT/S

L1 Code Cache6× 32KB 8路集合关联4× 32KB 8路集合关联
L1 Data Cache6× 32KB 8路集合关联4× 32KB 4路集合关联
L2 Cache6× 256KB 8路集合关联4× 256KB 8路集合关联
L3 Cache12MB 16路集合关联8MB 16路集合关联
服务器主板
主板芯片组Intel C600Intel C206
北桥芯片特性2×QPI
VT-d Gen 2
2×QPI
VT-d Gen 2
子系统内存
控制器内存集成四通道U-ECC DDR3 1333CPU集成双通道U-ECC DDR3 1333CPU
内存类型8GB R-ECC DDR3 1333 SDRAM ×4条4GB R-ECC DDR3 1333 SDRAM ×4条
软件环境
操作系统Microsoft Windows Server 2008 Enterprise R2 x64Microsoft Windows Server 2008 Enterprise R2 x64

 

   本次测试中,为两颗处理器提供了近似的配置,区别在于E5平台的主频比E3平台略低0.1GHz,而内存容量增加了一倍。

${PageNumber}

SiSoftware Sandra Pro Business 2012
产品名称至强E5-1650至强E3-1240
平台类型单路Intel SandyBridge-EP单路Intel SandyBridge
Processor Arithmetic Benchmark
处理器算术运算测试
总计本地功效163.35GOPS103.19GOPS
总计本地功效对比速度43.09MOPS/MHz27.95MOPS/MHz
Dhrystone iSSE4.2208.78GIPS131.6GIPS
Dhrystone iSSE4.2 vs SPEED55.07MIPS/MHz35.65MIPS/MHz
Whetstone iSSE3127.8GFLOPS81GFLOPS
Dhrystone iSSE3 vs SPEED33.71MFLOPS/MHz21.9MFLOPS/MHz
Processor Multi-Media Benchmark
处理器多媒体测试
总计多媒体功效364.88MPixel/s170MPixel/s
总计多媒体功效对比速度96.25kPixels/s/MHz46.06kPixels/s/MHz
Multi-Media Int x16 iSSE4.1314MPixel/s195.12MPixel/s
Multi-Media Int x16 iSSE4.1 vs SPEED82.81kPixels/s/MHz52.85kPixel/s/MHz
Multi-Media Float x8 iSSE2424.08MPixel/s148.2MPixel/s
Multi-Media Float x8 iSSE2 vs SPEED111.87kPixels/s/MHz

40.14kPixels/s/MHz

Multi-Media Double x4 iSSE2242.8MPixel/s81MPixel/s
Multi-Media Double x4 iSSE2 vs SPEED64.05kPixels/s/MHz

21.93kPixels/s/MHz

Multi-Core Efficiency Benchmark
处理器效能测试
内联核带宽33.75GB/s21.24GB/s
内联核带宽对比速度9.12MB/s/MHz5.89MB/s/MHz
内联核延迟(越小越好)48.0ns43.3ns
内联核延迟对比速度(越小越好)0.13ns/MHz0.12ns/MHz
Java算数性能测试
总计 Java 功效112.66GOPS

75.7GOPS

总计 Java 功效对比速度29.72MOPSMHz20.50MOPSMHz
Dhrystone Java199.84GIPS119GIPS
Dhrystone Java对比速度52.71MIPS/MHz32.21MIPS/MHz
Whetstone Java63.51GFLOPS48.18GFLOPS
Whetstone Java对比速度16.75MFLOPSMHz13.05MFLOPS/MHz
Java多媒体性能测试
总计多媒体Java功效42MPixel/s29.5MPixel/s
总计多媒体Java功效对比速度11.09kPixels/s/MHz7.99kPixels/s/MHz
多媒体整数 x1 Java44.16MPixel/s28.82MPixel/s
多媒体整数 x1 Java对比速度11.65kPixels/s/MHz7.80kPixels/s/MHz
多媒体浮点数 x1 Java40MPixel/s30.2MPixel/s
多媒体浮点数 x1 Java对比速度10.56kPixels/s/MHz8.18kPixels/s/MHz
多媒体双精度 x1 Java39.53MPixel/s25.9MPixel/s
多媒体双精度 x1 Java对比速度10.43kPixels/s/MHz7.02kPixels/s/MHz
.NET Arithmetic Benchmark
.NET算术运算测试
总计 .NET 功效29.25GOPS29.1GOPS
总计 .NET 功效对比速度7.72MOPS/MHz7.88MOPS/MHz
Dhrystone .NET10.45GIPS17.48GIPS
Dhrystone .NET vs SPEED2.76MIPS/MHz4.73MIPS/MHz
Whetstone .NET81.86GFLOPS48.48GFLOPS
Whetstone .NET vs SPEED21.59MFLOPS/MHz13.13MFLOPS/MHz
.NET Multi-Media Benchmark
.NET多媒体测试
总计多媒体.NET功效44.56MPixel/s22MPixel/s
总计多媒体.NET功效对比速度11.75kPixels/MHz5.96kPixels/MHz
多媒体整数 x1 .NET49.48MPixel/s36.46MPixel/s
多媒体整数x1 .NET vs SPEED13.05kPixels/s/MHz9.87kPixels/s/MHz
多媒体浮点数 x1 .NET20.3MPixel/s13.28MPixel/s
多媒体浮点数 x1 .NET vs SPEED5.36kPixels/s/MHz3.60kPixels/s/MHz
多媒体双精度 x1 .NET40.14MPixel/s26.23MPixel/s
多媒体双精度 x1 .NET vs SPEED10.59kPixels/s/MHz7.10kPixels/s/MHz

  从上面的对比来看,除了个别项目中E5-1650的成绩相比E3-1240来说低了一些之外,大部分项目的成绩都有明显提升,幅度达到了70%以上,部分项目的成绩出现了翻几倍的情况。虽然E5-1650相比E3-1240来说在主频上略低,但是核心数量的优势在这里得到了充分体现,也是提升性能的关键。

${PageNumber}

SiSoftware Sandra Pro Business 2012
产品名称至强E5-1650至强E3-1240
平台类型单路Intel SandyBridge单路Intel SandyBridge
Memory Bandwidth Benchmark
内存带宽测试
总体内存性能36.42GB/s17.27GB/s
总体内存性能对比速度23.31MB/sMHz13.28MB/sMHz
整数 B/F iSSE2 内存带宽36.33GB/s17.27
整数 B/F iSSE2 内存带宽对比速度23.25MB/sMHz13.28MB/sMHz
整数 B/F iSSE2 内存带宽36.51GB/s17.27GB/s
整数 B/F iSSE2 内存带宽对比速度23.37MB/sMHz13.28MB/sMHz
Memory Latency Benchmark
内存延迟测试
内存延迟(越小越好)26.7ns75.4ns
内存延迟对比速度 (越小越好)0.02ns/MHz0.06ns/MHz
速度因素 (越小越好)64.10ns68.30ns
内部数据高速缓存3.4clocks4clocks
二级板载高速缓存

10.1clocks

11clocks
三级板载高速缓存18.8clocks35clocks
Cache and Memory Benchmark
缓存及内存测试
缓存/内存带宽181.32GB/s95.69GB/s
缓存/内存带宽对比速度48.98MB/s/MHz26.54MB/s/MHz
速度因素(越小越好)33.1037.10
内部数据高速缓存716.5GB/s414.17GB/s
二级板载高速缓存451GB/s280GB/s
三级板载高速缓存243GB/s129.5GB/s

  内存测试中我们看到E5-1650 与E3-1240存在非常大的差异,成绩差距在一倍以上。这是因为E3平台只能支持双通道,而E5平台支持四通道,更大的内存带宽对于性能的帮助也是巨大的。因此从这个角度来说,同样是单路应用的话,E5更适合大内存高带宽的应用。

${PageNumber}

  SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。

  SPEC 2006是SPEC组织推出的一套子系统评估软件,它包括CINT2006和CFP2006两个子项目,前者用于测量和对比整数性能,而后者则用于测量和对比浮点性能。计算系统中的处理器、和编译器都会影响最终的测试性能,而I/O(磁盘)、网络、和图形子系统对于SPEC CPU2006的影响比较小。

  SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、DCC以及科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库、电子邮件和Web服务器等基于整数应用的多处理器系统的性能。

  为了运行SPEC CPU 2006测试,我们统一安装了Windows Server 2008 Enterprise x64 Edition SP1,在主流的x64处理器下,原生64应用要比32位下快。我们还安装了Visual Studio 2005 SP1、 C++/Fortran Compiler 10.0.025编译器,对于支持SSE3指令集的处理器,我们使用了QxO编译指令进行了优化。编译时未使用SmartHeap商业优化库。

  SPEC测试代表了绝大多CPU密集型的运算,包括编程语言、压缩、人工智能、基因序列搜索、视频压缩及各种力学的计算等,包含了多种科学计算,可以用来衡量系统执行这些任务的快慢。SPEC base测试包括浮点(fp)与整数运算(int)两部分。

  整数运算主要包含编译、压缩、人工智能、视频压缩转换、XML处理等,此外,各种日常操作也主要是基于整数操作。SPEC CPU 2006的整数运算包含了400.perlbench PERL编程语言、401.bzip2 压缩、403.gcc C编译器、429.mcf 组合优化、445.gobmk 人工智能:围棋、456.hmmer 基因序列搜索、458.sjeng 人工智能:国际象棋、462.libquantum 物理:计算、464.h264ref 视频压缩、471.omnetpp 离散事件仿真、473.astar 寻路算法、483.xalancbmk XML处理共12项。

SPEC CPU 2006处理器子系统性能测试
SPEC CPU 2006整数测试成绩

  浮点运算包括的全部都是科学运算,科学运算需要用到大量的高精度浮点数据,如410.bwaves 流体力学、416.gamess 化学、433.milc 量子力学、434.zeusmp 物理:计算流体力学、435.gromacs 生物化学/分子力学、436.cactusADM 物理:广义相对论、437.leslie3d 流体力学、444.namd 生物/分子、447.dealII 有限元分析、450.soplex 线形编程、优化、453.povray 影像光线追踪、454.calculix 结构力学、459.GemsFDTD 计算电磁学、465.tonto 量子化学、470.lbm 流体力学、481.wrf 天气预报、482.sphinx3 语音识别共17项测试。

SPEC CPU 2006处理器子系统性能测试
SPEC CPU 2006浮点运算测试成绩

  从测试成绩来看,整数测试中E3-1240还有略微占据优势的项目,毕竟主频稍微高一点;但是在浮点中就已经是E5-1650全面领先了。从领先的幅度来看,基本是60%以上,比与线程提升的比率基本一致。

${PageNumber}


Intel Xeon E3-1240图片 评测 论坛 报价 网购实价
优点:不足:
至强E5性能出色,整数和浮点运算均较E3产品有较大提升-

评价观点:在英特尔以往的战略中,3系列处理器仅仅是为单路平台而设计的。但是从E7系列开始,我们越来越多的看到英特尔正在不断调整策略,淡化处理器各个系列之间的界限,E7系列就有面向双路应用大内存产品。

此次E5-1600的出现也切合了这种想法。这款定位单路应用的处理器在性能上秉承了SandyBridge-EP的优势,特别是在核心、线程上比E3有了明显的提升。加上四通道内存的帮助,E5-1600在整体的表现上要大大强于E3处理器,性能提升接近一倍。换句话说,E5-1600系列提供了更好的单路解决方案。对于那些需要高性能应用、需要大容量内存却又迫于价格压力的用户,单路E5-1600是取代E3的一个不错选择。用户若没有太多要求的话,E3系列的性能也可以接受。

刘策
高级评测工程师

1
相关文章