【IT168 评测】3月初,英特尔在北京发布了新一代服务器处理器——至强E5-2600/1600系列。其中,至强E5-2600定位在双路应用,包括了十余款产品,面向主流市场。同时发布的至强E5-1600系列则面向单路应用,服务器和工作站均可。这让我们不由得想起之前英特尔在单路服务器中布局的至强E3系列,究竟至强E3与E5有哪些区别,它们的性能有多大差异呢?
按照英特尔的定位,至强E5-1600仅支持单路处理器配置,但并不是为了取代E3产品。E3-1200微处理器的目标是主流的单路服务器市场,而Xeon E5-1600 CPU主要定位于高性能的单路服务器市场。E5的这个单处理器家族将包括三个型号:E5-1620、E5-1650和E5-1660。
至强E5-1620是一个四核芯片,主频为3.6GHz,10MB三级缓存。其它的两个——Xeon E5-1650和E5-1660具有6颗CPU核,但是主频比E5-1620要低。E5-1650的主频为3.2GHz,并具有12MB的三级缓存。Intel E5-1660有3.3GHz主频和15MB的三级缓存。
就规格来说,E5-1600产品集成了所有Sandy Bridge特性,其中包括Hyper-Threading、Turbo Boost、可信赖执行、VT-c/d/x以及AES和AVX。关于新一代至强的特性及与E3处理器规格的比较,我们在之前的文章中已经介绍了许多,这里不再赘述了,有兴趣的读者请查看下面的链接:
同样是定位单路,E5与E3的性能差距究竟有多大?类似的架构下,E3与E5仅仅在于核心上的差异,那么这些差异真的明显吗?下面我们将通过测试具体验证一下。
${PageNumber}本次我们选取了至强E3-1240和至强E5-1650处理器进行测试。这两款处理器在主频上较为接近,具备对比价值。
至强E3-1240处理器
至强E3-1240处理器信息
我们先来看看至强E3-1240处理器,它的主频为3.3GHz,睿频之后可以达到3.7GHz。这款处理器具备4核心8线程,TDP为80W。
至强E5-1650处理器实物图
至强E5-1650处理器信息
被测E5-1650处理器主频为3.2GHz,同样采用32nm工艺,核心数量为6个,线程数为12个,TDP为130W。
${PageNumber}
测试平台信息 | ||
产品名称 | 至强E5-1650 | 至强E3-1240 |
处理器子系统 | ||
---|---|---|
处理器型号 | Intel Xeon E3-1220 | Intel Xeon E3-1240 |
处理器架构 | Intel 32nm Sandy Bridge | Intel 32nm Sandy Bridge |
代号 | Sandy Bridge | Sandy Bridge |
处理器封装 | Socket 2011 LGA | Socket 1155 LGA |
核心/线程数量 | 6/12 | 4/8 |
主频 | 3.2GHz | 3.3GHz |
处理器指令集 | MMX,SSE,SSE2,SSE3, | MMX,SSE,SSE2,SSE3, |
外部总线 | DMI 5.0GT/S | DMI 5.0GT/S |
L1 Code Cache | 6× 32KB 8路集合关联 | 4× 32KB 8路集合关联 |
L1 Data Cache | 6× 32KB 8路集合关联 | 4× 32KB 4路集合关联 |
L2 Cache | 6× 256KB 8路集合关联 | 4× 256KB 8路集合关联 |
L3 Cache | 12MB 16路集合关联 | 8MB 16路集合关联 |
服务器主板 | ||
主板芯片组 | Intel C600 | Intel C206 |
北桥芯片特性 | 2×QPI VT-d Gen 2 | 2×QPI VT-d Gen 2 |
子系统内存 | ||
控制器内存 | 每集成四通道U-ECC DDR3 1333CPU | 每集成双通道U-ECC DDR3 1333CPU |
内存类型 | 8GB R-ECC DDR3 1333 SDRAM ×4条 | 4GB R-ECC DDR3 1333 SDRAM ×4条 |
软件环境 | ||
操作系统 | Microsoft Windows Server 2008 Enterprise R2 x64 | Microsoft Windows Server 2008 Enterprise R2 x64 |
本次测试中,为两颗处理器提供了近似的配置,区别在于E5平台的主频比E3平台略低0.1GHz,而内存容量增加了一倍。
${PageNumber}SiSoftware Sandra Pro Business 2012 | ||
产品名称 | 至强E5-1650 | 至强E3-1240 |
平台类型 | 单路Intel SandyBridge-EP | 单路Intel SandyBridge |
Processor Arithmetic Benchmark 处理器算术运算测试 | ||
---|---|---|
总计本地功效 | 163.35GOPS | 103.19GOPS |
总计本地功效对比速度 | 43.09MOPS/MHz | 27.95MOPS/MHz |
Dhrystone iSSE4.2 | 208.78GIPS | 131.6GIPS |
Dhrystone iSSE4.2 vs SPEED | 55.07MIPS/MHz | 35.65MIPS/MHz |
Whetstone iSSE3 | 127.8GFLOPS | 81GFLOPS |
Dhrystone iSSE3 vs SPEED | 33.71MFLOPS/MHz | 21.9MFLOPS/MHz |
Processor Multi-Media Benchmark 处理器多媒体测试 | ||
总计多媒体功效 | 364.88MPixel/s | 170MPixel/s |
总计多媒体功效对比速度 | 96.25kPixels/s/MHz | 46.06kPixels/s/MHz |
Multi-Media Int x16 iSSE4.1 | 314MPixel/s | 195.12MPixel/s |
Multi-Media Int x16 iSSE4.1 vs SPEED | 82.81kPixels/s/MHz | 52.85kPixel/s/MHz |
Multi-Media Float x8 iSSE2 | 424.08MPixel/s | 148.2MPixel/s |
Multi-Media Float x8 iSSE2 vs SPEED | 111.87kPixels/s/MHz | 40.14kPixels/s/MHz |
Multi-Media Double x4 iSSE2 | 242.8MPixel/s | 81MPixel/s |
Multi-Media Double x4 iSSE2 vs SPEED | 64.05kPixels/s/MHz | 21.93kPixels/s/MHz |
Multi-Core Efficiency Benchmark 处理器效能测试 | ||
内联核带宽 | 33.75GB/s | 21.24GB/s |
内联核带宽对比速度 | 9.12MB/s/MHz | 5.89MB/s/MHz |
内联核延迟(越小越好) | 48.0ns | 43.3ns |
内联核延迟对比速度(越小越好) | 0.13ns/MHz | 0.12ns/MHz |
Java算数性能测试 | ||
总计 Java 功效 | 112.66GOPS | 75.7GOPS |
总计 Java 功效对比速度 | 29.72MOPSMHz | 20.50MOPSMHz |
Dhrystone Java | 199.84GIPS | 119GIPS |
Dhrystone Java对比速度 | 52.71MIPS/MHz | 32.21MIPS/MHz |
Whetstone Java | 63.51GFLOPS | 48.18GFLOPS |
Whetstone Java对比速度 | 16.75MFLOPSMHz | 13.05MFLOPS/MHz |
Java多媒体性能测试 | ||
总计多媒体Java功效 | 42MPixel/s | 29.5MPixel/s |
总计多媒体Java功效对比速度 | 11.09kPixels/s/MHz | 7.99kPixels/s/MHz |
多媒体整数 x1 Java | 44.16MPixel/s | 28.82MPixel/s |
多媒体整数 x1 Java对比速度 | 11.65kPixels/s/MHz | 7.80kPixels/s/MHz |
多媒体浮点数 x1 Java | 40MPixel/s | 30.2MPixel/s |
多媒体浮点数 x1 Java对比速度 | 10.56kPixels/s/MHz | 8.18kPixels/s/MHz |
多媒体双精度 x1 Java | 39.53MPixel/s | 25.9MPixel/s |
多媒体双精度 x1 Java对比速度 | 10.43kPixels/s/MHz | 7.02kPixels/s/MHz |
.NET Arithmetic Benchmark .NET算术运算测试 | ||
总计 .NET 功效 | 29.25GOPS | 29.1GOPS |
总计 .NET 功效对比速度 | 7.72MOPS/MHz | 7.88MOPS/MHz |
Dhrystone .NET | 10.45GIPS | 17.48GIPS |
Dhrystone .NET vs SPEED | 2.76MIPS/MHz | 4.73MIPS/MHz |
Whetstone .NET | 81.86GFLOPS | 48.48GFLOPS |
Whetstone .NET vs SPEED | 21.59MFLOPS/MHz | 13.13MFLOPS/MHz |
.NET Multi-Media Benchmark .NET多媒体测试 | ||
总计多媒体.NET功效 | 44.56MPixel/s | 22MPixel/s |
总计多媒体.NET功效对比速度 | 11.75kPixels/MHz | 5.96kPixels/MHz |
多媒体整数 x1 .NET | 49.48MPixel/s | 36.46MPixel/s |
多媒体整数x1 .NET vs SPEED | 13.05kPixels/s/MHz | 9.87kPixels/s/MHz |
多媒体浮点数 x1 .NET | 20.3MPixel/s | 13.28MPixel/s |
多媒体浮点数 x1 .NET vs SPEED | 5.36kPixels/s/MHz | 3.60kPixels/s/MHz |
多媒体双精度 x1 .NET | 40.14MPixel/s | 26.23MPixel/s |
多媒体双精度 x1 .NET vs SPEED | 10.59kPixels/s/MHz | 7.10kPixels/s/MHz |
从上面的对比来看,除了个别项目中E5-1650的成绩相比E3-1240来说低了一些之外,大部分项目的成绩都有明显提升,幅度达到了70%以上,部分项目的成绩出现了翻几倍的情况。虽然E5-1650相比E3-1240来说在主频上略低,但是核心数量的优势在这里得到了充分体现,也是提升性能的关键。
${PageNumber}SiSoftware Sandra Pro Business 2012 | ||
产品名称 | 至强E5-1650 | 至强E3-1240 |
平台类型 | 单路Intel SandyBridge | 单路Intel SandyBridge |
Memory Bandwidth Benchmark 内存带宽测试 | ||
---|---|---|
总体内存性能 | 36.42GB/s | 17.27GB/s |
总体内存性能对比速度 | 23.31MB/sMHz | 13.28MB/sMHz |
整数 B/F iSSE2 内存带宽 | 36.33GB/s | 17.27 |
整数 B/F iSSE2 内存带宽对比速度 | 23.25MB/sMHz | 13.28MB/sMHz |
整数 B/F iSSE2 内存带宽 | 36.51GB/s | 17.27GB/s |
整数 B/F iSSE2 内存带宽对比速度 | 23.37MB/sMHz | 13.28MB/sMHz |
Memory Latency Benchmark 内存延迟测试 | ||
内存延迟(越小越好) | 26.7ns | 75.4ns |
内存延迟对比速度 (越小越好) | 0.02ns/MHz | 0.06ns/MHz |
速度因素 (越小越好) | 64.10ns | 68.30ns |
内部数据高速缓存 | 3.4clocks | 4clocks |
二级板载高速缓存 | 10.1clocks | 11clocks |
三级板载高速缓存 | 18.8clocks | 35clocks |
Cache and Memory Benchmark 缓存及内存测试 | ||
缓存/内存带宽 | 181.32GB/s | 95.69GB/s |
缓存/内存带宽对比速度 | 48.98MB/s/MHz | 26.54MB/s/MHz |
速度因素(越小越好) | 33.10 | 37.10 |
内部数据高速缓存 | 716.5GB/s | 414.17GB/s |
二级板载高速缓存 | 451GB/s | 280GB/s |
三级板载高速缓存 | 243GB/s | 129.5GB/s |
内存测试中我们看到E5-1650 与E3-1240存在非常大的差异,成绩差距在一倍以上。这是因为E3平台只能支持双通道,而E5平台支持四通道,更大的内存带宽对于性能的帮助也是巨大的。因此从这个角度来说,同样是单路应用的话,E5更适合大内存高带宽的应用。
${PageNumber}SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。
SPEC 2006是SPEC组织推出的一套子系统评估软件,它包括CINT2006和CFP2006两个子项目,前者用于测量和对比整数性能,而后者则用于测量和对比浮点性能。计算系统中的处理器、和编译器都会影响最终的测试性能,而I/O(磁盘)、网络、和图形子系统对于SPEC CPU2006的影响比较小。
SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、DCC以及科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库、电子邮件和Web服务器等基于整数应用的多处理器系统的性能。
为了运行SPEC CPU 2006测试,我们统一安装了Windows Server 2008 Enterprise x64 Edition SP1,在主流的x64处理器下,原生64应用要比32位下快。我们还安装了Visual Studio 2005 SP1、 C++/Fortran Compiler 10.0.025编译器,对于支持SSE3指令集的处理器,我们使用了QxO编译指令进行了优化。编译时未使用SmartHeap商业优化库。
SPEC测试代表了绝大多CPU密集型的运算,包括编程语言、压缩、人工智能、基因序列搜索、视频压缩及各种力学的计算等,包含了多种科学计算,可以用来衡量系统执行这些任务的快慢。SPEC base测试包括浮点(fp)与整数运算(int)两部分。
整数运算主要包含编译、压缩、人工智能、视频压缩转换、XML处理等,此外,各种日常操作也主要是基于整数操作。SPEC CPU 2006的整数运算包含了400.perlbench PERL编程语言、401.bzip2 压缩、403.gcc C编译器、429.mcf 组合优化、445.gobmk 人工智能:围棋、456.hmmer 基因序列搜索、458.sjeng 人工智能:国际象棋、462.libquantum 物理:计算、464.h264ref 视频压缩、471.omnetpp 离散事件仿真、473.astar 寻路算法、483.xalancbmk XML处理共12项。
SPEC CPU 2006整数测试成绩
浮点运算包括的全部都是科学运算,科学运算需要用到大量的高精度浮点数据,如410.bwaves 流体力学、416.gamess 化学、433.milc 量子力学、434.zeusmp 物理:计算流体力学、435.gromacs 生物化学/分子力学、436.cactusADM 物理:广义相对论、437.leslie3d 流体力学、444.namd 生物/分子、447.dealII 有限元分析、450.soplex 线形编程、优化、453.povray 影像光线追踪、454.calculix 结构力学、459.GemsFDTD 计算电磁学、465.tonto 量子化学、470.lbm 流体力学、481.wrf 天气预报、482.sphinx3 语音识别共17项测试。
SPEC CPU 2006浮点运算测试成绩
从测试成绩来看,整数测试中E3-1240还有略微占据优势的项目,毕竟主频稍微高一点;但是在浮点中就已经是E5-1650全面领先了。从领先的幅度来看,基本是60%以上,比与线程提升的比率基本一致。
${PageNumber}
|
|