【IT168评测中心】至强5500出世伊始就受到了行业的热捧。今天我们要介绍的处理器是至强5500系列的低端产品,主频为2.13GHz的至强E5506。
至强E5506处理器规格简介
作为Nehalem-EP系列的产品,至强5500系列包括X、E和L三个规格的产品。X代表卓越性能、E代表主流应用、L则代表了绿色节能。这次我们介绍的E5506是E系列主流应用的产品,和至强3400面向单路、塔式服务器的应用不同,E5506虽然是至强5500的入门级产品,却定位在了双路机架式服务器领域。
至强E5506的主频为2.13GHz,基于Nehalem-EP微架构,L3缓存为4MB,标称TDP为80W。和至强550X多款产品一样,E5506也没有提供对于超线程功能的支持(SMT),这对于性能来说会有一定的影响。
测试对比平台的详细参数如下:
测试平台、测试环境 | |||||||||||||||
测试分组 | |||||||||||||||
类别 | Intel Nehalem-EP | Intel Gainestown Xeon E5504 | |||||||||||||
处理器子系统 | |||||||||||||||
处理器 | 单路Intel Xeon E5506 | 单路Intel Xeon E5504 | |||||||||||||
处理器架构 | Intel 45nm Nehalem | Intel 45nm Nehalem | |||||||||||||
处理器代号 | Nehalem-EP | Gainestown | |||||||||||||
处理器封装 | Socket 1156 LGA | Socket 1366 LGA | |||||||||||||
处理器规格 | 四核 | 四核 | |||||||||||||
处理器指令集 | MMX,SSE,SSE2,SSE3,SSSE3, SSE4.1,SSE4.2,EM64T,VT | MMX,SSE,SSE2,SSE3,SSSE3, SSE4.1,SSE4.2,EM64T,VT | |||||||||||||
主频 | 2.13GHz | 2.00GHz | |||||||||||||
处理器外部总线 | 2x QPI 2400MHz 4.8GT/s 单向9.6GB/s(每QPI) 双向19.2GB/s(每QPI) | 2x QPI 2400MHz 4.8GT/s 单向9.6GB/s(每QPI) 双向19.2GB/s(每QPI) | |||||||||||||
L1 D-Cache | 4x 32KB 8路集合关联 | 4x 32KB 8路集合关联 | |||||||||||||
L1 I-Cache | 4x 32KB 4路集合关联 | 4x 32KB 4路集合关联 | |||||||||||||
L2 Cache | 4x 256KB 8路集合关联 | 4x 256KB 8路集合关联 | |||||||||||||
L3 Cache | 4MB @ 2664MHz 16路集合关联 | 4MB @ 1600MHz 16路集合关联 | |||||||||||||
主板型号 | 华硕Z8PE-D12X主板 | Intel S5500BC | |||||||||||||
芯片组 | Intel Tylersburg-EP IOH:Intel 5500(Tylersburg-36D) ICH:Intel 82801JR(ICH10R) | Intel Tylersburg-EP IOH:Intel 5500(Tylersburg-24D) ICH:Intel 82801JR(ICH10R) | |||||||||||||
芯片特性 | 2x QPI 24 PCI Express Gen2 Lanes VT-d Gen 2 | 2x QPI 24 PCI Express Gen2 Lanes VT-d Gen 2 | |||||||||||||
内存控制器 | 每CPU集成三通道R-ECC DDR3 1333 主板实现双通道 | 每CPU集成三通道R-ECC DDR3 800 主板实现双通道 | |||||||||||||
2GB ECC DDR3 1066 SDRAM x3 | 2GB ECC DDR3 800 SDRAM x4 | ||||||||||||||
系统磁盘子系统 | |||||||||||||||
磁盘控制器 | ASUS PIKE 6480 SAS RAID Controller | Intel ICH10R SATA AHCI Controller | |||||||||||||
磁盘控制器规格 | 6x SAS 3Gb/s | 6x SATA 3Gb/s AHCI w/NCQ | |||||||||||||
磁盘控制器设置 | SATA 3Gb/s AHCI w/NCQ | AHCI w/NCQ | |||||||||||||
磁盘控制器驱动 | LSI Embedded MegaRAID WHQL Driver | IMSM 8.8.0.1006 | |||||||||||||
磁盘 | Seagate Cheetah 15K.5 ST3146855SS | Hitachi Deskstar P7K500 HDP725025GLA380 | |||||||||||||
磁盘规格 | 15000RPM 146GB SAS 3Gbps NCQ 32MB Cache | 7200RPM 250GB SATA 3Gb/s w/NCQ 8MB Cache | |||||||||||||
磁盘设置 | SAS 3Gb/s NCQ 50GB系统分区 | SATA 3Gb/s w/NCQ 50GB系统分区 | |||||||||||||
软件环境 | |||||||||||||||
操作系统 | Microsoft Windows Server 2008 Enterprise Edition SP2 x64 | Microsoft Windows Server 2008 Enterprise Edition SP1 x64 |
本次测试我们选择了常见的Microsoft Windows Server 2008 Enterprise Edition x64操作系统作为平台,所有测试基于这个平台展开。用于对比的平台是来自联想的T260 G2服务器,这台服务器使用了至强E5504处理器,详情参见:入门级至强5500服务器 联想T260 G2评测。
SPEC CPU 2006 v1.0.1
SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。
SPEC CPU 2006是SPEC组织推出的CPU子系统评估软件最新版,我们之前使用的是SPEC CPU 2000。和上一个版本一样,SPEC CPU 2006包括了CINT2006和CFP2006两个子项目,前者用于测量和对比整数性能,而后者则用于测量和对比浮点性能,SPEC CPU 2006中对SPEC CPU 2000中的一些测试进行了升级,并抛弃/加入了一些测试,因此两个版本测试得分并没有可比较性。
SPEC CPU测试中,测试系统的处理器、内存子系统和使用到的编译器(SPEC CPU提供的是源代码,并且允许测试用户进行一定的编译优化)都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2006的影响非常的小。
SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、DCC以及科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。
我们在被测服务器中安装了当前最新版本的Intel C++ 10.1.025 Compiler、Intel Fortran 10.1.025 Compiler这两款SPEC CPU 2006必需的编译器,通过最新出现的QxS编译参数,Intel Compiler 10版本开始支持对Intel SSE4指令集进行优化(假如只支持SSE3,则使用QxT编译参数)。我们另外安装了Microsoft Visual Studio 2003 SP1提供必要的库文件。按照SPEC的要求我们根据自己的情况编辑了新的Config文件,使用了较多的编译选项。我们根据被测系统选择实际可同时处理的线程数量,最后得到SPEC rate base测试结果(基于base标准编译,SPEC base rate测试代表系统同时处理多个任务的能力)。
和其它测试部件不同,SPEC CPU 2006需要大量的系统物理内存,我们的SPEC测试在64bit Windows Server 2008 Enterprise下完成,对于每个运算核心,配置1.5GB内存。
SiSoftware Sandra v2009
SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。从2007开始,Sandra的Arithmetic benchmarks增加了对SSE3 & SSE4 SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,另外还升级了File System benchmark和Removable Storage benchmark两个子项目。对于新的硬件的支持当然也是该软件每次升级的重要内容之一。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台,这也是我们选择这款软件的原因之一。
CineBench R10
CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,在服务器测试平台中显示子系统不重要,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。
在测试之前,我们首先使用常见的CPU-Z软件考察当前处理器的运行情况。
应用了至强E5506处理器
主板使用的是华硕Z8PE-D12X
处理器整合的内存控制器和主板芯片组均支持三通道内存
主板提供了12条内存插槽,扩展性不错
EVEREST提供了更为全面的处理器信息。由于至强E5506没有提供超线程功能,所以这里我们只看到了4个处理器核心(超线程状态为8个)。
SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,它可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台。我们利用了其中多个性能测试模块对于被测系统的性能进行了快速的测试。
SiSoftware Sandra Pro Business 2009 | ||
---|---|---|
测试对象 | 至强E5506 | 至强E5504 |
Processor Arithmetic Benchmark 处理器架构测试 | ||
Dhrystone ALU | 52603MIPS | 49318MIPS |
Dhrystone ALU vs SPEED | 24.66MIPS/MHz | 24.66MIPS/MHz |
Whetstone iSSE3 | 26967MFLOPS | 26064MFLOPS |
Dhrystone iSSE3 vs SPEED | 12.64MFLOPS/MHz | 13.03MFLOPS/MHz |
Processor Multi-Media Benchmark 处理器多媒体测试 | ||
Multi-Media Int x16 iSSE4.1 | 90.46MPixel/s | 84.83MPixel/s |
Multi-Media Int x16 iSSE4.1 vs SPEED | 42.41kPixels/s/MHz | 42.41kPixel/s/MHz |
Multi-Media Float x8 iSSE2 | 69.09MPixel/s | 64.72MPixel/s |
Multi-Media Float x8 iSSE2 vs SPEED | 32.39kPixels/s/MHz | 32.36kPixels/s/MHz |
Multi-Media Double x4 iSSE2 | 36.06MPixel/s | 33.81MPixel/s |
Multi-Media Double x4 iSSE2 vs SPEED | 16.91kPixels/s/MHz | 16.91kPixels/s/MHz |
Multi-Core Efficiency Benchmark | ||
Inter-Core Bandwidth | 10.05GB/s | 9.73GB/s |
Inter-Core Bandwidth vs SPEED | 4.82MB/s/MHz | 4.98MB/s/MHz |
Inter-Core Latency (越小越好) | 78ns | 74ns |
Inter-Core Latency vs SPEED (越小越好) | 0.04ns/MHz | 0.04ns/MHz |
.NET Arithmetic Benchmark .NET架构测试 | ||
Dhrystone .NET | 8544MIPS | 8103MIPS |
Dhrystone .NET vs SPEED | 4.01MIPS/MHz | 4.05MIPS/MHz |
Whetstone .NET | 18348MFLOPS | 17394MFLOPS |
Whetstone .NET vs SPEED | 8.60MFLOPS/MHz | 8.70MFLOPS/MHz |
.NET Multi-Media Benchmark .NET多媒体测试 | ||
Multi-Media Int x1 .NET | 18.02MPixel/s | 17.02MPixel/s |
Multi-Media Int x1 .NET vs SPEED | 8.45kPixels/s/MHz | 8.51kPixels/s/MHz |
Multi-Media Float x1 .NET | 5.21MPixel/s | 4.99MPixel/s |
Multi-Media Float x1 .NET vs SPEED | 2.44kPixels/s/MHz | 2.49kPixels/s/MHz |
Multi-Media Double x1 .NET | 9.78MPixel/s | 9.28MPixel/s |
Multi-Media Double x1 .NET vs SPEED | 4.59kPixels/s/MHz | 4.64kPixels/s/MHz |
由于至强E5506和E5504在架构上完全相同,所以测试性能更能体现出不同主频的差异。从测试结果来看,0.2GHz的频率在多个项目中表现明显,处理器架构、多媒体性能等诸多内容中E5506都有明显的领先优势。而在.NET测试中,部分项目的优势不明显,甚至还有略微落后的情形。
SiSoftware Sandra缓存内存测试主要包括内存带宽、内存延迟等性能的测试。
SiSoftware Sandra Pro Business 2009 | ||
---|---|---|
测试对象 | 至强E5506 | 至强E5504 |
Memory Bandwidth Benchmark 内存带宽测试 | ||
Int Buff'd iSSE2 Memory Bandwidth | 14.10GB/s | 9.98GB/s |
Float Buff'd iSSE2 Memory Bandwidth | 14.12GB/s | 9.98GB/s |
Memory Latency Benchmark 内存延迟测试 | ||
Memory(Random Access) Latency (越小越好) | 109ns | 108ns |
Speed Factor (越小越好) | 57.10 | 52.50 |
Internal Data Cache | 4clocks | 4clocks |
L2 On-board Cache | 10clocks | 10clocks |
L3 On-board Cache | 49clocks | 48clocks |
Cache and Memory Benchmark 缓存及内存测试 | ||
Cache/Memory Bandwidth | 45.83GB/s | 36.81GB/s |
Cache/Memory Bandwidth vs SPEED | 22.00MB/s/MHz | 18.85MB/s/MHz |
Speed Factor (越小越好) | 22.10 | 33.40 |
Internal Data Cache | 173.75GB/s | 163.13GB/s |
L2 On-board Cache | 146.01GB/s | 137.45GB/s |
内存测试的情况和上面差不多,不过这其中并非都是处理器频率的功劳。之前我们介绍过,对比的至强E5504基于联想T260 G2服务器,而这台服务器的主板芯片组规格为Intel 5500(Tylersburg-24D),换句话说这是一款双通道的主板。虽然处理器内部整合了三通道内存控制器,但是由于主板并不支持这种规格,使得对比平台的性能受到影响。我们可以看到,在内存带宽、缓存与内存测试中,E5506和E5504的差距超出了频率差距应有的范畴,这也从侧面说明的主板的影响之大。
SPEC CPU 2006的浮点运算测试包括的全部都是科学运算,科学运算需要用到大量的高精度浮点数据,如410.bwaves 流体力学、416.gamess 量子化学、433.milc 量子力学、434.zeusmp 物理:计算流体力学、435.gromacs 生物化学/分子力学、436.cactusADM 物理:广义相对论、437.leslie3d 流体力学、444.namd 生物/分子、447.dealII 有限元分析、450.soplex 线形编程、优化、453.povray 影像光线追踪、454.calculix 结构力学、459.GemsFDTD 计算电磁学、465.tonto 量子化学、470.lbm 流体力学、481.wrf 天气预报、482.sphinx3 语音识别共17项测试。
SPEC CPU 2006浮点运算性能
浮点运算性能,至强E5506在多数项目中领先,部分项目的领先幅度达到了50%。
SPEC CPU 2006整数运算主要包含编译、压缩、人工智能、视频压缩转换、XML处理等,此外,各种日常操作也主要是基于整数操作。SPEC CPU 2006的整数运算包含了400.perlbench PERL编程语言、401.bzip2 压缩、403.gcc C编译器、429.mcf 组合优化、445.gobmk 人工智能:围棋、456.hmmer 基因序列搜索、458.sjeng 人工智能:国际象棋、462.libquantum 物理:量子计算、464.h264ref 视频压缩、471.omnetpp 离散事件仿真、473.astar 寻路算法、483.xalancbmk XML处理共12项。
SPEC CPU 2006整数运算性能
整数性能测试中,至强E5504和至强E5506的差距没有之前那么大了,甚至在429.mcf 组合优化项目中还略占优势。不过综合看来,整数运算体现了两款处理器的频率差异,更高频率的E5506在多数项目中领先。
CineBench R10
CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,我们的平台偏向于服务器多一些,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。
CineBench R10 | ||
处理器 | 至强E5506 | 至强E5504 |
CPU Benchmark | ||
Rendering (1 CPU) | 3030 CB-CPU | 2868 CB-CPU |
Rendering (x CPU) | 11145 CB-CPU | 10559 CB-CPU |
Multiprocessor Speedup | 3.68x | 3.68x |
我们截取了CineBench R10中的处理器测试成绩来对比。无论是在单处理器还是多处理器中,至强5506始终处于领先的优势,可见主频对于性能的影响。而两款处理器的加速比相同,也反向印证了它们基于同样的核心与架构。
【IT168评测中心】本次我们测试了至强E5506处理器的性能,并与E5504进行了基本项目的对比。作为至强5500家族的入门级产品,E5506更多定位在双路机架式服务器中,也是许多服务器的标配处理器。
通过与同规格其他主频处理器的对比,我们发现至强E5506相比E5504来说更强一些,性能提升要比主频提升的幅度来得更大(主频提升只有0.13GHz)。考虑到价格因素,E5506处理器的市场售价为1400-2000元不等,而E5504的售价也在这个区间之内,相比之下E5506是个更为超值的选择。如果对比酷睿i7来说,虽然E5506在频率上不如i7-920,但如果考虑性价比的话,至强或许也是一个不错的选择(X58芯片组可以提供对于至强5500处理器的支持)。