【IT168评测中心】9月初,Intel发布了面向大众用户的Core i5处理器。作为当前Core i7的低规格产品,Core i5使用了全新的LGA1156接口,面向大众消费市场。众所周知,自Core i7出现伊始,出现了叫好不叫座的情况。虽然大众对于Core i7的性能给予了充分的肯定,但是高昂的价格少有人能够接受,于是Intel推出了Core i5。
和Core i5同时出现的是基于LGA1156接口的至强X3400家族处理器,也就是我们本文要介绍的主角。以往我们看到的至强3000系列处理器多是基于LGA1366接口(部分老规格的产品基于LGA775接口),比如我们曾经测试过的W3580处理器。而至强X3400的出现可以说是至强系列的Core i5版产品。
这次Intel推出的LGA1156至强处理器均属于面向小型企业的经济型产品,隶属于至强3000系列,一共有6款。除了L3426属于低功耗的版本之外,其余5款均为至强X3400家族成员,频率从2.4GHz到2.93GHz不等。
我们提到过,Core i5是定位在大众市场的产品,是Core i7的补充。那么至强X3400的性能如何呢?相比我们之前测试过的至强E5500系列来说,它是否也是一款更低定位的产品?随着我们测试的展开,答案即将揭晓。
这个家族最小的成员为X3430,随后是X3440、X3450、X3460和X3470,主频也从2.4GHz到2.93GHz不等。通过对比我们可以看到,家族成员在核心数量(4核心)、QPI带宽(2.5GT/s)、三级缓存(8MB)、TDP(95W)等主要方面都是一致的,包括LGA1156处理器中的一个主打卖点——Intel动态超频技术,但是在细节上还是有所差别。
首先是超线程技术。这个Intel早就开发出来,而去年才在Nehalem上大放异彩的技术对于性能提升有着至关重要的作用,虚拟出来的4个核心性能也非常不错,我们测试过在开启和关闭超线程情况下处理器的性能差距在30%以上。不过很遗憾,至强X3430,也就是本次我们测试的这款处理器并不支持超线程技术,或许是定位太低端了。
另外一个不是全家族具备的就是AES New Instructions,新的AES指令集。这部分内容是未来Westmere上会应用到的新技术,包括无进位乘法指令、AES扩展指令等多项内容,指令详情参见:IDF总结篇:新工艺 新技术 新概念。
除此之外,还有Intel Thermal Monitor2和Embedded也是至强X3400家族不具备的,Intel Thermal Monitor2其中简称为TM2,是一种应用在LGA 775接口上的处理器过热保护技术;而Embedded则意味着嵌入式。可以说这两种技术本身也不是至强X3400的特征。
介绍了许多关于至强X3400家族成员的信息,相信大家已经迫不及待的要求看到事物了。下面就放出一些至强X3430处理器的图片。
首先看到的是至强X5570和至强X3430的对比。很明显老大哥X5570在体积上要比X3430大许多。
接下来大家看到的是至强X3430与Core i5的对比。我先不说哪个是至强X3430,您能看出来吗?
在上面的图片中,左侧的是至强X3430,右侧的是Core i5。仔细观察一下,似乎两者没有任何的区别,同核心同工艺的产品嘛!
接下来,我们将要对至强X3430处理器进行性能测试,测试结果会对比上一代的至强E5430和同样不支持超线程技术的至强E5504,看看LGA 1156接口的它在性能上处于什么样的层次。
测试对比平台的详细参数如下:
测试平台、测试环境 | ||||||||||||||||||||||||||||||
测试分组 | ||||||||||||||||||||||||||||||
类别 | 华硕P7F-E | Lenovo T260 G2 单路Intel Gainestown Xeon E5504 | 双路Xeon E5430基准平台 DELL PE2900 III服务器 双路Intel Harpertown Xeon E5430 | Dawning I620r-G服务器 双路Intel Gainestown Xeon E5540 | ||||||||||||||||||||||||||
处理器子系统 | ||||||||||||||||||||||||||||||
处理器 | 单路Intel Xeon X3430 | 单路Intel Xeon E5504 | 双路Intel Xeon E5430 | 双路Intel Xeon E5540 | ||||||||||||||||||||||||||
处理器架构 | Intel 45nm Nehalem | Intel 45nm Nehalem | Intel 45nm Penryn | Intel 45nm Nehalem | ||||||||||||||||||||||||||
处理器代号 | Nehalem-EP | Gainestown | Harpertown | Gainestown | ||||||||||||||||||||||||||
处理器封装 | Socket 1156 LGA | Socket 1366 LGA | Socke 771 LGA | Socket 1366 LGA | ||||||||||||||||||||||||||
处理器规格 | 四核 | 四核 | 四核 | 四核 | ||||||||||||||||||||||||||
处理器指令集 | MMX,SSE,SSE2,SSE3,SSSE3, SSE4.1,SSE4.2,EM64T,VT | MMX,SSE,SSE2,SSE3,SSSE3, SSE4.1,SSE4.2,EM64T,VT | MMX,SSE,SSE2,SSE3,SSSE3, SSE4.1,EM64T,VT | MMX,SSE,SSE2,SSE3,SSSE3, SSE4.1,SSE4.2,EM64T,VT | ||||||||||||||||||||||||||
主频 | 2.4GHz | 2.00GHz | 2.66GHz | 2.53GHz | ||||||||||||||||||||||||||
处理器外部总线 | 1x QPI 1600MHz 2.5GT/s 单向2.4GB/s(每QPI) 双向4.8GB/s(每QPI) | 2x QPI 2400MHz 4.8GT/s 单向9.6GB/s(每QPI) 双向19.2GB/s(每QPI) | FSB 333MHz 1333MT/s 10.6GB/s | 2xQPI 2933MHz 5.86GT/s 单向11.73GB/s(每QPI) 双向23.46GB/s(每QPI) | ||||||||||||||||||||||||||
L1 D-Cache | 4x 32KB 8路集合关联 | 4x 32KB 8路集合关联 | 4x 32KB 8路集合关联 | 4x 32KB 8路集合关联 | ||||||||||||||||||||||||||
L1 I-Cache | 4x 32KB 4路集合关联 | 4x 32KB 4路集合关联 | 4x 32KB 8路集合关联 | 4x 32KB 4路集合关联 | ||||||||||||||||||||||||||
L2 Cache | 4x 256KB 8路集合关联 | 4x 256KB 8路集合关联 | 2x 6144KB 16路集合关联 | 4x 256KB 8路集合关联 | ||||||||||||||||||||||||||
L3 Cache | 8MB @ 2664MHz 16路集合关联 | 4MB @ 1600MHz 16路集合关联 | - | 8MB 16路集合关联 | ||||||||||||||||||||||||||
主板型号 | 华硕P7F-E | Intel S5500BC | DELL PE2900 III | Dawning Tylersburg-36D | ||||||||||||||||||||||||||
芯片组 | PCH:Intel 3420 | Intel Tylersburg-EP IOH:Intel 5500(Tylersburg-24D) ICH:Intel 82801JR(ICH10R) | MCH:Intel 5000X ICH:Intel ESB6321 | Intel Tylersburg-EP IOH:Intel 5520(Tylersburg-36D) ICH:Intel 82801JR(ICH10R) | ||||||||||||||||||||||||||
芯片特性 | 1x QPI VT-d Gen 2 | 2x QPI 24 PCI Express Gen2 Lanes VT-d Gen 2 | 2xFSB1333 12MB Snoop Filter VT-d | 2xQPI VT-d | ||||||||||||||||||||||||||
内存控制器 | 每CPU集成双通道R-ECC DDR3 1366 | 每CPU集成三通道R-ECC DDR3 800 主板实现双通道 | 北桥集成四通道FBD DDR2 667 | 每CPU集成三通道R-ECC DDR3 1066 | ||||||||||||||||||||||||||
2GB ECC DDR3 1066 SDRAM x2 | 2GB ECC DDR3 800 SDRAM x4 | 2GB FBD DDR2 667 SDRAM x4 | 2GB R-ECC DDR3 1066 SDRAM x12 | |||||||||||||||||||||||||||
系统磁盘子系统 | ||||||||||||||||||||||||||||||
磁盘控制器 | Intel ICH10R RAID Controller | Intel ICH10R SATA AHCI Controller | DELL Perc 5/i RAID Controller | LSI Embedded MegaRAID SAS RAID Controller | ||||||||||||||||||||||||||
磁盘控制器规格 | 6x SATA 3Gb/s MatrixRAID 0/1/3/5 | 6x SATA 3Gb/s AHCI w/NCQ | 8xSAS 3Gbps | 8xSAS 3Gbps | ||||||||||||||||||||||||||
磁盘控制器设置 | SATA 3Gb/s AHCI w/NCQ | AHCI w/NCQ | RAID 5 | RAID 0 | ||||||||||||||||||||||||||
磁盘控制器驱动 | Intel Matrix Storage Manager 8.8.0.1009 x64 | IMSM 8.8.0.1006 | LSI SAS 3.8.0.64 | LSI MegaSR 13.06.0212.2009 | ||||||||||||||||||||||||||
磁盘 | ST Seagate Barracuda 7200.11 | Hitachi Deskstar P7K500 HDP725025GLA380 | Seagate Cheetah 15K.5 ST314655SS x3 | Fujitsu MBA3300RC x2 | ||||||||||||||||||||||||||
磁盘规格 | 7200RPM 320GB SATA 3Gbps NCQ 16MB Cache | 7200RPM 250GB SATA 3Gb/s w/NCQ 8MB Cache | 15000RPM 146GB SAS 3Gbps 16MB Cache | 15000RPM 300GB SAS 3Gbps 16MB Cache | ||||||||||||||||||||||||||
磁盘设置 | SATA 3Gb/s NCQ 50GB系统分区 | SATA 3Gb/s w/NCQ 50GB系统分区 | SAS 3Gbps 20GB系统分区 | SAS 3Gbps 50GB系统分区 | ||||||||||||||||||||||||||
软件环境 | ||||||||||||||||||||||||||||||
操作系统 | Microsoft Windows Server 2008 Enterprise Edition SP2 x64 | Microsoft Windows Server 2008 Enterprise Edition SP1 x64 | Microsoft Windows Server 2008 Enterprise Edition SP1 x64 | Microsoft Windows Server 2008 Enterprise Edition SP1 x64 |
本次测试我们选择了常见的Microsoft Windows Server 2008 Enterprise Edition x64操作系统作为平台,所有测试基于这个平台展开。
考虑到至强X3430处理器规格的特殊性,我们在测试时选择了至强E5504、至强E5430和至强E5540三款处理器进行对比。这三款处理器分别代表了低端主力、上一代主流和当前主力三个层次,相比之下更能够看出至强X3430的定位。
具体说来,至强E5504是Nehalem-EP架构下的至强5500系列处理器,和X3430一样它也不支持超线程功能(SMT),主频为2.0GHz。至强E5430是上一代至强5400系列的主流产品,主频为2.53GHz,而且我们测试平台使用的是双路处理器,检验相比上一代的两款处理器来说,至强X3430是否有优势。最后我们选择的处理器是至强E5540处理器,这是Nehalem-EP系列的主流产品,支持超线程技术,主频为2.53GHz。
SPEC CPU 2006 v1.0.1
SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。
SPEC CPU 2006是SPEC组织推出的CPU子系统评估软件最新版,我们之前使用的是SPEC CPU 2000。和上一个版本一样,SPEC CPU 2006包括了CINT2006和CFP2006两个子项目,前者用于测量和对比整数性能,而后者则用于测量和对比浮点性能,SPEC CPU 2006中对SPEC CPU 2000中的一些测试进行了升级,并抛弃/加入了一些测试,因此两个版本测试得分并没有可比较性。
SPEC CPU测试中,测试系统的处理器、内存子系统和使用到的编译器(SPEC CPU提供的是源代码,并且允许测试用户进行一定的编译优化)都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2006的影响非常的小。
SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、DCC以及科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。
我们在被测服务器中安装了当前最新版本的Intel C++ 10.1.025 Compiler、Intel Fortran 10.1.025 Compiler这两款SPEC CPU 2006必需的编译器,通过最新出现的QxS编译参数,Intel Compiler 10版本开始支持对Intel SSE4指令集进行优化(假如只支持SSE3,则使用QxT编译参数)。我们另外安装了Microsoft Visual Studio 2003 SP1提供必要的库文件。按照SPEC的要求我们根据自己的情况编辑了新的Config文件,使用了较多的编译选项。我们根据被测系统选择实际可同时处理的线程数量,最后得到SPEC rate base测试结果(基于base标准编译,SPEC base rate测试代表系统同时处理多个任务的能力)。
和其它测试部件不同,SPEC CPU 2006需要大量的系统物理内存,我们的SPEC测试在64bit Windows Server 2008 Enterprise下完成,对于每个运算核心,配置1.5GB内存。
SiSoftware Sandra v2009
SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。从2007开始,Sandra的Arithmetic benchmarks增加了对SSE3 & SSE4 SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,另外还升级了File System benchmark和Removable Storage benchmark两个子项目。对于新的硬件的支持当然也是该软件每次升级的重要内容之一。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台,这也是我们选择这款软件的原因之一。
CineBench R10
CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,在服务器测试平台中显示子系统不重要,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。
本次测试我们选用的处理器为ES工程样品,因此在CPU-Z中识别有些问题。事实上,这是颗至强X3430处理器,主频为2.4GHz。下面的EVEREST软件会给出这款处理器的详细规格。
相比CPU-Z来说,EVEREST软件给出的信息更为全面。这款至强X3430处理器的身份也得到了证实。它是Intel今年第三季度新推出的处理器,面向单路中小型服务器市场。X3430的主频为2.4GHz,三级缓存为8MB,标称TDP为45W。可惜的是,它不能够支持超线程技术,而我们知道对于Nehalem架构来说,超线程会对性能有明显的提升。
SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,它可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台。我们利用了其中多个性能测试模块对于被测系统的性能进行了快速的测试。
SiSoftware Sandra Pro Business 2009 | ||||
---|---|---|---|---|
测试对象 | 至强X3430 | 至强E5504 | 双路至强E5430 | 双路至强E5540 |
Processor Arithmetic Benchmark 处理器架构测试 | ||||
Dhrystone ALU | 62244MIPS | 49318MIPS | 91006MIPS | 130767MIPS |
Dhrystone ALU vs SPEED | 25.93MIPS/MHz | 24.66MIPS/MHz | 34.21MIPS/MHz | 51.75MIPS/MHz |
Whetstone iSSE3 | 29187MFLOPS | 26064MFLOPS | 78385MFLOPS | 68158MFLOPS |
Dhrystone iSSE3 vs SPEED | 12.16MFLOPS/MHz | 13.03MFLOPS/MHz | 29.47MFLOPS/MHz | 26.97MFLOPS/MHz |
Processor Multi-Media Benchmark 处理器多媒体测试 | ||||
Multi-Media Int x16 iSSE4.1 | 106.74MPixel/s | 84.83MPixel/s | - | 228.02MPixel/s |
Multi-Media Int x16 iSSE4.1 vs SPEED | 44.48kPixels/s/MHz | 42.41kPixel/s/MHz | - | 90.23kPixels/s/MHz |
Multi-Media Float x8 iSSE2 | 81.28MPixel/s | 64.72MPixel/s | - | 172.03MPixel/s |
Multi-Media Float x8 iSSE2 vs SPEED | 33.87kPixels/s/MHz | 32.36kPixels/s/MHz | - | 68.08kPixels/s/MHz |
Multi-Media Double x4 iSSE2 | 42.24MPixel/s | 33.81MPixel/s | - | 89.72MPixel/s |
Multi-Media Double x4 iSSE2 vs SPEED | 17.60kPixels/s/MHz | 16.91kPixels/s/MHz | - | 35.50kPixels/s/MHz |
Multi-Core Efficiency Benchmark | ||||
Inter-Core Bandwidth | 13.27GB/s | 9.73GB/s | 20.54GB/s | 25.88GB/s |
Inter-Core Bandwidth vs SPEED | 5.66MB/s/MHz | 4.98MB/s/MHz | 7.91MB/s/MHz | 10.49MB/s/MHz |
Inter-Core Latency (越小越好) | 60ns | 74ns | 90ns | 58ns |
Inter-Core Latency vs SPEED (越小越好) | 0.03ns/MHz | 0.04ns/MHz | 0.03ns/MHz | 0.02ns/MHz |
.NET Arithmetic Benchmark .NET架构测试 | ||||
Dhrystone .NET | 11567MIPS | 8103MIPS | 10562MIPS | 28774MIPS |
Dhrystone .NET vs SPEED | 4.82MIPS/MHz | 4.05MIPS/MHz | 3.97MIPS/MHz | 11.39MIPS/MHz |
Whetstone .NET | 26730MFLOPS | 17394MFLOPS | 45399MFLOPS | 44516MFLOPS |
Whetstone .NET vs SPEED | 11.14MFLOPS/MHz | 8.70MFLOPS/MHz | 17.07MFLOPS/MHz | 17.62MFLOPS/MHz |
.NET Multi-Media Benchmark .NET多媒体测试 | ||||
Multi-Media Int x1 .NET | 21.93MPixel/s | 17.02MPixel/s | 31.28MPixel/s | 46.38MPixel/s |
Multi-Media Int x1 .NET vs SPEED | 9.14kPixels/s/MHz | 8.51kPixels/s/MHz | 11.76kPixels/s/MHz | 18.35kPixels/s/MHz |
Multi-Media Float x1 .NET | 7.26MPixel/s | 4.99MPixel/s | 8.68MPixel/s | 13.30MPixel/s |
Multi-Media Float x1 .NET vs SPEED | 3.03kPixels/s/MHz | 2.49kPixels/s/MHz | 3.26kPixels/s/MHz | 5.26kPixels/s/MHz |
Multi-Media Double x1 .NET | 11.82MPixel/s | 9.28MPixel/s | 24.75MPixel/s | 24.73MPixel/s |
Multi-Media Double x1 .NET vs SPEED | 4.92kPixels/s/MHz | 4.64kPixels/s/MHz | 9.30kPixels/s/MHz | 9.79kPixels/s/MHz |
处理器架构性能测试分为处理器和内存两部分,首先我们看到的是处理器性能。我们对比前两项——至强X3430和至强E5504。从测试结果来看,许多项目至强X3430都处于领先优势,领先幅度也很明显,大概是20-40%左右。而第三项使用的是上一代的至强E5430处理器,双路配置。除了多媒体测试E5430没有相关成绩之外,其他测试至强X3430虽然大部分处于下风,但要是衡量单颗处理器的性能,至强X3430还是要高一些。
最后对比至强E5540处理器,虽然同是Nehalem架构,不过至强E5540支持超线程技术,也就是说实际上第四项系统中有16个处理器核心(8个处理器核心为虚拟),在这种情况下,两者的性能差距也不过就是1:2 的比例。由此看来至强X3430性能还是很强劲的。
SiSoftware Sandra缓存内存测试主要包括内存带宽、内存延迟等性能的测试。
SiSoftware Sandra Pro Business 2009 | ||||
---|---|---|---|---|
测试对象 | 至强X3430 | 至强E5504 | 至强E5430 双路 | 至强E5540 双路 |
Memory Bandwidth Benchmark 内存带宽测试 | ||||
Int Buff'd iSSE2 Memory Bandwidth | 13.78GB/s | 9.98GB/s | - | 32.59GB/s |
Float Buff'd iSSE2 Memory Bandwidth | 13.77GB/s | 9.98GB/s | - | 32.59GB/s |
Memory Latency Benchmark 内存延迟测试 | ||||
Memory(Random Access) Latency (越小越好) | 89ns | 108ns | 108ns | 92ns |
Speed Factor (越小越好) | 57.50 | 52.50 | 95.20 | 57.90 |
Internal Data Cache | 4clocks | 4clocks | 3clocks | 4clocks |
L2 On-board Cache | 9clocks | 10clocks | 18clocks | 10clocks |
L3 On-board Cache | 47clocks | 48clocks | - | 51clocks |
Cache and Memory Benchmark 缓存及内存测试 | ||||
Cache/Memory Bandwidth | 51.08GB/s | 36.81GB/s | 68.88GB/s | 120.64GB/s |
Cache/Memory Bandwidth vs SPEED | 21.79MB/s/MHz | 18.85MB/s/MHz | 26.52MB/s/MHz | 48.89MB/s/MHz |
Speed Factor (越小越好) | 27.10 | 33.40 | 111.90 | 23.10 |
Internal Data Cache | 205.08GB/s | 163.13GB/s | 421.23GB/s | 401.21GB/s |
L2 On-board Cache | 175.49GB/s | 137.45GB/s | 122.68GB/s | 362.61GB/s |
内存测试的性能更多体现出各个测试平台之间内存控制器和内存通道数量的差异。整体来看,拥有三通道的至强E5540性能处于最强地位,同样是至强5500系列的至强E5504由于测试主板只能支持双通道,因此性能有所下滑,在许多测试中不如至强X3430的水平。性能较低的是至强E5430,只能支持双通道、通过北桥整合内存控制器的它除了在个别项目中依靠处理器数量的帮助获得领先之外,更多的时候成绩垫底。
SPEC CPU 2006的浮点运算测试包括的全部都是科学运算,科学运算需要用到大量的高精度浮点数据,如410.bwaves 流体力学、416.gamess 量子化学、433.milc 量子力学、434.zeusmp 物理:计算流体力学、435.gromacs 生物化学/分子力学、436.cactusADM 物理:广义相对论、437.leslie3d 流体力学、444.namd 生物/分子、447.dealII 有限元分析、450.soplex 线形编程、优化、453.povray 影像光线追踪、454.calculix 结构力学、459.GemsFDTD 计算电磁学、465.tonto 量子化学、470.lbm 流体力学、481.wrf 天气预报、482.sphinx3 语音识别共17项测试。
首先是浮点运算性能,这里出现了和至强SisoftWare测试中类似的情况。凭借着处理器的数量和超线程功能两项优势,至强E5540一路遥遥领先,其次是至强E5430和至强X3430,相比之下至强X3430领先的时候更多一些。至强E5504在测试中排名最后,主频过低决定了它的末尾地位。
SPEC CPU 2006整数运算主要包含编译、压缩、人工智能、视频压缩转换、XML处理等,此外,各种日常操作也主要是基于整数操作。SPEC CPU 2006的整数运算包含了400.perlbench PERL编程语言、401.bzip2 压缩、403.gcc C编译器、429.mcf 组合优化、445.gobmk 人工智能:围棋、456.hmmer 基因序列搜索、458.sjeng 人工智能:国际象棋、462.libquantum 物理:量子计算、464.h264ref 视频压缩、471.omnetpp 离散事件仿真、473.astar 寻路算法、483.xalancbmk XML处理共12项。
整数性能测试中,业内知名的还是至强E5540,不过第二的位置发生了一些变化,至强E5430凭借着处理器数量和主频的优势在多个项目中领先于至强X3430,显然至强E5502的成绩依然垫底。
CineBench R10
CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,我们的平台偏向于服务器多一些,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。
CineBench R10 | ||||
处理器 | 至强X3430 | 至强E5504 | 至强E5430 双路 | 至强E5540 双路 |
CPU Benchmark | ||||
Rendering (1 CPU) | 3868 CB-CPU | 2868 CB-CPU | 2931 CB-CPU | 3640 CB-CPU |
Rendering (x CPU) | 12964 CB-CPU | 10559 CB-CPU | 16806 CB-CPU | 24275 CB-CPU |
Multiprocessor Speedup | 3.35x | 3.68x | 5.73x | 6.67x |
OpenGL Benchmark | ||||
OpenGL Standard | 7690 CB-GFX | 158 CB-GFX | 176 CB-GFX | 188 CB-GFX |
我们只查看处理器性能部分,由于至强X3430使用了Quadro FX580专业卡,所以显卡的测试结果很高。事实上我们看到,至强X3430的单处理器成绩在几个对比平台中是最高的,其次是至强E5540,至强E5504和至强E5430的成绩比较接近,虽然E5504的架构先进一些,可惜低主频拉底了分数。
多处理器情况下,至强E5540的成绩超出其他很多,16个处理器核心果然性能强劲;接下来的8个核心的至强E5430,双路平台在这个项目中明显胜出。相比之下,至强X3430由于只有单处理器,又没有超线程技术,在这个测试中就显得疲软了一些,不过依然高于至强E5502。
ScienceMark v2.0是一款用于测试系统特别是处理器在科学计算应用中的性能的软件,MemBenchmark是其中针对处理器缓存、系统内存而设计的功能模块,它可以测试系统内存带宽、L1 Cache延迟、L2 Cache延迟和系统内存延迟,另外还可以测试不同指令集的性能差异。
ScienceMark Membench | ||||
---|---|---|---|---|
产品型号 | 至强X3430 | 至强E5504 | 至强E5430 双路 | 至强E5540 双路 |
内存技术参数 | 2GB ECC DDR3-1066 SDRAM x2 | 1GB DDR3-1066 SDRAM x2 | 4GB R-ECC DDR3-1333 SDRAM x6 | 2GB R-ECC DDR3-1066 SDRAM x12 |
L1带宽(MB/s) | 83802.74 | 47877.41 | 55376.16 | 47705.89 |
L2带宽(MB/s) | 32614.79 | 19596.05 | 16757.55 | 19499.26 |
内存带宽(MB/s) | 11374.73 | 8833.57 | 4485.09 | 8620.40 |
L1 Cache Latency(ns) | ||||
32 Bytes Stride | 0.83 ns | 1.50 ns | 1.13 ns | 0.79 |
L1 Algorithm Bandwidth(MB/s) | ||||
Compiler | 71005.13 | 42198.88 | 25201.96 | 42272.23 |
REP MOVSD | 76114.77 | 43498.52 | 25467.15 | 43279.73 |
ALU Reg Copy | 21257.29 | 12067.10 | 13093.65 | 12024.42 |
MMX Reg Copy | 40852.60 | 24173.05 | 25242.19 | 23374.45 |
SSE PAlign | 83711.99 | 47830.32 | 52826.21 | 47567.95 |
SSE2 PAlign | 83802.74 | 47877.41 | 55376.16 | 47572.00 |
L2 Cache Latency(ns) | ||||
4 Bytes Stride | 2 cycles 1.25 ns | 4 cycles 2.00 ns | 3 cycles 1.13 ns | 3 cycles 1.19 ns |
16 Bytes Stride | 3 cycles 1.25 ns | 4 cycles 2.00 ns | 3 cycles 1.50 ns | 3 cycles 1.19 ns |
64 Bytes Stride | 8 cycles 3.33 ns | 10 cycles 5.00 ns | 8 cycles 4.51 ns | 9 cycles 3.56 ns |
256 Bytes Stride | 8 cycles 3.33 ns | 9 cycles 4.50 ns | 8 cycles 4.51 ns | 8 cycles 3.17 ns |
512 Bytes Stride | 7 cycles 2.92 ns | 8 cycles 4.00 ns | 7 cycles 4.89 ns | 8 cycles 2.77 ns |
L2 Algorithm Bandwidth(MB/s) | ||||
Compiler | 29772.54 | 17957.58 | 11609.57 | 18042.06 |
REP MOVSD | 32614.79 | 19596.05 | 12140.00 | 19499.26 |
ALU Reg Copy | 14651.01 | 8778.56 | 9273.71 | 8766.52 |
MMX Reg Copy | 23430.76 | 14063.17 | 12042.45 | 13988.43 |
SSE PAlign | 31210.99 | 18656.42 | 14314.34 | 18664.20 |
SSE2 PAlign | 31158.21 | 18677.19 | 14289.88 | 18664.20 |
Memory Latency(ns) | ||||
4 Bytes Stride | 3 cycles 1.25 ns | 4 cycles 2.00 ns | 3 cycles 1.13 ns | 3 cycles 1.25 ns |
16 Bytes Stride | 4 cycles 1.67 ns | 5 cycles 2.50 ns | 5 cycles 4.89 ns | 5 cycles 2.08 ns |
64 Bytes Stride | 18 cycles 7.50 ns | 20 cycles 8.50 ns | 22 cycles 19.17 ns | 20 cycles 8.33 ns |
256 Bytes Stride | 85 cycles 35.42 ns | 82 cycles 46.00 ns | 102 cycles 59.77 ns | 82 cycles 34.17 ns |
512 Bytes Stride | 95 cycles 39.58 ns | 94 cycles 52.00 ns | 117 cycles 68.04 ns | 94 cycles 39.17 ns |
Memory Algorithm Bandwidth(MB/s) | ||||
Compiler | 10758.44 | 7918.04 | 3178.45 | 8013.28 |
REP MOVSD | 10986.22 | 8833.47 | 3220.23 | 8620.40 |
ALU Reg Copy | 6773.55 | 5631.16 | 2789.34 | 7066.53 |
MMX Reg Copy | 7208.72 | 5880.52 | 2972.91 | 8098.63 |
MMX Reg 3dNow | - | - | - | - |
MMX Reg SSE | 11032.60 | 8398.25 | 3978.53 | 7288.34 |
SSE PAlign | 11183.76 | 8750.74 | 4128.59 | 7121.20 |
SSE PAlign SSE | 11374.73 | 8715.17 | 4390.48 | 8001.72 |
SSE2 PAlign | 10380.29 | 8749.69 | 4326.42 | 7123.08 |
SSE2 PAlign SSE | 11331.60 | 8724.84 | 4441.71 | 7985.25 |
MMX Block 4kb | 10237.07 | 7648.23 | 4063.30 | 6499.16 |
MMX Block 16kb | 10728.36 | 8515.20 | 4479.88 | 6873.16 |
SSE Block 4kb | 10165.85 | 7731.28 | 4074.79 | 6582.42 |
SSE Block 16kb | 11366.27 | 8620.84 | 4485.09 | 6890.27 |
ScienceMark是一款内存测试软件,它的测试成绩绝大多数取决于被测内存的品质。也就是说,如果我们使用同样的内存,那么两款平台的成绩差别不会太大。事实上,L1和L2的测试主要取决于处理器,这里至强X3430的成绩表现非常强劲,即便是一路领先的至强E5540在这里也没有表现出应有的能力。
【IT168评测中心】本次我们测试的是至强X3430处理器,也是未来LGA1156接口中的定位最为低端的处理器。对于LGA1156接口产品,由于是新近发布,许多朋友都有着期待,想知道它与之前的LGA1366接口Nehalem-EP相比究竟有多大区别。
为了准确定位至强X3430处理器,我们选择了至强E5502、至强E5430和至强E5540三款具有代表性的处理器作为对比,分别代表了当前低端、上一代主流和当前主流三种层次。测试中我们尽可能选择了专业的处理器测试软件,通过数据观察各款处理器之前的详细差异。
测试表明,至强X3430处理器的能力非同一般。SPEC2006测试发现,在浮点运算中它的成绩仅次于至强E5540而排到第二位,超过了E5430和E5504。在整数运算中,虽然由于处理器数量和主频双方面的原因不如E5430出色,但是多个项目中也具备和E5430抗衡的能力,依然超越了E5504的表现。
其他项目测试中,至强X3430处理器表现也很抢眼,多个项目中都处于中上游的地位。虽然在ScienceMark内存测试中表现出色,但是由于双通道内存带宽和不具备超线程技术,在与双路E5540的较量中处于下风,但是要算单颗处理器性能的话也不逊色许多。
综合本次多项处理器测试的结果,我们认为至强X3430处理器是一款性能强劲的产品,虽然定为低端,但它的表现要比至强5500系列的同类型产品好许多,单颗性能相比上一代的双路E5430处理器来说也没有绝对的劣势。作为LGA1156接口的新产品,我们觉得它在低端领域的性价比尤为突出,是中小企业在选购服务器时应该重点考虑的因素。