服务器 频道

延续Nehalem霸业 至强X3430处理器首测

  【IT168评测中心】9月初,Intel发布了面向大众用户的Core i5处理器。作为当前Core i7的低规格产品,Core i5使用了全新的LGA1156接口,面向大众消费市场。众所周知,自Core i7出现伊始,出现了叫好不叫座的情况。虽然大众对于Core i7的性能给予了充分的肯定,但是高昂的价格少有人能够接受,于是Intel推出了Core i5。


最新的LGA1156接口

  和Core i5同时出现的是基于LGA1156接口的至强X3400家族处理器,也就是我们本文要介绍的主角。以往我们看到的至强3000系列处理器多是基于LGA1366接口(部分老规格的产品基于LGA775接口),比如我们曾经测试过的W3580处理器。而至强X3400的出现可以说是至强系列的Core i5版产品。

  这次Intel推出的LGA1156至强处理器均属于面向小型企业的经济型产品,隶属于至强3000系列,一共有6款。除了L3426属于低功耗的版本之外,其余5款均为至强X3400家族成员,频率从2.4GHz到2.93GHz不等。

  我们提到过,Core i5是定位在大众市场的产品,是Core i7的补充。那么至强X3400的性能如何呢?相比我们之前测试过的至强E5500系列来说,它是否也是一款更低定位的产品?随着我们测试的展开,答案即将揭晓。

至强X3400家族规格(点击可看大图)

  这个家族最小的成员为X3430,随后是X3440、X3450、X3460和X3470,主频也从2.4GHz到2.93GHz不等。通过对比我们可以看到,家族成员在核心数量(4核心)、QPI带宽(2.5GT/s)、三级缓存(8MB)、TDP(95W)等主要方面都是一致的,包括LGA1156处理器中的一个主打卖点——Intel动态超频技术,但是在细节上还是有所差别。

  首先是超线程技术。这个Intel早就开发出来,而去年才在Nehalem上大放异彩的技术对于性能提升有着至关重要的作用,虚拟出来的4个核心性能也非常不错,我们测试过在开启和关闭超线程情况下处理器的性能差距在30%以上。不过很遗憾,至强X3430,也就是本次我们测试的这款处理器并不支持超线程技术,或许是定位太低端了。

  另外一个不是全家族具备的就是AES New Instructions,新的AES指令集。这部分内容是未来Westmere上会应用到的新技术,包括无进位乘法指令、AES扩展指令等多项内容,指令详情参见:IDF总结篇:新工艺 新技术 新概念

  除此之外,还有Intel Thermal Monitor2和Embedded也是至强X3400家族不具备的,Intel Thermal Monitor2其中简称为TM2,是一种应用在LGA 775接口上的处理器过热保护技术;而Embedded则意味着嵌入式。可以说这两种技术本身也不是至强X3400的特征。

  介绍了许多关于至强X3400家族成员的信息,相信大家已经迫不及待的要求看到事物了。下面就放出一些至强X3430处理器的图片。


LGA 1366与LGA 1156

  首先看到的是至强X5570和至强X3430的对比。很明显老大哥X5570在体积上要比X3430大许多。



   接下来大家看到的是至强X3430与Core i5的对比。我先不说哪个是至强X3430,您能看出来吗?

 

  在上面的图片中,左侧的是至强X3430,右侧的是Core i5。仔细观察一下,似乎两者没有任何的区别,同核心同工艺的产品嘛!

  接下来,我们将要对至强X3430处理器进行性能测试,测试结果会对比上一代的至强E5430和同样不支持超线程技术的至强E5504,看看LGA 1156接口的它在性能上处于什么样的层次。

  测试对比平台的详细参数如下:

测试平台、测试环境
测试分组
类别

华硕P7F-E
单路Intel Nehalem-EP
Xeon X3430

Lenovo T260 G2
单路Intel Gainestown
Xeon E5504
双路Xeon E5430基准平台
DELL PE2900 III服务器
双路Intel Harpertown
Xeon E5430
Dawning I620r-G服务器
双路Intel Gainestown
Xeon E5540
处理器子系统
处理器
单路Intel Xeon X3430单路Intel Xeon E5504双路Intel Xeon E5430
双路Intel Xeon E5540
处理器架构
Intel 45nm NehalemIntel 45nm NehalemIntel 45nm PenrynIntel 45nm Nehalem
处理器代号
Nehalem-EPGainestownHarpertownGainestown
处理器封装
Socket 1156 LGASocket 1366 LGASocke 771 LGASocket 1366 LGA
处理器规格
四核四核四核四核
处理器指令集
MMX,SSE,SSE2,SSE3,SSSE3,
SSE4.1,SSE4.2,EM64T,VT
MMX,SSE,SSE2,SSE3,SSSE3,
SSE4.1,SSE4.2,EM64T,VT
MMX,SSE,SSE2,SSE3,SSSE3,
SSE4.1,EM64T,VT
MMX,SSE,SSE2,SSE3,SSSE3,
SSE4.1,SSE4.2,EM64T,VT
主频2.4GHz2.00GHz2.66GHz2.53GHz
处理器外部总线1x QPI
1600MHz
2.5GT/s
单向2.4GB/s(每QPI)
双向4.8GB/s(每QPI)
2x QPI
2400MHz
4.8GT/s
单向9.6GB/s(每QPI)
双向19.2GB/s(每QPI)
FSB
333MHz
1333MT/s
10.6GB/s
2xQPI
2933MHz
5.86GT/s
单向11.73GB/s(每QPI)
双向23.46GB/s(每QPI)
L1 D-Cache
4x 32KB
8路集合关联
4x 32KB
8路集合关联
4x 32KB
8路集合关联
4x 32KB
8路集合关联
L1 I-Cache
4x 32KB
4路集合关联
4x 32KB
4路集合关联
4x 32KB
8路集合关联
4x 32KB
4路集合关联
L2 Cache
4x 256KB
8路集合关联
4x 256KB
8路集合关联
2x 6144KB
16路集合关联
4x 256KB
8路集合关联
L3 Cache
8MB @ 2664MHz
16路集合关联
4MB @ 1600MHz
16路集合关联
-8MB
16路集合关联
主板型号
华硕P7F-E
Intel S5500BC
DELL PE2900 III
Dawning Tylersburg-36D
芯片组
PCH:Intel 3420Intel Tylersburg-EP
IOH:Intel 5500(Tylersburg-24D)
ICH:Intel 82801JR(ICH10R)
MCH:Intel 5000X
ICH:Intel ESB6321
Intel Tylersburg-EP
IOH:Intel 5520(Tylersburg-36D)
ICH:Intel 82801JR(ICH10R)
芯片特性1x QPI
VT-d Gen 2
2x QPI
24 PCI Express Gen2 Lanes
VT-d Gen 2
2xFSB1333
12MB Snoop Filter
VT-d
2xQPI
VT-d
内存控制器
CPU集成双通道R-ECC DDR3 1366CPU集成三通道R-ECC DDR3 800
主板实现双通道
北桥集成四通道FBD DDR2 667CPU集成三通道R-ECC DDR3 1066
2GB ECC DDR3 1066 SDRAM x22GB ECC DDR3 800 SDRAM x42GB FBD DDR2 667 SDRAM x42GB R-ECC DDR3 1066 SDRAM x12
系统磁盘子系统
磁盘控制器
Intel ICH10R RAID ControllerIntel ICH10R SATA AHCI Controller
DELL Perc 5/i RAID Controller
LSI Embedded MegaRAID SAS RAID Controller
磁盘控制器规格
6x SATA 3Gb/s
MatrixRAID 0/1/3/5
6x SATA 3Gb/s
AHCI w/NCQ
8xSAS 3Gbps8xSAS 3Gbps
磁盘控制器设置
SATA 3Gb/s
AHCI w/NCQ
AHCI w/NCQ
RAID 5
RAID 0
磁盘控制器驱动
Intel Matrix Storage Manager
8.8.0.1009 x64
IMSM
8.8.0.1006
LSI SAS
3.8.0.64
LSI MegaSR
13.06.0212.2009
磁盘ST Seagate
Barracuda 7200.11
Hitachi
Deskstar P7K500
HDP725025GLA380
Seagate
Cheetah 15K.5
ST314655SS x3
Fujitsu
MBA3300RC x2
磁盘规格
7200RPM
320GB
SATA  3Gbps
NCQ
16MB Cache
7200RPM
250GB
SATA 3Gb/s w/NCQ
8MB Cache
15000RPM
146GB
SAS 3Gbps
16MB Cache
15000RPM
300GB
SAS 3Gbps
16MB Cache
磁盘设置
SATA 3Gb/s
NCQ
50GB系统分区
SATA 3Gb/s w/NCQ
50GB系统分区
SAS 3Gbps
20GB系统分区
SAS 3Gbps
50GB系统分区
软件环境
操作系统Microsoft
Windows Server 2008 Enterprise Edition SP2 x64
Microsoft
Windows Server 2008 Enterprise Edition SP1 x64
Microsoft
Windows Server 2008 Enterprise Edition SP1 x64
Microsoft
Windows Server 2008 Enterprise Edition SP1 x64

  本次测试我们选择了常见的Microsoft Windows Server 2008 Enterprise Edition x64操作系统作为平台,所有测试基于这个平台展开。

   考虑到至强X3430处理器规格的特殊性,我们在测试时选择了至强E5504、至强E5430和至强E5540三款处理器进行对比。这三款处理器分别代表了低端主力、上一代主流和当前主力三个层次,相比之下更能够看出至强X3430的定位。

  具体说来,至强E5504是Nehalem-EP架构下的至强5500系列处理器,和X3430一样它也不支持超线程功能(SMT),主频为2.0GHz。至强E5430是上一代至强5400系列的主流产品,主频为2.53GHz,而且我们测试平台使用的是双路处理器,检验相比上一代的两款处理器来说,至强X3430是否有优势。最后我们选择的处理器是至强E5540处理器,这是Nehalem-EP系列的主流产品,支持超线程技术,主频为2.53GHz。

  SPEC CPU 2006 v1.0.1

  SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。

  SPEC CPU 2006是SPEC组织推出的CPU子系统评估软件最新版,我们之前使用的是SPEC CPU 2000。和上一个版本一样,SPEC CPU 2006包括了CINT2006和CFP2006两个子项目,前者用于测量和对比整数性能,而后者则用于测量和对比浮点性能,SPEC CPU 2006中对SPEC CPU 2000中的一些测试进行了升级,并抛弃/加入了一些测试,因此两个版本测试得分并没有可比较性。

  SPEC CPU测试中,测试系统的处理器、内存子系统和使用到的编译器(SPEC CPU提供的是源代码,并且允许测试用户进行一定的编译优化)都会影响最终的测试性能,而I/O(磁盘)、网络操作系统和图形子系统对于SPEC CPU2006的影响非常的小。

  SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、DCC以及科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。

  我们在被测服务器中安装了当前最新版本的Intel C++ 10.1.025 Compiler、Intel Fortran 10.1.025 Compiler这两款SPEC CPU 2006必需的编译器,通过最新出现的QxS编译参数,Intel Compiler 10版本开始支持对Intel SSE4指令集进行优化(假如只支持SSE3,则使用QxT编译参数)。我们另外安装了Microsoft Visual Studio 2003 SP1提供必要的库文件。按照SPEC的要求我们根据自己的情况编辑了新的Config文件,使用了较多的编译选项。我们根据被测系统选择实际可同时处理的线程数量,最后得到SPEC rate base测试结果(基于base标准编译,SPEC base rate测试代表系统同时处理多个任务的能力)。

  和其它测试部件不同,SPEC CPU 2006需要大量的系统物理内存,我们的SPEC测试在64bit Windows Server 2008 Enterprise下完成,对于每个运算核心,配置1.5GB内存。

  • SiSoftware Sandra v2009

  SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。从2007开始,Sandra的Arithmetic benchmarks增加了对SSE3 & SSE4 SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,另外还升级了File System benchmark和Removable Storage benchmark两个子项目。对于新的硬件的支持当然也是该软件每次升级的重要内容之一。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台,这也是我们选择这款软件的原因之一。

  • CineBench R10

  CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,在服务器测试平台中显示子系统不重要,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。

因为是ES测试版,所以CPU-Z的识别也不是清楚

Cache设置,这个与Core  i7是一致的

单芯片的P7F-E,看不到芯片的型号,只有编号

X3420芯片组只能支持双通道内存,我们使用了双通道

一共有6条内存插槽 

  本次测试我们选用的处理器为ES工程样品,因此在CPU-Z中识别有些问题。事实上,这是颗至强X3430处理器,主频为2.4GHz。下面的EVEREST软件会给出这款处理器的详细规格。



  相比CPU-Z来说,EVEREST软件给出的信息更为全面。这款至强X3430处理器的身份也得到了证实。它是Intel今年第三季度新推出的处理器,面向单路中小型服务器市场。X3430的主频为2.4GHz,三级缓存为8MB,标称TDP为45W。可惜的是,它不能够支持超线程技术,而我们知道对于Nehalem架构来说,超线程会对性能有明显的提升。

  SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,它可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台。我们利用了其中多个性能测试模块对于被测系统的性能进行了快速的测试。

SiSoftware Sandra Pro Business 2009
测试对象
至强X3430
至强E5504双路至强E5430双路至强E5540
Processor Arithmetic Benchmark
处理器架构测试
Dhrystone ALU
62244MIPS
49318MIPS91006MIPS130767MIPS
Dhrystone ALU vs SPEED
25.93MIPS/MHz
24.66MIPS/MHz34.21MIPS/MHz51.75MIPS/MHz
Whetstone iSSE3
29187MFLOPS
26064MFLOPS78385MFLOPS68158MFLOPS
Dhrystone iSSE3 vs SPEED
12.16MFLOPS/MHz
13.03MFLOPS/MHz29.47MFLOPS/MHz26.97MFLOPS/MHz
Processor Multi-Media Benchmark
处理器多媒体测试
Multi-Media Int x16 iSSE4.1
106.74MPixel/s
84.83MPixel/s
-228.02MPixel/s
Multi-Media Int x16 iSSE4.1 vs SPEED
44.48kPixels/s/MHz
42.41kPixel/s/MHz
-90.23kPixels/s/MHz
Multi-Media Float x8 iSSE2
81.28MPixel/s
64.72MPixel/s
-172.03MPixel/s
Multi-Media Float x8 iSSE2 vs SPEED
33.87kPixels/s/MHz
32.36kPixels/s/MHz
-68.08kPixels/s/MHz
Multi-Media Double x4 iSSE2
42.24MPixel/s
33.81MPixel/s
-89.72MPixel/s
Multi-Media Double x4 iSSE2 vs SPEED
17.60kPixels/s/MHz
16.91kPixels/s/MHz
-35.50kPixels/s/MHz
Multi-Core Efficiency Benchmark
Inter-Core Bandwidth
13.27GB/s
9.73GB/s20.54GB/s25.88GB/s
Inter-Core Bandwidth vs SPEED
5.66MB/s/MHz
4.98MB/s/MHz7.91MB/s/MHz10.49MB/s/MHz
Inter-Core Latency
(越小越好)
60ns
74ns90ns58ns
Inter-Core Latency vs SPEED
(越小越好)
0.03ns/MHz
0.04ns/MHz0.03ns/MHz0.02ns/MHz
.NET Arithmetic Benchmark
.NET架构测试
Dhrystone .NET
11567MIPS
8103MIPS10562MIPS28774MIPS
Dhrystone .NET vs SPEED
4.82MIPS/MHz
4.05MIPS/MHz3.97MIPS/MHz11.39MIPS/MHz
Whetstone .NET
26730MFLOPS
17394MFLOPS45399MFLOPS44516MFLOPS
Whetstone .NET vs SPEED
11.14MFLOPS/MHz
8.70MFLOPS/MHz17.07MFLOPS/MHz17.62MFLOPS/MHz
.NET Multi-Media Benchmark
.NET多媒体测试
Multi-Media Int x1 .NET
21.93MPixel/s
17.02MPixel/s31.28MPixel/s46.38MPixel/s
Multi-Media Int x1 .NET vs SPEED
9.14kPixels/s/MHz
8.51kPixels/s/MHz11.76kPixels/s/MHz18.35kPixels/s/MHz
Multi-Media Float x1 .NET
7.26MPixel/s
4.99MPixel/s8.68MPixel/s13.30MPixel/s
Multi-Media Float x1 .NET vs SPEED
3.03kPixels/s/MHz
2.49kPixels/s/MHz3.26kPixels/s/MHz5.26kPixels/s/MHz
Multi-Media Double x1 .NET
11.82MPixel/s
9.28MPixel/s24.75MPixel/s24.73MPixel/s
Multi-Media Double x1 .NET vs SPEED
4.92kPixels/s/MHz
4.64kPixels/s/MHz9.30kPixels/s/MHz9.79kPixels/s/MHz

  处理器架构性能测试分为处理器和内存两部分,首先我们看到的是处理器性能。我们对比前两项——至强X3430和至强E5504。从测试结果来看,许多项目至强X3430都处于领先优势,领先幅度也很明显,大概是20-40%左右。而第三项使用的是上一代的至强E5430处理器,双路配置。除了多媒体测试E5430没有相关成绩之外,其他测试至强X3430虽然大部分处于下风,但要是衡量单颗处理器的性能,至强X3430还是要高一些。

  最后对比至强E5540处理器,虽然同是Nehalem架构,不过至强E5540支持超线程技术,也就是说实际上第四项系统中有16个处理器核心(8个处理器核心为虚拟),在这种情况下,两者的性能差距也不过就是1:2 的比例。由此看来至强X3430性能还是很强劲的。

  SiSoftware Sandra缓存内存测试主要包括内存带宽、内存延迟等性能的测试。

SiSoftware Sandra Pro Business 2009
测试对象
至强X3430
至强E5504至强E5430 双路至强E5540 双路
Memory Bandwidth Benchmark
内存带宽测试
Int Buff'd iSSE2 Memory Bandwidth
13.78GB/s
9.98GB/s
-32.59GB/s
Float Buff'd iSSE2 Memory Bandwidth
13.77GB/s
9.98GB/s
-32.59GB/s
Memory Latency Benchmark
内存延迟测试
Memory(Random Access) Latency
(越小越好)
89ns
108ns108ns92ns
Speed Factor
(越小越好)
57.50
52.5095.2057.90
Internal Data Cache
4clocks
4clocks3clocks4clocks
L2 On-board Cache
9clocks
10clocks18clocks10clocks
L3 On-board Cache
47clocks
48clocks-51clocks
Cache and Memory Benchmark
缓存及内存测试
Cache/Memory Bandwidth
51.08GB/s
36.81GB/s68.88GB/s120.64GB/s
Cache/Memory Bandwidth vs SPEED
21.79MB/s/MHz
18.85MB/s/MHz26.52MB/s/MHz48.89MB/s/MHz
Speed Factor
(越小越好)
27.10
33.40111.9023.10
Internal Data Cache
205.08GB/s
163.13GB/s421.23GB/s401.21GB/s
L2 On-board Cache
175.49GB/s
137.45GB/s122.68GB/s362.61GB/s

  内存测试的性能更多体现出各个测试平台之间内存控制器和内存通道数量的差异。整体来看,拥有三通道的至强E5540性能处于最强地位,同样是至强5500系列的至强E5504由于测试主板只能支持双通道,因此性能有所下滑,在许多测试中不如至强X3430的水平。性能较低的是至强E5430,只能支持双通道、通过北桥整合内存控制器的它除了在个别项目中依靠处理器数量的帮助获得领先之外,更多的时候成绩垫底。

  SPEC CPU 2006的浮点运算测试包括的全部都是科学运算,科学运算需要用到大量的高精度浮点数据,如410.bwaves 流体力学、416.gamess 量子化学、433.milc 量子力学、434.zeusmp 物理:计算流体力学、435.gromacs 生物化学/分子力学、436.cactusADM 物理:广义相对论、437.leslie3d 流体力学、444.namd 生物/分子、447.dealII 有限元分析、450.soplex 线形编程、优化、453.povray 影像光线追踪、454.calculix 结构力学、459.GemsFDTD 计算电磁学、465.tonto 量子化学、470.lbm 流体力学、481.wrf 天气预报、482.sphinx3 语音识别共17项测试。

SPEC CPU 2006浮点运算性能

   首先是浮点运算性能,这里出现了和至强SisoftWare测试中类似的情况。凭借着处理器的数量和超线程功能两项优势,至强E5540一路遥遥领先,其次是至强E5430和至强X3430,相比之下至强X3430领先的时候更多一些。至强E5504在测试中排名最后,主频过低决定了它的末尾地位。

  SPEC CPU 2006整数运算主要包含编译、压缩、人工智能、视频压缩转换、XML处理等,此外,各种日常操作也主要是基于整数操作。SPEC CPU 2006的整数运算包含了400.perlbench PERL编程语言、401.bzip2 压缩、403.gcc C编译器、429.mcf 组合优化、445.gobmk 人工智能:围棋、456.hmmer 基因序列搜索、458.sjeng 人工智能:国际象棋、462.libquantum 物理:量子计算、464.h264ref 视频压缩、471.omnetpp 离散事件仿真、473.astar 寻路算法、483.xalancbmk XML处理共12项。

 
SPEC CPU 2006整数运算性能

  整数性能测试中,业内知名的还是至强E5540,不过第二的位置发生了一些变化,至强E5430凭借着处理器数量和主频的优势在多个项目中领先于至强X3430,显然至强E5502的成绩依然垫底。

  CineBench R10

  CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,我们的平台偏向于服务器多一些,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。


至强X3430处理器测试成绩

CineBench R10
处理器
至强X3430
至强E5504至强E5430 双路至强E5540 双路
CPU Benchmark
Rendering (1 CPU)3868 CB-CPU2868 CB-CPU2931 CB-CPU3640 CB-CPU
Rendering (x CPU)
12964 CB-CPU
10559 CB-CPU
16806 CB-CPU24275 CB-CPU
Multiprocessor Speedup
3.35x
3.68x
5.73x6.67x
OpenGL Benchmark
OpenGL Standard
7690 CB-GFX
158 CB-GFX
176 CB-GFX188 CB-GFX

  我们只查看处理器性能部分,由于至强X3430使用了Quadro FX580专业卡,所以显卡的测试结果很高。事实上我们看到,至强X3430的单处理器成绩在几个对比平台中是最高的,其次是至强E5540,至强E5504和至强E5430的成绩比较接近,虽然E5504的架构先进一些,可惜低主频拉底了分数。

  多处理器情况下,至强E5540的成绩超出其他很多,16个处理器核心果然性能强劲;接下来的8个核心的至强E5430,双路平台在这个项目中明显胜出。相比之下,至强X3430由于只有单处理器,又没有超线程技术,在这个测试中就显得疲软了一些,不过依然高于至强E5502。

  ScienceMark v2.0是一款用于测试系统特别是处理器在科学计算应用中的性能的软件,MemBenchmark是其中针对处理器缓存、系统内存而设计的功能模块,它可以测试系统内存带宽、L1 Cache延迟、L2 Cache延迟和系统内存延迟,另外还可以测试不同指令集的性能差异。

ScienceMark Membench
产品型号
至强X3430
至强E5504至强E5430 双路至强E5540 双路
内存技术参数2GB ECC DDR3-1066 SDRAM x21GB DDR3-1066 SDRAM x24GB R-ECC DDR3-1333 SDRAM x62GB R-ECC DDR3-1066 SDRAM x12
L1带宽(MB/s)83802.7447877.4155376.1647705.89
L2带宽(MB/s)32614.7919596.0516757.5519499.26
内存带宽(MB/s)11374.738833.574485.098620.40
L1 Cache Latency(ns)
32 Bytes Stride0.83 ns1.50 ns1.13 ns0.79
L1 Algorithm Bandwidth(MB/s)
Compiler71005.1342198.8825201.9642272.23
REP MOVSD76114.7743498.5225467.1543279.73
ALU Reg Copy21257.2912067.1013093.6512024.42
MMX Reg Copy40852.6024173.0525242.1923374.45
SSE PAlign83711.9947830.3252826.2147567.95
SSE2 PAlign83802.7447877.4155376.1647572.00
L2 Cache Latency(ns)
4 Bytes Stride2 cycles
1.25 ns
4 cycles
2.00 ns
3 cycles
1.13 ns
3 cycles
1.19 ns
16 Bytes Stride3 cycles
1.25 ns
4 cycles
2.00 ns
3 cycles
1.50 ns
3 cycles
1.19 ns
64 Bytes Stride8 cycles
3.33 ns
10 cycles
5.00 ns
8 cycles
4.51 ns
9 cycles
3.56 ns
256 Bytes Stride8 cycles
3.33 ns
9 cycles
4.50 ns
8 cycles
4.51 ns
8 cycles
3.17 ns
512 Bytes Stride7 cycles
2.92 ns
8 cycles
4.00 ns
7 cycles
4.89 ns
8 cycles
2.77 ns
L2 Algorithm Bandwidth(MB/s)
Compiler29772.5417957.5811609.5718042.06
REP MOVSD32614.7919596.0512140.0019499.26
ALU Reg Copy14651.018778.569273.718766.52
MMX Reg Copy23430.7614063.1712042.4513988.43
SSE PAlign31210.9918656.4214314.3418664.20
SSE2 PAlign31158.2118677.1914289.8818664.20
Memory Latency(ns)
4 Bytes Stride3 cycles
1.25 ns
4 cycles
2.00 ns
3 cycles
1.13 ns
3 cycles
1.25 ns
16 Bytes Stride4 cycles
1.67 ns
5 cycles
2.50 ns
5 cycles
4.89 ns
5 cycles
2.08 ns
64 Bytes Stride18 cycles
7.50 ns
20 cycles
8.50 ns
22 cycles
19.17 ns
20 cycles
8.33 ns
256 Bytes Stride85 cycles
35.42 ns
82 cycles
46.00 ns
102 cycles
59.77 ns
82 cycles
34.17 ns
512 Bytes Stride95 cycles
39.58 ns
94 cycles
52.00 ns
117 cycles
68.04 ns
94 cycles
39.17 ns
Memory Algorithm Bandwidth(MB/s)
Compiler10758.447918.043178.458013.28
REP MOVSD10986.228833.473220.238620.40
ALU Reg Copy6773.555631.162789.347066.53
MMX Reg Copy7208.725880.522972.918098.63
MMX Reg 3dNow----
MMX Reg SSE11032.608398.253978.537288.34
SSE PAlign11183.768750.744128.597121.20
SSE PAlign SSE11374.738715.174390.488001.72
SSE2 PAlign10380.298749.694326.427123.08
SSE2 PAlign SSE11331.608724.844441.717985.25
MMX Block 4kb10237.077648.234063.306499.16
MMX Block 16kb10728.368515.204479.886873.16
SSE Block 4kb10165.857731.284074.796582.42
SSE Block 16kb11366.278620.844485.096890.27

  ScienceMark是一款内存测试软件,它的测试成绩绝大多数取决于被测内存的品质。也就是说,如果我们使用同样的内存,那么两款平台的成绩差别不会太大。事实上,L1和L2的测试主要取决于处理器,这里至强X3430的成绩表现非常强劲,即便是一路领先的至强E5540在这里也没有表现出应有的能力。

  【IT168评测中心】本次我们测试的是至强X3430处理器,也是未来LGA1156接口中的定位最为低端的处理器。对于LGA1156接口产品,由于是新近发布,许多朋友都有着期待,想知道它与之前的LGA1366接口Nehalem-EP相比究竟有多大区别。

  为了准确定位至强X3430处理器,我们选择了至强E5502、至强E5430和至强E5540三款具有代表性的处理器作为对比,分别代表了当前低端、上一代主流和当前主流三种层次。测试中我们尽可能选择了专业的处理器测试软件,通过数据观察各款处理器之前的详细差异。

  测试表明,至强X3430处理器的能力非同一般。SPEC2006测试发现,在浮点运算中它的成绩仅次于至强E5540而排到第二位,超过了E5430和E5504。在整数运算中,虽然由于处理器数量和主频双方面的原因不如E5430出色,但是多个项目中也具备和E5430抗衡的能力,依然超越了E5504的表现。

  其他项目测试中,至强X3430处理器表现也很抢眼,多个项目中都处于中上游的地位。虽然在ScienceMark内存测试中表现出色,但是由于双通道内存带宽和不具备超线程技术,在与双路E5540的较量中处于下风,但是要算单颗处理器性能的话也不逊色许多。

  综合本次多项处理器测试的结果,我们认为至强X3430处理器是一款性能强劲的产品,虽然定为低端,但它的表现要比至强5500系列的同类型产品好许多,单颗性能相比上一代的双路E5430处理器来说也没有绝对的劣势。作为LGA1156接口的新产品,我们觉得它在低端领域的性价比尤为突出,是中小企业在选购服务器时应该重点考虑的因素。

0
相关文章