服务器 频道

最强Nehalem处理器 至强W5580深入评测

  【IT168评测中心】Intel推出新的Nehalem架构已经有近一年的时间了,作为一款新架构的处理器,Nehalem目前仍然是出于“非全线推出”的状态,其产品线在笔记本系列、桌面系列乃至服务器系列都尚有一些“空白”。不过,在已经推出的产品线上,Nehalem都获得了很大的成功。


Nehalem Xeon 5500系列处理器
 

Nehalem-EP/Nehalem-WS Xeon规格对照表

  Nehalem自从3月底推出服务器产品线的Nehalem-EP处理器(附带平台)后,我们已经有了相当多的Nehalem-EP评测,对这款处理器也有了很详细的理解,不过,出了服务器之外,在企业级别应用上还有一个领域,Nehalem也为其“定制”了一个系列处理器产品,这就是工作站应用,对应的Nehalem就是Nehalem-WS系列,WS就是Workstation工作站的意思。


Nehalem-WS 2S Xeon W5580处理器

  我们可以看到,在规格表上,Nehalem-WS 2S Xeon W5580大概是最高的一款处理器,它的频率高达3.20GHz——它的价格也是最贵的,发售时千颗售价$1600,也就是说要约一万人民币以上一颗,它的性能如何呢?

Intel Nehalem-EP处理器首发深度评测

工作站专用至强 Nehalem-WS处理器解析

Intel Nehalem-EP处理器首发深度评测

直联架构的威力 Nehalem-EP处理器解析

Nehalem-EP 新Xeon 5500处理器首度曝光

透视六核心至强 Dunnington处理器解析

透视八核心至强 Nehalem-EX处理器解析

2008年度评测报告:深入Nehalem微架构

性能大幅提升 Core i7 服务器应用测试

再攀性能之巅 Intel全新酷睿i7深度评测

机密揭露:Intel超线程技术有多少种?

[IDF08]基辛格演讲:Nehalem集群演示

  要了解Nehalem-WS(工作站版本)和普通的Nehalem(桌面版本)和Nehalem-EP(服务器版本)有什么不同,就要先知道Nehalem上实现了的一种新的能耗比控制技术:Turbo Mode,或者叫做Turbo Boosting,这种技术在笔记本上曾经出现过(2007年的Santa Rosa平台:Intel Dynamic Acceleration Technology英特尔动态加速技术)。作用就是当Nehalem一些核心处于空闲状态,被Power Gate关闭之后,剩余的核心可以动态提升频率以提升负载的响应能力。当然,在操作系统配合的情况下,也可能实现将其他核心上的进程迁移、集中到某一个或几个核心上,并关闭其他核心来降低功耗、提升负载响应能力。虽然目前看起来还没有什么操作系统很好地实现了该功能。

Intel Nehalem-EP处理器首发深度评测


通常状态


例子:两个核心关闭,两个核心被Turbo Boost

   如上图:关闭两个核心,剩下的两个核心提升了工作频率,降低了总功耗。实际上有点像一个官方的超频功能。


Core i7 Turbo Boosting
 
  提升的频率是以倍频为单位的,如Core i7在Turbo Boosting的时候,倍频就从标准的20提升到21,处理器的主频就从默认的2.66GHz(133 x 20)提升到了2.8GHz(133 x 21)。


TDP允许的情况下,所有的核心都被Turbo Boost

  并不是只有两个核的频率可以Turbo Boost,在所有核都繁忙的情况下,Core i7可以让所有的核心都提升频率,也就是说,这时候相当于一个2.80GHz的四核八线程Nehalem。在只有一个核繁忙的情况下,这个核可以提升到2.93GHz,也就是提升了2个倍频。


TDP允许的情况下,部分核心允许更进一步地Turbo Boost

  作为比桌面系列更贵的产品,Xeon至强处理器在其他条件一致的情况下具有更多的增强功能,如Turbo Boost就是:它可以最多提升400MHz(单个或者两个核心),在所有核心都满负荷的时候,它们能让频率最多提升266MHz,是桌面系列的两倍。当然,这一些都需要TDP容许——也就是散热系统允许。

  TDP(Thremal Design Power,热设计功耗)是一个很重要的要素,它影响着Turbo Boost的能力,先看下图:


Intel Nehalem-EP/Nehalem-WS规格表

  可以看出,不同TDP的处理器具有不同的Turbo Boost能力,最低的Xeon L系列只能提升133MHz,中等的E系列则能提升266MHz,而最高的W系列和X系列则可以达到400MHz。在所有核心都提升的情况下幅度有所降低。此外,并不是所有的处理器都具有Turbo Mode功能,在Xeon 5500系列处理器当中,只有最后一位数字为0的处理器具备超线程技术和Turbo Mode,为其他数字的则没有。一开始,桌面版本的Nehalem也是没有超线程技术和Turbo Mode的,后来Intel改变了主意,这个举动应该是为了刺激市场,通过培养消费者来扩展它们的应用领域。Core i7的Turbo Boost能力如前面所述,为单个核心133MHz,虽然它的TDP和Nehalem-WS系列一样为130W(Nehalem-WS 1S为单个或双个核心266MHz)。


Nehalem-WS 1S Xeon W3570:单核心Turbo Boost为266MHz
 

Nehalem-WS 1S Xeon W3570:四核心Turbo Boost为133MHz


Nehalem-EP Xeon X5570:单核心Turbo Boost为266MHz


Nehalem-EP Xeon X5570:四核心Turbo Boost为400MHz

   可见,工作站版本的W35x0系列要比桌面版本具有更高的Turbo Boost值——而双路服务器版本又比单路工作站具有更高的Turbo Boost值。虽然大家可能会猜想频率最高的双路工作站版本W5580会具有最强的Turbo Boost值,但实际上不是:


Nehalem-WS 2S Xeon W5580:单核心Turbo Boost为……133MHz
 

Nehalem-WS 2S Xeon W5580:四核心Turbo Boost为……0MHz

  实际上,双路Nehalem-WS 2S Xeon W5580无法所有核心都Turbo Boost,只能单核心Turbo Boost 133MHz——不仅比不上单路工作站版本Nehalem-WS 1S,甚至还不如桌面版本Core i7。这一点很难理解,如果是单路应用的话,Xeon W3570才是最强的,而双路应用的话,在重负荷的时候Xeon X5570和Xeon W5580是一样的。

 
Nehalem-WS 2S W5580也属于Xeon至强 5500系列

  对于W5580来说,Turbo Boost看起来算是一个赠品。和桌面版本的Core i7相比,Nehalem-WS还有着其他的特性,如支持R/ECC内存,后一个特性在追求稳定性的时候是必须的,长期工作的机器难免会因为过热不稳定而发生内存错误,ECC可以大为降低这个特性。历来高端的Intel平台都是支持ECC的(如875X、975X芯片组),但是早期出厂的Core i7并不支持,这是从性能方面的考虑——ECC会增加一点延迟,Intel提及Core i7未来会提供ECC的支持。


一条Unbuffered ECC DDR3内存(数一下内存颗粒数量?),正好适合Core i7使用

  除了ECC之外,R——Registered,意为寄存器或目录寄存器(不过很少用中文称呼),在内存上的作用就像一个目录,Registered内存在接到读写指令时,会先检索此目录,然后再进行读写操作。拥有Registers功能的内存模组,可以通过重新驱动控制信号来改善内存的运作,提高电平信号的准确性,从而有助于保持系统长时间稳定运作。不过,由于Registered的信号重驱动需花费一个时钟周期,延迟时间有所增加,因此具有该功能内存的读写性能同样会稍低于普通内存。此外,由于时序的变化,Registered内存需要内存控制器的支持(当然,ECC也需要内存控制器的支持)。


红框内是R-ECC内存比普通内存多出的部分:一个额外的ECC内存芯片(大)、一个Register芯片(中)、一个PLL芯片(小)

  对于普通人而言,Registered最大的作用是支持更大容量的内存:由于信号具有更高的稳定性,支持Registered通常会让内存支持翻倍。Registered在内存上缓存读写时钟信号并再次驱动内存芯片,获得更好的电气性能,从而支持更多的内存芯片。Core i7就只能支持24GB的容量,而支持Registered内存的单Xeon可以轻松达到48GB到72GB。

  提到通常的Unbuffered内存和Registered内存,人们就会想到有没有Buffered内存和Unregistered内存呢?有的,其实Buffered/Registered(缓存器/寄存器)都是Registered内存的工作方式,Buffered采用时钟异步方式工作,而后来发展的Registered采用时钟同步方式工作,后者的性能更好,因此Buffered模式逐渐消失了(因此,Unregistered这个词没什么意义)。

  Xeon并不是全线都支持R/ECC技术——它全线支持ECC技术,但是只有Nehalem-EP Xeon支持Registered内存。Nehalem-WS Xeon并不支持Registered内存。


一块Xeon W5580,外观上就和通常的LGA1366 Nehalem差不多

注:PLL(Phase Locked Loop,锁相环)是一种反馈电路,其作用是使得电路上的时钟和某一外部时钟(也就是内存条间)的相位同步。

测试平台、测试环境
测试分组
类别
DELL Precision T5500工作站
双路Intel Gainestown
Xeon W5580
ASUS RS700-E4服务器
双路Intel Gainestown
Xeon X5570
DELL PE 2900 III基准
双路Intel Harpertown
Xeon E5430
处理器子系统
处理器双路Intel Xeon W5580双路Intel Xeon X5570双路Intel Xeon E5430
处理器架构Intel 45nm NehalemIntel 45nm NehalemIntel 45nm Penryn
处理器代号Gainestown
(Nehalem-WS 2S)
Gainestown
(Nehalem-EP)
Harpertown
处理器封装Socket 1366 LGASocket 1366 LGASocke 771 LGA
处理器规格四核四核四核
处理器指令集MMX,SSE,SSE2,SSE3,SSSE3,
SSE4.1,SSE4.2,EM64T,VT
MMX,SSE,SSE2,SSE3,SSSE3,
SSE4.1,SSE4.2,EM64T,VT
MMX,SSE,SSE2,SSE3,SSSE3,
SSE4.1,EM64T,VT
主频3.20GHz2.93GHz2.66GHz
Turbo Boost主频
(四核心)
3.20GHz(+0MHz)3.20GHz(+266MHz)-
Turbo Boost
主频
(单/双核)
3.333GHz(+133MHz)3.333GHz(+400MHz)-
处理器外部总线2x QPI
3200MHz
6.40GT/s
单向12.8GB/s(每QPI)
双向25.6GB/s(每QPI)
2x QPI
3200MHz
6.40GT/s
单向12.8GB/s(每QPI)
双向25.6GB/s(每QPI)
FSB
333MHz
1333MT/s
10.6GB/s
L1 D-Cache4x 32KB
8路集合关联
4x 32KB
8路集合关联
4x 32KB
8路集合关联
L1 I-Cache4x 32KB
4路集合关联
4x 32KB
4路集合关联
4x 32KB
8路集合关联
L2 Cache4x 256KB
8路集合关联
4x 256KB
8路集合关联
2x 6144KB
16路集合关联
L3 Cache8MB @ 2668.7MHz
16路集合关联
8MB @ 2668.7MHz
16路集合关联
 
主板
主板型号DELL Precision T5500ASUS Z8PS-D12-1UDELL PE 2900 III
芯片组Intel Tylersburg-EP
IOH:Intel 5500(Tylersburg-24D)
ICH:Intel 82801JR(ICH10R)
Intel Tylersburg-EP
IOH:Intel 5520(Tylersburg-36D)
ICH:Intel 82801JR(ICH10R)
MCH:Intel 5000X
ICH:Intel ESB6321
芯片特性2x QPI
24 PCI Express Gen2 Lanes
VT-d Gen 2
2x QPI
36 PCI Express Gen2 Lanes
VT-d Gen 2
2x FSB1333
PCI Express Gen1 Lanes
12MB Snoop Filter
VT-d Gen 1
内存控制器每CPU集成三通道R-ECC DDR3 1333每CPU集成三通道R-ECC DDR3 1333北桥集成四通道FBD DDR2 667
内存4GB R-ECC DDR3 1333 SDRAM x64GB R-ECC DDR3 1333 SDRAM x62GB FBD DDR2 667 SDRAM x4
系统磁盘子系统
磁盘控制器Intel ICH10R SATA AHCI ControllerLSI Embedded MegaRAID SAS RAID ControllerDELL Perc 5/i RAID Controller
磁盘控制器规格6x SAS 3Gb/s
AHCI w/ NCQ
RAID 0/1/3/5
8x SAS 3Gb/s
RAID 0/1
LSI 1068 SAS
Intel IOP333
500MHz ARM
256MB RAM
8x SAS 3Gb/s
RAID 0/1/3/5
磁盘控制器设置AHCI w/ NCQRAID 0RAID 5
磁盘控制器驱动Intel Matrix Storage Manager 8.8.0.1009LSI MegaSR
13.06.0212.2009
LSI SAS
3.8.0.64
磁盘WesternDigital
VelociRaptor
WD1600HLFS
Fujitsu
MBA3300RC x2
Seagate
Cheetah 15K.5
ST314655SS x3
磁盘规格10000RPM
160GB
SATA 3Gb/s
NCQ
16MB Cache
15000RPM
300GB
SAS 3Gb/s
NCQ
16MB Cache
15000RPM
146GB
SAS 3Gb/s
NCQ
16MB Cache
磁盘设置SATA 3Gb/s
NCQ
50GB系统分区
SAS 3Gb/s
NCQ
50GB系统分区
SAS 3Gb/s
NCQ
20GB系统分区
软件环境
操作系统Microsoft
Windows Server 2008 Enterprise Edition SP1 x64
Microsoft
Windows Server 2008 Enterprise Edition SP1 x64
Microsoft
Windows Server 2008 Enterprise Edition SP1 x64

  从最前面的处理器子系统参数对比可以看出,Xeon W5580和Xeon X5570在Turbo Boost工作的时候是完全一样的,只有在非Turbo Boost状态下,W5580才表现出频率上的优势。而其他从L3到内存控制器的外围参数都是一样(这部分就是通常说的Uncore部分)。


DELL Presicion T5500工作站,支持双路W5580处理器

  测试使用了一台DELL Presicion T5500工作站,配合专门的Nehalem-WS 2S Xeon W5580倒也正合适——不过真正的原因是手上的服务器或服务器主板都不支持W5580。笔者自用的ASUS P6T Deluxe倒是可用W5580,只是它不支持双路处理器。

  由于Nehalem-WS 2S Xeon W5580和Nehalem-EP Xeon X5570就是核心工作频率上的不同,因此我们的测试主要针对处理器性能来进行:

  • SiSoftware Sandra v2009

  SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。从2007开始,Sandra的Arithmetic benchmarks增加了对SSE3 & SSE4 SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,另外还升级了File System benchmark和Removable Storage benchmark两个子项目。对于新的硬件的支持当然也是该软件每次升级的重要内容之一。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台,这也是我们选择这款软件的原因之一。

  • CineBench R10

  CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,在服务器测试平台中显示子系统不重要,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。

  • SPEC CPU 2006 v1.0.1

  SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。

  SPEC CPU 2006是SPEC组织推出的CPU子系统评估软件最新版,我们之前使用的是SPEC CPU 2000。和上一个版本一样,SPEC CPU 2006包括了CINT2006和CFP2006两个子项目,前者用于测量和对比整数性能,而后者则用于测量和对比浮点性能,SPEC CPU 2006中对SPEC CPU 2000中的一些测试进行了升级,并抛弃/加入了一些测试,因此两个版本测试得分并没有可比较性。

  SPEC CPU测试中,测试系统的处理器、内存子系统和使用到的编译器(SPEC CPU提供的是源代码,并且允许测试用户进行一定的编译优化)都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2006的影响非常的小。

  SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、DCC以及科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。

  我们在被测服务器中安装了当前最新版本的Intel C++ 10.1.025 Compiler、Intel Fortran 10.1.025 Compiler这两款SPEC CPU 2006必需的编译器,通过最新出现的QxS编译参数,Intel Compiler 10版本开始支持对Intel SSE4指令集进行优化(假如只支持SSE3,则使用QxT编译参数)。我们另外安装了Microsoft Visual Studio 2003 SP1提供必要的库文件。按照SPEC的要求我们根据自己的情况编辑了新的Config文件,使用了较多的编译选项。我们根据被测系统选择实际可同时处理的线程数量,最后得到SPEC rate base测试结果(基于base标准编译,SPEC base rate测试代表系统同时处理多个任务的能力)。

  和其它测试部件不同,SPEC CPU 2006需要大量的系统物理内存,我们的SPEC测试在64bit Windows Server 2008 Enterprise下完成,对于每个运算核心,最低配置1.5GB内存。

 

 

 

 

 

 

 

 

 

  SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,它可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台。我们利用了其中多个性能测试模块对于被测系统的性能进行了快速的测试。

  有一点需要说明的是,Sandra的处理器架构性能测试是根据处理器所能支持的所有指令集中选择进行的,不同的处理器支持的指令集不同,测试使用到的指令集也就不同。例如,Nehalem在这个测试当中就可以使用SSE4.2,而Penryn就只能使用SSE4.1,而用Opteron可能就只能到SSE3了。一般而言,由于可以使用SSE4,Intel的处理器理论性能会比较好。

SiSoftware Sandra Pro Business 2009
测试对象
DELL Precision T5500
双路Intel Gainestown
Xeon W5580
3.20GHz
Intel Nehalem-EP
双路Intel Gainestown
Xeon X5570
2.93GHz
DELL PE2900 III
双路Intel Harpertown
Xeon E5430
2.66GHz
Processor Arithmetic Benchmark
处理器架构测试
Dhrystone ALU
155443MIPS142977MIPS91006MIPS
Dhrystone ALU vs SPEED
48.70MIPS/MHz48.75MIPS/MHz34.21MIPS/MHz
Whetstone iSSE3
132174MFLOPS124035MFLOPS78385MFLOPS
Dhrystone iSSE3 vs SPEED
41.41MFLOPS/MHz42.29MFLOPS/MHz29.47MFLOPS/MHz
Processor Multi-Media Benchmark
处理器多媒体测试
Multi-Media Int x16 iSSE4.1
322.93MPixel/s296.85MPixel/s 
Multi-Media Int x8 iSSE4.1
  199.33MPixel/s
Multi-Media Int x16 iSSE4.1 vs SPEED
101.17MPixel/s/MHz101.21MPixel/s/MHz 
Multi-Media Int x8 iSSE4.1 vs SPEED
  74.94MPixel/s/MHz
Multi-Media Float x8 iSSE2
248.18MPixel/s228.24MPixel/s 
Multi-Media Float x4 iSSE2
  108.69MPixel/s
Multi-Media Float x8 iSSE2 vs SPEED
77.75kPixels/s/MHz77.82kPixels/s/MHz 
Multi-Media Float x4 iSSE2 vs SPEED
  40.86kPixels/s/MHz
Multi-Media Double x4 iSSE2
136.75MPixel/s125.88MPixel/s 
Multi-Media Double x2 iSSE2
  55.75MPixel/s
Multi-Media Double x4 iSSE2 vs SPEED
42.84kPixels/s/MHz42.92kPixels/s/MHz 
Multi-Media Double x2 iSSE2 vs SPEED
  20.96kPixels/s/MHz
Multi-Core Efficiency Benchmark
Inter-Core Bandwidth
76.87GB/s75.61GB/s20.54GB/s
Inter-Core Bandwidth vs SPEED
24.66MB/s/MHz26.40MB/s/MHz7.91MB/s/MHz
Inter-Core Latency
(越小越好)
16ns16ns90ns
Inter-Core Latency vs SPEED
(越小越好)
0.01ns/MHz0.01ns/MHz0.03ns/MHz
.NET Arithmetic Benchmark
.NET架构测试
Dhrystone .NET
34801MIPS32904MIPS10562MIPS
Dhrystone .NET vs SPEED
10.90MIPS/MHz11.22MIPS/MHz3.97MIPS/MHz
Whetstone .NET
84750MFLOPS78286MFLOPS45399MFLOPS
Whetstone .NET vs SPEED
26.55MFLOPS/MHz26.69MFLOPS/MHz17.07MFLOPS/MHz
.NET Multi-Media Benchmark
.NET多媒体测试
Multi-Media Int x1 .NET
63.21MPixel/s62.28MPixel/s31.28MPixel/s
Multi-Media Int x1 .NET vs SPEED
19.80kPixels/s/MHz21.23kPixels/s/MHz11.76kPixels/s/MHz
Multi-Media Float x1 .NET
27.43MPixel/s26.19MPixel/s8.68MPixel/s
Multi-Media Float x1 .NET vs SPEED
8.59kPixels/s/MHz8.93kPixels/s/MHz3.26kPixels/s/MHz
Multi-Media Double x1 .NET
53.25MPixel/s51.45MPixel/s24.75MPixel/s
Multi-Media Double x1 .NET vs SPEED
16.68kPixels/s/MHz17.54kPixels/s/MHz9.30kPixels/s/MHz

  就SiSoftware测试结果来看,W5580和X5570的确相去不远。

  CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,我们的平台偏向于服务器多一些,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。

CineBench R10 64bit
处理器双路Intel Gainestown
Xeon W5580
3.20GHz
双路Intel Gainestown
Xeon X5570
双路Intel Harpertown
Xeon E5430
显卡---
CPU Benchmark
Rendering (1 CPU)4386 CB-CPU4410 CB-CPU2931 CB-CPU
Rendering (x CPU)28604 CB-CPU28172 CB-CPU16806 CB-CPU
Multiprocessor Speedup6.52x6.39x5.73x
OpenGL Benchmark
OpenGL Standard247 CB-GFX224 CB-GFX176 CB-GFX

测试成绩

   W5580的表现略微好一点,相差不明显。

  SPEC CPU 2006整数运算主要包含编译、压缩、人工智能、视频压缩转换、XML处理等,此外,各种日常操作也主要是基于整数操作。SPEC CPU 2006的整数运算包含了400.perlbench PERL编程语言、401.bzip2 压缩、403.gcc C编译器、429.mcf 组合优化、445.gobmk 人工智能:围棋、456.hmmer 基因序列搜索、458.sjeng 人工智能:国际象棋、462.libquantum 物理:量子计算、464.h264ref 视频压缩、471.omnetpp 离散事件仿真、473.astar 寻路算法、483.xalancbmk XML处理共12项。

SPEC CPU 2006整数运算性能

  W5580平台的得分是182,对比的X5570则是183,1分的差距可以认为是误差,可以说,W5580和X5570在整数方面的高性能运算上没太大区别——当然,还是有的,具体见后页。

  SPEC CPU 2006的浮点运算测试包括的全部都是科学运算,科学运算需要用到大量的高精度浮点数据,如410.bwaves 流体力学、416.gamess 量子化学、433.milc 量子力学、434.zeusmp 物理:计算流体力学、435.gromacs 生物化学/分子力学、436.cactusADM 物理:广义相对论、437.leslie3d 流体力学、444.namd 生物/分子、447.dealII 有限元分析、450.soplex 线形编程、优化、453.povray 影像光线追踪、454.calculix 结构力学、459.GemsFDTD 计算电磁学、465.tonto 量子化学、470.lbm 流体力学、481.wrf 天气预报、482.sphinx3 语音识别共17项测试。

SPEC CPU 2006浮点运算性能

  可见,浮点运算上W5580的性能确实要比X5570好约5~7%左右,为什么如此呢?我们推测,Turbo Boost发挥作用的负载监测乃是基于整数运算——整数运算包括了通常的操作系统等操作,必不可少。你可以见到没有浮点运算单元的处理器,但是你不会见到没有整数运算单元的处理器。

  因此,在进行浮点运算的时候,X5570的Turbo Boost发挥的相对少一些,W5580就体现出了高主频的优势。在一些特别的项目,如482.sphinx3上,情况会颠倒过来(这个语音测试项目应该整数运算的成分多一点,拉动了Turbo Boost)。

  【IT168评测中心】除了服务器之外,在企业级别应用上还有一个领域,Nehalem也为其“定制”了一个系列处理器产品,这就是工作站应用,对应的Nehalem就是Nehalem-WS系列,WS就是Workstation工作站的意思。


Nehalem-EP/Nehalem-WS Xeon Turbo Boost规格对照表

  我们拿到了表格上最高端的Nehalem处理器:3.20GHz的Nehalem-WS 2S Xeon W5580,在考虑了Turbo Boost因素之后,Nehalem-WS 2S Xeon W5580和Nehalem-EP X5570是差不多一致的:

W5580/X5570Turbo Boost对照表
处理器Intel Gainestown
Xeon W5580
Intel Gainestown
Xeon X5570
通常频率3.20GHz2.93GHz
单/双核心高负荷工作频率3.333GHz3.333GHz
四核心高负荷工作频率3.20GHz3.20GHz

  这很容易让人迷惑,为什么Intel要提供两个看起来如此相似的产品呢?它们的价格差距在$300以上,有什么地方体现出W5580的不同之处呢?它的Turbo Boost能力如此之差!


默认频率较高的W5580适合用于工作站

  答案是:它默认频率很高,我们可以看到,在上一个表格上,虽然在Turbo Boost发挥作用之后W5580和X5570规格看起来一样,然而Turbo Boost事实上并不是一个稳定的状态,不是说这个机制会导致问题,而是说它(X5570)并不是让频率一直维持在一个较高的状态,即使是系统始终满负荷也一样,此时默认频率较高的W5580表现会好一点。另外,最重要的一点是,Turbo Boost发挥作用的机制,很可能是基于最通用的整数运算,在浮点负荷较重而整数负荷较轻的时候,Turbo Boost就不会发挥作用,这时默认频率更高的W5580就更有优势。


对于服务器来说,较低的默认频率+Turbo Boost方案即经济又实惠
 

  一般的图形工作站确实都依赖于浮点运算,不得不说,这时默认频率比Turbo Boost更重要,换一句话来说:Nehalem-EP Xeon X5570不适合工作站(W5580浮点性能更好),Nehalem-WS 2S Xeon W5580不适合服务器(较贵,较高的默认频率和整数运算+Turbo Boost没有区别),Intel确实清楚地划分了这两个产品线。

工作站专用至强 Nehalem-WS处理器解析

Intel Nehalem-EP处理器首发深度评测

直联架构的威力 Nehalem-EP处理器解析

Nehalem-EP 新Xeon 5500处理器首度曝光

透视六核心至强 Dunnington处理器解析

透视八核心至强 Nehalem-EX处理器解析

2008年度评测报告:深入Nehalem微架构

性能大幅提升 Core i7 服务器应用测试

再攀性能之巅 Intel全新酷睿i7深度评测

机密揭露:Intel超线程技术有多少种?

[IDF08]基辛格演讲:Nehalem集群演示

0
相关文章