【IT168评测中心】Intel推出新的Nehalem架构已经有近一年的时间了,作为一款新架构的处理器,Nehalem目前仍然是出于“非全线推出”的状态,其产品线在笔记本系列、桌面系列乃至服务器系列都尚有一些“空白”。不过,在已经推出的产品线上,Nehalem都获得了很大的成功。
Nehalem自从3月底推出服务器产品线的Nehalem-EP处理器(附带平台)后,我们已经有了相当多的Nehalem-EP评测,对这款处理器也有了很详细的理解,不过,出了服务器之外,在企业级别应用上还有一个领域,Nehalem也为其“定制”了一个系列处理器产品,这就是工作站应用,对应的Nehalem就是Nehalem-WS系列,WS就是Workstation工作站的意思。
我们可以看到,在规格表上,Nehalem-WS 2S Xeon W5580大概是最高的一款处理器,它的频率高达3.20GHz——它的价格也是最贵的,发售时千颗售价$1600,也就是说要约一万人民币以上一颗,它的性能如何呢?
要了解Nehalem-WS(工作站版本)和普通的Nehalem(桌面版本)和Nehalem-EP(服务器版本)有什么不同,就要先知道Nehalem上实现了的一种新的能耗比控制技术:Turbo Mode,或者叫做Turbo Boosting,这种技术在笔记本上曾经出现过(2007年的Santa Rosa平台:Intel Dynamic Acceleration Technology英特尔动态加速技术)。作用就是当Nehalem一些核心处于空闲状态,被Power Gate关闭之后,剩余的核心可以动态提升频率以提升负载的响应能力。当然,在操作系统配合的情况下,也可能实现将其他核心上的进程迁移、集中到某一个或几个核心上,并关闭其他核心来降低功耗、提升负载响应能力。虽然目前看起来还没有什么操作系统很好地实现了该功能。
通常状态
例子:两个核心关闭,两个核心被Turbo Boost
如上图:关闭两个核心,剩下的两个核心提升了工作频率,降低了总功耗。实际上有点像一个官方的超频功能。
Core i7 Turbo Boosting
TDP允许的情况下,所有的核心都被Turbo Boost
并不是只有两个核的频率可以Turbo Boost,在所有核都繁忙的情况下,Core i7可以让所有的核心都提升频率,也就是说,这时候相当于一个2.80GHz的四核八线程Nehalem。在只有一个核繁忙的情况下,这个核可以提升到2.93GHz,也就是提升了2个倍频。
TDP允许的情况下,部分核心允许更进一步地Turbo Boost
作为比桌面系列更贵的产品,Xeon至强处理器在其他条件一致的情况下具有更多的增强功能,如Turbo Boost就是:它可以最多提升400MHz(单个或者两个核心),在所有核心都满负荷的时候,它们能让频率最多提升266MHz,是桌面系列的两倍。当然,这一些都需要TDP容许——也就是散热系统允许。
TDP(Thremal Design Power,热设计功耗)是一个很重要的要素,它影响着Turbo Boost的能力,先看下图:
可以看出,不同TDP的处理器具有不同的Turbo Boost能力,最低的Xeon L系列只能提升133MHz,中等的E系列则能提升266MHz,而最高的W系列和X系列则可以达到400MHz。在所有核心都提升的情况下幅度有所降低。此外,并不是所有的处理器都具有Turbo Mode功能,在Xeon 5500系列处理器当中,只有最后一位数字为0的处理器具备超线程技术和Turbo Mode,为其他数字的则没有。一开始,桌面版本的Nehalem也是没有超线程技术和Turbo Mode的,后来Intel改变了主意,这个举动应该是为了刺激市场,通过培养消费者来扩展它们的应用领域。Core i7的Turbo Boost能力如前面所述,为单个核心133MHz,虽然它的TDP和Nehalem-WS系列一样为130W(Nehalem-WS 1S为单个或双个核心266MHz)。
Nehalem-EP Xeon X5570:单核心Turbo Boost为266MHz
Nehalem-EP Xeon X5570:四核心Turbo Boost为400MHz
可见,工作站版本的W35x0系列要比桌面版本具有更高的Turbo Boost值——而双路服务器版本又比单路工作站具有更高的Turbo Boost值。虽然大家可能会猜想频率最高的双路工作站版本W5580会具有最强的Turbo Boost值,但实际上不是:
实际上,双路Nehalem-WS 2S Xeon W5580无法所有核心都Turbo Boost,只能单核心Turbo Boost 133MHz——不仅比不上单路工作站版本Nehalem-WS 1S,甚至还不如桌面版本Core i7。这一点很难理解,如果是单路应用的话,Xeon W3570才是最强的,而双路应用的话,在重负荷的时候Xeon X5570和Xeon W5580是一样的。
Nehalem-WS 2S W5580也属于Xeon至强 5500系列
对于W5580来说,Turbo Boost看起来算是一个赠品。和桌面版本的Core i7相比,Nehalem-WS还有着其他的特性,如支持R/ECC内存,后一个特性在追求稳定性的时候是必须的,长期工作的机器难免会因为过热不稳定而发生内存错误,ECC可以大为降低这个特性。历来高端的Intel平台都是支持ECC的(如875X、975X芯片组),但是早期出厂的Core i7并不支持,这是从性能方面的考虑——ECC会增加一点延迟,Intel提及Core i7未来会提供ECC的支持。
除了ECC之外,R——Registered,意为寄存器或目录寄存器(不过很少用中文称呼),在内存上的作用就像一个目录,Registered内存在接到读写指令时,会先检索此目录,然后再进行读写操作。拥有Registers功能的内存模组,可以通过重新驱动控制信号来改善内存的运作,提高电平信号的准确性,从而有助于保持系统长时间稳定运作。不过,由于Registered的信号重驱动需花费一个时钟周期,延迟时间有所增加,因此具有该功能内存的读写性能同样会稍低于普通内存。此外,由于时序的变化,Registered内存需要内存控制器的支持(当然,ECC也需要内存控制器的支持)。
红框内是R-ECC内存比普通内存多出的部分:一个额外的ECC内存芯片(大)、一个Register芯片(中)、一个PLL芯片(小)
对于普通人而言,Registered最大的作用是支持更大容量的内存:由于信号具有更高的稳定性,支持Registered通常会让内存支持翻倍。Registered在内存上缓存读写时钟信号并再次驱动内存芯片,获得更好的电气性能,从而支持更多的内存芯片。Core i7就只能支持24GB的容量,而支持Registered内存的单Xeon可以轻松达到48GB到72GB。
提到通常的Unbuffered内存和Registered内存,人们就会想到有没有Buffered内存和Unregistered内存呢?有的,其实Buffered/Registered(缓存器/寄存器)都是Registered内存的工作方式,Buffered采用时钟异步方式工作,而后来发展的Registered采用时钟同步方式工作,后者的性能更好,因此Buffered模式逐渐消失了(因此,Unregistered这个词没什么意义)。
Xeon并不是全线都支持R/ECC技术——它全线支持ECC技术,但是只有Nehalem-EP Xeon支持Registered内存。Nehalem-WS Xeon并不支持Registered内存。
一块Xeon W5580,外观上就和通常的LGA1366 Nehalem差不多
注:PLL(Phase Locked Loop,锁相环)是一种反馈电路,其作用是使得电路上的时钟和某一外部时钟(也就是内存条间)的相位同步。
测试平台、测试环境 | ||||||
测试分组 | ||||||
类别 | DELL Precision T5500工作站 双路Intel Gainestown Xeon W5580 | ASUS RS700-E4服务器 双路Intel Gainestown Xeon X5570 | DELL PE 2900 III基准 双路Intel Harpertown Xeon E5430 | |||
处理器子系统 | ||||||
处理器 | 双路Intel Xeon W5580 | 双路Intel Xeon X5570 | 双路Intel Xeon E5430 | |||
处理器架构 | Intel 45nm Nehalem | Intel 45nm Nehalem | Intel 45nm Penryn | |||
处理器代号 | Gainestown (Nehalem-WS 2S) | Gainestown (Nehalem-EP) | Harpertown | |||
处理器封装 | Socket 1366 LGA | Socket 1366 LGA | Socke 771 LGA | |||
处理器规格 | 四核 | 四核 | 四核 | |||
处理器指令集 | MMX,SSE,SSE2,SSE3,SSSE3, SSE4.1,SSE4.2,EM64T,VT | MMX,SSE,SSE2,SSE3,SSSE3, SSE4.1,SSE4.2,EM64T,VT | MMX,SSE,SSE2,SSE3,SSSE3, SSE4.1,EM64T,VT | |||
主频 | 3.20GHz | 2.93GHz | 2.66GHz | |||
Turbo Boost主频 (四核心) | 3.20GHz(+0MHz) | 3.20GHz(+266MHz) | - | |||
Turbo Boost 主频 (单/双核) | 3.333GHz(+133MHz) | 3.333GHz(+400MHz) | - | |||
处理器外部总线 | 2x QPI 3200MHz 6.40GT/s 单向12.8GB/s(每QPI) 双向25.6GB/s(每QPI) | 2x QPI 3200MHz 6.40GT/s 单向12.8GB/s(每QPI) 双向25.6GB/s(每QPI) | FSB 333MHz 1333MT/s 10.6GB/s | |||
L1 D-Cache | 4x 32KB 8路集合关联 | 4x 32KB 8路集合关联 | 4x 32KB 8路集合关联 | |||
L1 I-Cache | 4x 32KB 4路集合关联 | 4x 32KB 4路集合关联 | 4x 32KB 8路集合关联 | |||
L2 Cache | 4x 256KB 8路集合关联 | 4x 256KB 8路集合关联 | 2x 6144KB 16路集合关联 | |||
L3 Cache | 8MB @ 2668.7MHz 16路集合关联 | 8MB @ 2668.7MHz 16路集合关联 | ||||
主板 | ||||||
主板型号 | DELL Precision T5500 | ASUS Z8PS-D12-1U | DELL PE 2900 III | |||
芯片组 | Intel Tylersburg-EP IOH:Intel 5500(Tylersburg-24D) ICH:Intel 82801JR(ICH10R) | Intel Tylersburg-EP IOH:Intel 5520(Tylersburg-36D) ICH:Intel 82801JR(ICH10R) | MCH:Intel 5000X ICH:Intel ESB6321 | |||
芯片特性 | 2x QPI 24 PCI Express Gen2 Lanes VT-d Gen 2 | 2x QPI 36 PCI Express Gen2 Lanes VT-d Gen 2 | 2x FSB1333 PCI Express Gen1 Lanes 12MB Snoop Filter VT-d Gen 1 | |||
内存控制器 | 每CPU集成三通道R-ECC DDR3 1333 | 每CPU集成三通道R-ECC DDR3 1333 | 北桥集成四通道FBD DDR2 667 | |||
内存 | 4GB R-ECC DDR3 1333 SDRAM x6 | 4GB R-ECC DDR3 1333 SDRAM x6 | 2GB FBD DDR2 667 SDRAM x4 | |||
系统磁盘子系统 | ||||||
磁盘控制器 | Intel ICH10R SATA AHCI Controller | LSI Embedded MegaRAID SAS RAID Controller | DELL Perc 5/i RAID Controller | |||
磁盘控制器规格 | 6x SAS 3Gb/s AHCI w/ NCQ RAID 0/1/3/5 | 8x SAS 3Gb/s RAID 0/1 | LSI 1068 SAS Intel IOP333 500MHz ARM 256MB RAM 8x SAS 3Gb/s RAID 0/1/3/5 | |||
磁盘控制器设置 | AHCI w/ NCQ | RAID 0 | RAID 5 | |||
磁盘控制器驱动 | Intel Matrix Storage Manager 8.8.0.1009 | LSI MegaSR 13.06.0212.2009 | LSI SAS 3.8.0.64 | |||
磁盘 | WesternDigital VelociRaptor WD1600HLFS | Fujitsu MBA3300RC x2 | Seagate Cheetah 15K.5 ST314655SS x3 | |||
磁盘规格 | 10000RPM 160GB SATA 3Gb/s NCQ 16MB Cache | 15000RPM 300GB SAS 3Gb/s NCQ 16MB Cache | 15000RPM 146GB SAS 3Gb/s NCQ 16MB Cache | |||
磁盘设置 | SATA 3Gb/s NCQ 50GB系统分区 | SAS 3Gb/s NCQ 50GB系统分区 | SAS 3Gb/s NCQ 20GB系统分区 | |||
软件环境 | ||||||
操作系统 | Microsoft Windows Server 2008 Enterprise Edition SP1 x64 | Microsoft Windows Server 2008 Enterprise Edition SP1 x64 | Microsoft Windows Server 2008 Enterprise Edition SP1 x64 |
从最前面的处理器子系统参数对比可以看出,Xeon W5580和Xeon X5570在Turbo Boost工作的时候是完全一样的,只有在非Turbo Boost状态下,W5580才表现出频率上的优势。而其他从L3到内存控制器的外围参数都是一样(这部分就是通常说的Uncore部分)。
DELL Presicion T5500工作站,支持双路W5580处理器
测试使用了一台DELL Presicion T5500工作站,配合专门的Nehalem-WS 2S Xeon W5580倒也正合适——不过真正的原因是手上的服务器或服务器主板都不支持W5580。笔者自用的ASUS P6T Deluxe倒是可用W5580,只是它不支持双路处理器。
由于Nehalem-WS 2S Xeon W5580和Nehalem-EP Xeon X5570就是核心工作频率上的不同,因此我们的测试主要针对处理器性能来进行:
SiSoftware Sandra v2009
SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。从2007开始,Sandra的Arithmetic benchmarks增加了对SSE3 & SSE4 SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,另外还升级了File System benchmark和Removable Storage benchmark两个子项目。对于新的硬件的支持当然也是该软件每次升级的重要内容之一。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台,这也是我们选择这款软件的原因之一。
CineBench R10
CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,在服务器测试平台中显示子系统不重要,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。
SPEC CPU 2006 v1.0.1
SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。
SPEC CPU 2006是SPEC组织推出的CPU子系统评估软件最新版,我们之前使用的是SPEC CPU 2000。和上一个版本一样,SPEC CPU 2006包括了CINT2006和CFP2006两个子项目,前者用于测量和对比整数性能,而后者则用于测量和对比浮点性能,SPEC CPU 2006中对SPEC CPU 2000中的一些测试进行了升级,并抛弃/加入了一些测试,因此两个版本测试得分并没有可比较性。
SPEC CPU测试中,测试系统的处理器、内存子系统和使用到的编译器(SPEC CPU提供的是源代码,并且允许测试用户进行一定的编译优化)都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2006的影响非常的小。
SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、DCC以及科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。
我们在被测服务器中安装了当前最新版本的Intel C++ 10.1.025 Compiler、Intel Fortran 10.1.025 Compiler这两款SPEC CPU 2006必需的编译器,通过最新出现的QxS编译参数,Intel Compiler 10版本开始支持对Intel SSE4指令集进行优化(假如只支持SSE3,则使用QxT编译参数)。我们另外安装了Microsoft Visual Studio 2003 SP1提供必要的库文件。按照SPEC的要求我们根据自己的情况编辑了新的Config文件,使用了较多的编译选项。我们根据被测系统选择实际可同时处理的线程数量,最后得到SPEC rate base测试结果(基于base标准编译,SPEC base rate测试代表系统同时处理多个任务的能力)。
和其它测试部件不同,SPEC CPU 2006需要大量的系统物理内存,我们的SPEC测试在64bit Windows Server 2008 Enterprise下完成,对于每个运算核心,最低配置1.5GB内存。
SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,它可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台。我们利用了其中多个性能测试模块对于被测系统的性能进行了快速的测试。
有一点需要说明的是,Sandra的处理器架构性能测试是根据处理器所能支持的所有指令集中选择进行的,不同的处理器支持的指令集不同,测试使用到的指令集也就不同。例如,Nehalem在这个测试当中就可以使用SSE4.2,而Penryn就只能使用SSE4.1,而用Opteron可能就只能到SSE3了。一般而言,由于可以使用SSE4,Intel的处理器理论性能会比较好。
SiSoftware Sandra Pro Business 2009 | |||
---|---|---|---|
测试对象 | DELL Precision T5500 双路Intel Gainestown Xeon W5580 3.20GHz | Intel Nehalem-EP 双路Intel Gainestown Xeon X5570 2.93GHz | DELL PE2900 III 双路Intel Harpertown Xeon E5430 2.66GHz |
Processor Arithmetic Benchmark 处理器架构测试 | |||
Dhrystone ALU | 155443MIPS | 142977MIPS | 91006MIPS |
Dhrystone ALU vs SPEED | 48.70MIPS/MHz | 48.75MIPS/MHz | 34.21MIPS/MHz |
Whetstone iSSE3 | 132174MFLOPS | 124035MFLOPS | 78385MFLOPS |
Dhrystone iSSE3 vs SPEED | 41.41MFLOPS/MHz | 42.29MFLOPS/MHz | 29.47MFLOPS/MHz |
Processor Multi-Media Benchmark 处理器多媒体测试 | |||
Multi-Media Int x16 iSSE4.1 | 322.93MPixel/s | 296.85MPixel/s | |
Multi-Media Int x8 iSSE4.1 | 199.33MPixel/s | ||
Multi-Media Int x16 iSSE4.1 vs SPEED | 101.17MPixel/s/MHz | 101.21MPixel/s/MHz | |
Multi-Media Int x8 iSSE4.1 vs SPEED | 74.94MPixel/s/MHz | ||
Multi-Media Float x8 iSSE2 | 248.18MPixel/s | 228.24MPixel/s | |
Multi-Media Float x4 iSSE2 | 108.69MPixel/s | ||
Multi-Media Float x8 iSSE2 vs SPEED | 77.75kPixels/s/MHz | 77.82kPixels/s/MHz | |
Multi-Media Float x4 iSSE2 vs SPEED | 40.86kPixels/s/MHz | ||
Multi-Media Double x4 iSSE2 | 136.75MPixel/s | 125.88MPixel/s | |
Multi-Media Double x2 iSSE2 | 55.75MPixel/s | ||
Multi-Media Double x4 iSSE2 vs SPEED | 42.84kPixels/s/MHz | 42.92kPixels/s/MHz | |
Multi-Media Double x2 iSSE2 vs SPEED | 20.96kPixels/s/MHz | ||
Multi-Core Efficiency Benchmark | |||
Inter-Core Bandwidth | 76.87GB/s | 75.61GB/s | 20.54GB/s |
Inter-Core Bandwidth vs SPEED | 24.66MB/s/MHz | 26.40MB/s/MHz | 7.91MB/s/MHz |
Inter-Core Latency (越小越好) | 16ns | 16ns | 90ns |
Inter-Core Latency vs SPEED (越小越好) | 0.01ns/MHz | 0.01ns/MHz | 0.03ns/MHz |
.NET Arithmetic Benchmark .NET架构测试 | |||
Dhrystone .NET | 34801MIPS | 32904MIPS | 10562MIPS |
Dhrystone .NET vs SPEED | 10.90MIPS/MHz | 11.22MIPS/MHz | 3.97MIPS/MHz |
Whetstone .NET | 84750MFLOPS | 78286MFLOPS | 45399MFLOPS |
Whetstone .NET vs SPEED | 26.55MFLOPS/MHz | 26.69MFLOPS/MHz | 17.07MFLOPS/MHz |
.NET Multi-Media Benchmark .NET多媒体测试 | |||
Multi-Media Int x1 .NET | 63.21MPixel/s | 62.28MPixel/s | 31.28MPixel/s |
Multi-Media Int x1 .NET vs SPEED | 19.80kPixels/s/MHz | 21.23kPixels/s/MHz | 11.76kPixels/s/MHz |
Multi-Media Float x1 .NET | 27.43MPixel/s | 26.19MPixel/s | 8.68MPixel/s |
Multi-Media Float x1 .NET vs SPEED | 8.59kPixels/s/MHz | 8.93kPixels/s/MHz | 3.26kPixels/s/MHz |
Multi-Media Double x1 .NET | 53.25MPixel/s | 51.45MPixel/s | 24.75MPixel/s |
Multi-Media Double x1 .NET vs SPEED | 16.68kPixels/s/MHz | 17.54kPixels/s/MHz | 9.30kPixels/s/MHz |
就SiSoftware测试结果来看,W5580和X5570的确相去不远。
CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,我们的平台偏向于服务器多一些,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。
CineBench R10 64bit | |||
处理器 | 双路Intel Gainestown Xeon W5580 3.20GHz | 双路Intel Gainestown Xeon X5570 | 双路Intel Harpertown Xeon E5430 |
显卡 | - | - | - |
CPU Benchmark | |||
Rendering (1 CPU) | 4386 CB-CPU | 4410 CB-CPU | 2931 CB-CPU |
Rendering (x CPU) | 28604 CB-CPU | 28172 CB-CPU | 16806 CB-CPU |
Multiprocessor Speedup | 6.52x | 6.39x | 5.73x |
OpenGL Benchmark | |||
OpenGL Standard | 247 CB-GFX | 224 CB-GFX | 176 CB-GFX |
测试成绩
W5580的表现略微好一点,相差不明显。
SPEC CPU 2006整数运算主要包含编译、压缩、人工智能、视频压缩转换、XML处理等,此外,各种日常操作也主要是基于整数操作。SPEC CPU 2006的整数运算包含了400.perlbench PERL编程语言、401.bzip2 压缩、403.gcc C编译器、429.mcf 组合优化、445.gobmk 人工智能:围棋、456.hmmer 基因序列搜索、458.sjeng 人工智能:国际象棋、462.libquantum 物理:量子计算、464.h264ref 视频压缩、471.omnetpp 离散事件仿真、473.astar 寻路算法、483.xalancbmk XML处理共12项。
SPEC CPU 2006整数运算性能
W5580平台的得分是182,对比的X5570则是183,1分的差距可以认为是误差,可以说,W5580和X5570在整数方面的高性能运算上没太大区别——当然,还是有的,具体见后页。
SPEC CPU 2006的浮点运算测试包括的全部都是科学运算,科学运算需要用到大量的高精度浮点数据,如410.bwaves 流体力学、416.gamess 量子化学、433.milc 量子力学、434.zeusmp 物理:计算流体力学、435.gromacs 生物化学/分子力学、436.cactusADM 物理:广义相对论、437.leslie3d 流体力学、444.namd 生物/分子、447.dealII 有限元分析、450.soplex 线形编程、优化、453.povray 影像光线追踪、454.calculix 结构力学、459.GemsFDTD 计算电磁学、465.tonto 量子化学、470.lbm 流体力学、481.wrf 天气预报、482.sphinx3 语音识别共17项测试。
SPEC CPU 2006浮点运算性能
可见,浮点运算上W5580的性能确实要比X5570好约5~7%左右,为什么如此呢?我们推测,Turbo Boost发挥作用的负载监测乃是基于整数运算——整数运算包括了通常的操作系统等操作,必不可少。你可以见到没有浮点运算单元的处理器,但是你不会见到没有整数运算单元的处理器。
因此,在进行浮点运算的时候,X5570的Turbo Boost发挥的相对少一些,W5580就体现出了高主频的优势。在一些特别的项目,如482.sphinx3上,情况会颠倒过来(这个语音测试项目应该整数运算的成分多一点,拉动了Turbo Boost)。
【IT168评测中心】除了服务器之外,在企业级别应用上还有一个领域,Nehalem也为其“定制”了一个系列处理器产品,这就是工作站应用,对应的Nehalem就是Nehalem-WS系列,WS就是Workstation工作站的意思。
我们拿到了表格上最高端的Nehalem处理器:3.20GHz的Nehalem-WS 2S Xeon W5580,在考虑了Turbo Boost因素之后,Nehalem-WS 2S Xeon W5580和Nehalem-EP X5570是差不多一致的:
W5580/X5570Turbo Boost对照表 | ||
处理器 | Intel Gainestown Xeon W5580 | Intel Gainestown Xeon X5570 |
通常频率 | 3.20GHz | 2.93GHz |
单/双核心高负荷工作频率 | 3.333GHz | 3.333GHz |
四核心高负荷工作频率 | 3.20GHz | 3.20GHz |
这很容易让人迷惑,为什么Intel要提供两个看起来如此相似的产品呢?它们的价格差距在$300以上,有什么地方体现出W5580的不同之处呢?它的Turbo Boost能力如此之差!
答案是:它默认频率很高,我们可以看到,在上一个表格上,虽然在Turbo Boost发挥作用之后W5580和X5570规格看起来一样,然而Turbo Boost事实上并不是一个稳定的状态,不是说这个机制会导致问题,而是说它(X5570)并不是让频率一直维持在一个较高的状态,即使是系统始终满负荷也一样,此时默认频率较高的W5580表现会好一点。另外,最重要的一点是,Turbo Boost发挥作用的机制,很可能是基于最通用的整数运算,在浮点负荷较重而整数负荷较轻的时候,Turbo Boost就不会发挥作用,这时默认频率更高的W5580就更有优势。
对于服务器来说,较低的默认频率+Turbo Boost方案即经济又实惠
一般的图形工作站确实都依赖于浮点运算,不得不说,这时默认频率比Turbo Boost更重要,换一句话来说:Nehalem-EP Xeon X5570不适合工作站(W5580浮点性能更好),Nehalem-WS 2S Xeon W5580不适合服务器(较贵,较高的默认频率和整数运算+Turbo Boost没有区别),Intel确实清楚地划分了这两个产品线。