服务器 频道

工作站专用至强 Nehalem-WS处理器解析

  【IT168评测中心】Intel推出新的Nehalem架构已经有近一年的时间了,作为一款新架构的处理器,Nehalem目前仍然是出于“非全线推出”的状态,其产品线在笔记本系列、桌面系列乃至服务器系列都尚有一些“空白”。不过,在已经推出的产品线上,Nehalem都获得了很大的成功。


Nehalem Xeon 5500系列处理器


4核心Nehalem处理器晶元图

  Nehalem自从3月底推出服务器产品线的Nehalem-EP处理器(附带平台)后,我们已经有了相当多的Nehalem-EP评测,对这款处理器也有了很详细的理解,不过,出了服务器之外,在企业级别应用上还有一个领域,Nehalem也为其“定制”了一个系列处理器产品,这就是工作站应用,对应的Nehalem就是Nehalem-WS系列,WS就是Workstation工作站的意思。


Nehalem-EP/Nehalem-WS Xeon规格对照表

  要理解一款处理器,可以先看它的规格表,同样,要知道Nehalem-WS是什么东西,通过规格对照表上就可以先有一个大概的印象,不过看完上表,能看出区别的人有几个?都举起手来……好吧,其实主要的区别没有在表格里面,请让我们细细道来。

Intel Nehalem-EP处理器首发深度评测

直联架构的威力 Nehalem-EP处理器解析

Nehalem-EP 新Xeon 5500处理器首度曝光

透视六核心至强 Dunnington处理器解析

透视八核心至强 Nehalem-EX处理器解析

2008年度评测报告:深入Nehalem微架构

性能大幅提升 Core i7 服务器应用测试

再攀性能之巅 Intel全新酷睿i7深度评测

机密揭露:Intel超线程技术有多少种?

[IDF08]基辛格演讲:Nehalem集群演示

 


Nehalem Xeon 5500处理器

  我们还是先来继续看规格表,首先要了解Nehalem-WS具有两个系列:Nehalem-WS 1S和Nehalem-WS 2S,这很好理解,1S就是1 Socket,2S就是2 Socket,分别是一路处理器平台和二路(双路)处理器平台,这和Nehalem-WS的血缘兄弟都不同:桌面的Nehalem(Core i7,代号Bloomfield)只支持一路处理器,服务器用的Nehalem-EP(Xeon 5500系列,代号Gainestown)则全部都是二路处理器的型号。比较远的“近亲”Nehalem-EX(应该会被称为Xeon 7500系列,代号Becton)是八路处理器系列,当然Nehalem-EX也能支持更一般的四路处理器:


Nehalem-EP/Nehalem-WS Xeon规格对照表

  虽然如此,Nehalem-WS的型号显然不多,总共只有四款:三款Nehalem-WS 1S,一款Nehalem-WS 2S。前三款是Xeon W3520、Xeon W3540、Xeon W3570,后一款是Xeon W5580,前者就是以前单路Penryn Xeon 33xx系列的Nehalem版本(Xeon 3xxx系列采用了桌面LGA775的接口)。虽然都顶着Xeon的名号,它们分别属于Bloomfield系列和Gainestown系列,仔细看看,它们的共同点很多,如都支持Turbo Boost/HTT、TDP都为130W,其中有几点要素很关键,我们先继续看:

Intel Core i7/Bloomfield规格表
名称Core i7 920Core i7 940Core i7 Extreme 965Core i7 Extreme 975
系列Nehalem/Core i7Nehalem/Core i7 Extreme
多处理器数量1
频率2.66GHz2.93GHz3.20GHz3.33GHz
QPI速率4.80GT/s6.40GT/s
Turbo Boost
HTT(SMT)
核心/线程4/8
L2缓存4 x 256KB
L3缓存8MB
TDP130W

  可见,Nehalem-WS 1S中的Xeon W3520、Xeon W3540和桌面的Core i7 920、Core i7 940貌似没什么区别?频率一样,QPI一样,缓存什么的都一样……接口也一样,支持的处理器路数也一样!Intel在玩马甲的游戏么?重点在下页。

  在答案出现之前,要先了解一下Nehalem上实现了的一种新的能耗比控制技术:Turbo Mode,或者叫做Turbo Boosting,这种技术在笔记本上曾经出现过(2007年的Santa Rosa平台:Intel Dynamic Acceleration Technology英特尔动态加速技术)。作用就是当Nehalem一些核心处于空闲状态,被Power Gate关闭之后,剩余的核心可以动态提升频率以提升负载的响应能力。当然,在操作系统配合的情况下,也可能实现将其他核心上的进程迁移、集中到某一个或几个核心上,并关闭其他核心来降低功耗、提升负载响应能力。虽然目前看起来还没有什么操作系统很好地实现了该功能。

Intel Nehalem-EP处理器首发深度评测


通常状态


例子:两个核心关闭,两个核心被Turbo Boost

   如上图:关闭两个核心,剩下的两个核心提升了工作频率,降低了总功耗。实际上有点像一个官方的超频功能。


Core i7 Turbo Boosting
 
  提升的频率是以倍频为单位的,如Core i7在Turbo Boosting的时候,倍频就从标准的20提升到21,处理器的主频就从默认的2.66GHz(133 x 20)提升到了2.8GHz(133 x 21)。


TDP允许的情况下,所有的核心都被Turbo Boost

  并不是只有两个核的频率可以Turbo Boost,在所有核都繁忙的情况下,Core i7可以让所有的核心都提升频率,也就是说,这时候相当于一个2.80GHz的四核八线程Nehalem。在只有一个核繁忙的情况下,这个核可以提升到2.93GHz,也就是提升了2个倍频。


TDP允许的情况下,部分核心允许更进一步地Turbo Boost

  作为比桌面系列更贵的产品,Xeon至强处理器在其他条件一致的情况下具有更多的增强功能,如Turbo Boost就是:它可以最多提升400MHz(单个或者两个核心),在所有核心都满负荷的时候,它们能让频率最多提升266MHz,是桌面系列的两倍。当然,这一些都需要TDP容许——也就是散热系统允许。

  TDP(Thremal Design Power,热设计功耗)是一个很重要的要素,先看下图:


Intel Nehalem-EP/Nehalem-WS规格表

  可以看出,不同TDP的处理器具有不同的Turbo Boost能力,最低的Xeon L系列只能提升133MHz,中等的E系列则能提升266MHz,而最高的W系列和X系列则可以达到400MHz。在所有核心都提升的情况下幅度有所降低。此外,并不是所有的处理器都具有Turbo Mode功能,在Xeon 5500系列处理器当中,只有最后一位数字为0的处理器具备超线程技术和Turbo Mode,为其他数字的则没有。一开始,桌面版本的Nehalem也是没有超线程技术和Turbo Mode的,后来Intel改变了主意,这个举动应该是为了刺激市场,通过培养消费者来扩展它们的应用领域。Core i7的Turbo Boost能力如前面所述,为单个核心133MHz,虽然它的TDP和Nehalem-WS系列一样为130W(Nehalem-WS 1S为单个或双个核心266MHz)。


Nehalem-WS 1S Xeon W3570:单核心Turbo Boost为266MHz
 

Nehalem-WS 1S Xeon W3570:四核心Turbo Boost为133MHz


Nehalem-EP Xeon X5570:单核心Turbo Boost为266MHz


Nehalem-EP Xeon X5570:四核心Turbo Boost为400MHz

   可见,工作站版本的W35x0系列要比桌面版本具有更高的Turbo Boost值——而双路服务器版本又比单路工作站具有更高的Turbo Boost值。虽然大家可能会猜想频率最高的双路工作站版本W5580会具有最强的Turbo Boost值,但实际上不是:


Nehalem-WS 2S Xeon W5580:单核心Turbo Boost为……133MHz
 

Nehalem-WS 2S Xeon W5580:四核心Turbo Boost为……0MHz

  实际上,双路Nehalem-WS 2S Xeon W5580无法所有核心都Turbo Boost,只能单核心Turbo Boost 133MHz——不仅比不上单路工作站版本Nehalem-WS 1S,甚至还不如桌面版本Core i7。这一点很难理解,如果是单路应用的话,Xeon W3570才是最强的,而双路应用的话,在重负荷的时候Xeon X5570和Xeon W5580是一样的。

 
当然……Nehalem-WS虽然属于Xeon至强,实际上只有一款属于5500系列

  Turbo Boost看起来算是一个赠品,有超线程技术的处理器才有Turbo Boost,Turbo Boost对性能的提升在5%左右。不过,和桌面版本的Core i7相比,Nehalem-WS还有着其他的特性,如支持R/ECC内存,后一个特性在追求稳定性的时候是必须的,长期工作的机器难免会因为过热不稳定而发生内存错误,ECC可以大为降低这个特性。历来高端的Intel平台都是支持ECC的(如875X、975X芯片组),但是早期出厂的Core i7并不支持,这是从性能方面的考虑——ECC会增加一点延迟,Intel提及Core i7未来会提供ECC的支持。


一条Unbuffered ECC DDR3内存(数一下内存颗粒数量?),正好适合Core i7使用

  除了ECC之外,R——Registered,意为寄存器或目录寄存器(不过很少用中文称呼),在内存上的作用就像一个目录,Registered内存在接到读写指令时,会先检索此目录,然后再进行读写操作。拥有Registers功能的内存模组,可以通过重新驱动控制信号来改善内存的运作,提高电平信号的准确性,从而有助于保持系统长时间稳定运作。不过,由于Registered的信号重驱动需花费一个时钟周期,延迟时间有所增加,因此具有该功能内存的读写性能同样会稍低于普通内存。此外,由于时序的变化,Registered内存需要内存控制器的支持(当然,ECC也需要内存控制器的支持)。


红框内是R-ECC内存比普通内存多出的部分:一个额外的ECC内存芯片(大)、一个Register芯片(中)、一个PLL芯片(小)

  对于普通人而言,Registered最大的作用是支持更大容量的内存:由于信号具有更高的稳定性,支持Registered通常会让内存支持翻倍。Registered在内存上缓存读写时钟信号并再次驱动内存芯片,获得更好的电气性能,从而支持更多的内存芯片。Core i7就只能支持24GB的容量,而支持Registered内存的单Xeon可以轻松达到48GB到72GB。不过,遗憾的是,虽然全线Xeon支持ECC技术,不过只有服务器版本的Nehalem-EP才支持Registered内存,工作站版本的Nehalem-WS不支持。显然Intel想限制Nehalem-WS的支持内存容量,并一定程度上限制了其应用到服务器上。

  提到通常的Unbuffered内存和Registered内存,人们就会想到有没有Buffered内存和Unregistered内存呢?有的,其实Buffered/Registered(缓存器/寄存器)都是Registered内存的工作方式,Buffered采用时钟异步方式工作,而后来发展的Registered采用时钟同步方式工作,后者的性能更好,因此Buffered模式逐渐消失了(因此,Unregistered这个词没什么意义)。

注:PLL(Phase Locked Loop,锁相环)是一种反馈电路,其作用是使得电路上的时钟和某一外部时钟(也就是内存条间)的相位同步。

 

 

 

  Nehalem-WS 2S Xeon W5580,作为目前最高端的Nehalem处理器,拥有优异的3.2GHz主频(单路的Xeon W3570频率也为3.2GHz),支持二路多处理器,支持Turbo Boost技术,最高频率可以达到3.333GHz(单或双核心)。Xeon W5580的TDP为130W,因此一般的Nehalem-EP服务器都无法支持(最高的X系列Nehalem-EP TDP为95W),相反,桌面Nehalem主板支持的还多一些(Core i7 TDP为130W),关于Xeon W5580的测试,请继续关注IT168评测中心

Intel Nehalem-EP处理器首发深度评测

直联架构的威力 Nehalem-EP处理器解析

Nehalem-EP 新Xeon 5500处理器首度曝光

透视六核心至强 Dunnington处理器解析

透视八核心至强 Nehalem-EX处理器解析

2008年度评测报告:深入Nehalem微架构

性能大幅提升 Core i7 服务器应用测试

再攀性能之巅 Intel全新酷睿i7深度评测

机密揭露:Intel超线程技术有多少种?

[IDF08]基辛格演讲:Nehalem集群演示

1
相关文章