Intel CPU终于进入了8核心时代。在本次的ISSCC(IEEE International Solid-State Circuits Conference)大会上,Intel公司宣布了其首款8核心aCPU「Nehalem-EX」的概况。Nehalem-EX已经知道代号为「Beckton」。基于的是Nehalem架构,拥有8个CPU核心,配备了24MB的L3缓存。
Nehalem-EX是面向MP(Multi-Processor)服务器市场的高端服务器CPU。不过8核心对于普通的桌面PC而言也是很快就会推出。因此Intel公司对于当前性能CPU产品采用的是持续增强CPU核心数量的战略。因为今天的MP服务器CPU会成为明天的高端桌面CPU。
譬如Intel公司在去年(2008年)推出了6核心MP服务器CPU「Xeon 7xxx(Dunnington)」。而在明年的第二季度则将会推出6核心桌面CPU「Gulftown」。MP服务器CPU→桌面CPU发展架构以及核心数量都得到了继承。因此MP服务器CPU的建构也是推测未来高端桌面CPU的线索。
顺便说一下的是Intel双核心处理器路线图的转移有些混乱。比如面向PC的CPU为四核心,而MP服务器CPU却为双核心。同时多款高端CPU基于的是MCM(Multi-Chip Module)技术,是将两个CPU核心合并在一起。不过从去年下半年开始,MP服务器CPU核心数量增多之后,高端产品也就成为了原生多核心处理器。
可以说Intel的产品结构自Nehalem登场之后就开始正常。今后预计将会推出更多MP多核心CPU,而在经过一代产品的发展之后就推出相同核心数量的桌面CPU。
Intel CPU核心数量的变化
同时Nehalem-EX也是验证Nehalem架构扩展性的好例子。Nehalem架构Intel从四核心到八核心、双核心以及六核心。Nehalem与双核心Core2(Merom)系列架构存在着很大的差异。
晶体管数量为23亿
负责Nehalem架构开发工作的是Intel公司位于俄勒冈州的研发中心。不过此次Nehalem-EX是由位于加利福尼亚州的研发中心推出的。一般认为该研发中心担任着IA-64系列服务器CPU的研发工作。
下面Nehalem-EX的内核布置。部分使用了ISSCC公布的资料。因此资料并不准确只是大概的内容。
Nehalem-EX核心布置
基本的构成,在CPU内核的中央集成了系统逻辑(集线器和路由器、内存控制器等)。对应核心中中央的上下位置分成了8个部分,对应的是24MB共享L3缓存现金。成L3缓存一样分别对应的是8个CPU核心。核心上面拥有4个内部链接「QuickPath Interconnect(QPI)」。核心下为内存接口,有4通道。
Nehalem-EX的生产工艺与四核心的Nehalem处理器一样都为45nm。晶体管数量为23亿。相比四核心Nehalem的7亿3,100万相比的话,提升了约约3倍。但是核心尺寸却只提升了约2.4倍左右(600平方mm)。同时TDP也保持不变为130W。
封装尺寸为49.1×56.4mm,LGA插座针脚数量为1,567。原因是为了实现Beckton系列IA-32/Intel 64系服务器CPU与IA-64系CPU插槽互换的计划,不过现在发生了变化无法进行互换。
CPU核心与四核心Nehalem相似
从Nehalem-EX的内核布局马上注意到Nehalem-EX的CPU内核与四核心Nehalem的CPU内核极为相似。CPU核心纵横比基本上相同,如果仔细看的话就会发现CPU内核内部的布置基本上也是一样。这个表示Nehalem-EX相对于Intel Nehalem CPU核心的改变并不大。如果进行比较Nehalem-EX和四核心Nehalem的话,会发现CPU核心尺寸差不多,而且比例也基本相似。
Nehalem-EX与Nehalem(Bloomfield)
Nehalem系列CPU内置了256KB的二级高速缓存,CPU核心为矩形结构。之所以选择矩形是因为可以方便得增强核心数量,容易开发派生产品。而Nehalem-EX使用这个布置则证明了这个事实。
CPU内核自己大体上不变化,则表明Nehalem-EX的L1和L2缓存容量与等待时间与四核心Nehalem相同。
缓存的等待时间
Nehalem-EX内部构成
Nehalem-EX配备了4个QuickPath Interconnect(QPI)链接,这样将可以组成更多的多重处理器构成QPI。据说每个QPI端口可以削减2W的电力,并且最大同时支持8个插座。
MP版Nehalem组成
Nehalem-EX的8插座MP结构
系统逻辑部分大型化
如果比较四核心Nehalem和八核心Nehalem-EX的话,就会看到CPU核心以外的系统逻辑部分Nehalem-EX更大。Nehalem-EX核心中心的带状系统逻辑处理部分与四核心Nehalem相比其面积大了3倍左右。这是因为CPU核心和接口数量增加的话也带来了调停系统逻辑的增加。
系统逻辑块中央拥有有「路由器」以及左右各一个的「集线器」。不过此次各个块的连接并没有公布,不过可以肯定的是Nehalem-EX8核心连接资源是充分的。这里8个核心所共享的24MB L3缓存分成了8个「(Slice)」。每个Slice由2048套的24个UEI组成,缓存容量为64 bytes。由于各个Slice分成了48个辅助阵列,这样访问的功耗只有整体的3.125%。

L3缓存
CPU核心与L3缓存在配置上似乎是成对的,不过Nehalem-EX无法实现分离控制。同时Nehalem-EX的L3缓存配备了数据阵列Column和Row冗长电路以及标记阵列Column冗长电路。如果这些出现缺陷,可以通过转入冗长电路进行弥补。下面是如果核心数量提升到25个后,L3缓存的缺陷。

CPU核心与L3缓存的无效化
支持各种各样的节电功能
Nehalem-EX与四核心Nehalem一样同样支持省电功能。每个CPU核心可以进入休眠状态,但是如果出同上述情况的话,切断的不仅仅是频率供电。因此每个CPU核心都配备有开关,控制电力。不仅仅是开关电流漏泄电流(Leakage)也可以控制。根据介绍现在CPU核心的漏泄电流比起主动状态时最低电压0.85v下可以减少40%。
由于L3缓存区域使用了可休眠晶体管技术,可以有效控制漏泄电流。对L3缓存有主动,sleeve和快速切断三种工作方式。处于sleeve状态时可以削减35%,而快速切断时电压可以降至0.36v,削减83%的漏泄电流。ISSCC上通过Nehalem-EX的红外线表明,关闭的核心和缓存基本上没有出现热量。
根据功耗测试,如果将CPU核心电力切断,那么通过CPU核心上配备的SRAM「State Storage」可以避免CPU核心内部运行。而数据则可以保存在CPU核心的SRAM区域。为此Nehalem配备了进行复杂电力控制的「PCU(Power Control Unit)」,而Nehalem-EX同样也有配备。
整体功耗削减16%
Intel现在在CPU的电路设计中分开使用通道长短不同的晶体管。对于critical path部分为了高速化通道使用了更多的晶体管。而在另一方面,对于不严重的部分,则使用的是「Long-Le」晶体管。
Intel通过65nm工艺使用了Long-Le(Subthreshold Leakage)。而在Nehalem-EX方面,CPU核心的晶体管的58%和缓存以外的Core部分的晶体管85%为长型晶体管。据说这样做是省电设计的结果,Nehalem-EX总功耗中漏泄电流占的比例为16%。而高端CPU现在漏泄电流多数达到了30%。而整体功耗比率,54.6%为CPU核心,AnneCore部分为33.4%而I/O部分为11.2%。
Nehalem-EX功耗
Nehalem-EX的时钟频率可以分成3块,分别为CPU核心、二级高速缓存Core域L3缓存与系统逻辑AnneCore区域,包括有内存接口和和QPI的I/O域。全部配备有16个PLL。CPU核心有8个QPI4个内存接口2个,AnneCore(包含L3)1个,过滤器1个。因此在各个区域可以获得独立的核心频率。
电压区域有4个。分别为为8个CPU核心提供0.85v1.1v的工作电压。L3缓存与系统逻辑的AnneCore域从0.9v至1.1v。而I/O区域则固定为1.1v。除此以外还有PLL和传感器部分。

PLL与DLL
Nehalem-EX工作电压
Intel最后推出的NetBurst系列以核心MP服务器CPU「Tulsa(Tulsa)」使用了Long-Le设备和L3缓存开关。我发现Nehalem-EX也是使用的是长管线。同时这点通过Nehalem基本架构的可扩展性也得到了证明。
可是如果像8核心那样带来的系统逻辑部分的增加也是显示了多核心化的过载。今后由于与集线器连接方式与现在使用的方式存在差异,内部连接技术必定会增强更多的CPU核心数量。而通过Cell Broadband Engine(Cell B.E.)则可以断定Larrabee最有可能会使用环形总线。