服务器 频道

四核处理器:大战之前的喧闹

    【IT168 专稿】早在04年超线程技术出现的时候,这种将并行处理能力放在特殊位置的技术就在向我们传达一个信息——未来的计算,是多线程的。

    而就在最近,来自Intel的消息,八核处理器已被内定于今年第四季度发布,与Intel的第一款四核处理器上市在同一时间。其竞争对手AMD也不甘示弱,在其2006年上半年的财报会议上透露,将4核心架构K8L产品的推出时间提前至2006年底。

    从去年中的双核到今年底的四核,K8又到Core架构,年初时业内权威就发表了IT行业技术走势预言:2006年,将实现从奔腾时代到多核时代的飞跃。

    如果说业界的这种“多核”脉动属于一种惯性竞争的结果,那让我们看看另一个例子:苹果公司,那个独立于PC的世界,也开始开发多核处理器,其新版本的Mac OS X也将支持多核心的CPU。

    据iSuppli公司预测,由于双核心处理器的出现,以及即将来临的多核心处理器,2006年多核心处理器销售额将由2005年的26亿美元增至132亿美元,到2015年可达到648亿美元之多。这样的市场是不容忽视的,而多核处理器在性能上的强劲表现,也进一步增强了开发商的信心。

前卫的“太阳”

    05年底,SUN在美国宣布推出UltraSPARC T1处理器的时候,就宣布了该系列处理器可以具有8个、6个或4个的内核,每个内核能够执行4个线程。虽然从单个核心的运行速度上来讲,T1仅仅是1.2GHz,但当8颗核心作为一个整体发挥作用的时候,它就相当于一个9.6 GHz的处理器。

    Sun的这种前卫做法,被其全球执行副总裁简单地概括为:“并行处理+简化”这样一个概念。也就是说, Sun选择不在单个处理核心的计算能力、GHz上做文章,而是通过节省芯片内的空间加入新的处理核心来提升芯片的整体性能。

    而Power5双核系列,双核安腾的随后推出,也印证了SUN在多核计算领域的独到预见性。

    尤其是在多核处理器的设计上,与Intel、IBM的SMT技术不同的是,SUN有自己独特的一个成就——CMT(片上多线程)。与之相比,SMT技术着眼点在如何压缩计算方面的时间,而Sun采用的CMT技术则希望在一个芯片上事务处理能力足够的强,单位时间内处理事务交易的能力是够强,而并不强调每一个CPU的速度有多么快。在提高CPU频率越来越困难的今天,这种简简单单行之有效的策略,再一次反映了Sun的一种简约高效的理念。

    就在大家紧锣密鼓的准备在四核处理器上大做文章的时间,SUN悄然发布了一份240多页的PDF白皮书,详尽地展示了新的OpenSPARC T1的性能。而其中最乍眼的就是八核:

8个Sparc V9处理核心,每核心4线程,共计32线程;
芯片间通信的交叉通道内部互连达132GB/s;
每核心16KB一级指令缓存,共128KB;
每核心8KB一级数据缓存,共64KB;
3MB二级缓存,4-way bank,12向关联,各核心共享;
4个DDR2内存控制器,每通道位宽144bit,总带宽峰值25GB/s;
IEEE754兼容浮点单元(FPU),各核心共享;
J-Bus输入输出接口,峰值带宽2.56GB/s,128bit多元地址/数据复用总线。

    SUN在带给了我们震撼的技术数据之后,再一次以行动证明了自己走在了前面。

低调的“蓝色巨人”

    IBM始终都是有些中庸的那种策略——不做最前卫的,但又不想放过有可能成功的机遇。

    面对SUN的超级多核旗舰——八核OpenSparc的震撼,IBM非常低调的没有在新闻上给业界爆什么猛料。但值得注意的是, IBM上周将他们的低端P Unix系统系统作了一些调整,主要是将芯片更换成新的Power5+系统和多核心模式。

    早在七月,IBM就将2.1GHz版本Power5+芯片应用在较高端的p5 590/595上。而现在,除了可以在IBM的全系列Unix系统中发现2.1GHz版本Power5+芯片的存在,IBM还通过对两个双核心Power5+芯片做些小小的变动,将运行模式更改到四核心。

    这种被称作“仿四核”的Power5+并不是满速运作,IBM将它的速度降到了1.65GHz. IBM的策划部门希望能够通过该四核处理器的号召力扩大其在入门级服务器产品市场的份额。而此前,IBM曾经推出了两款频率为1.5GHz的四核Power 5+服务器产品面向中高端市场。

    IBM公司发言人表示,这几款四核产品主要针对那些想获得四核设计优越性而又不想等待基于英特尔及AMD四核产品的用户群。老道的IBM在Intel和AMD的空隙时间内,见缝插针的推行了自己的四核初级产品。而IDC的分析表示,向入门级服务器产品的渗透将帮助IBM获得更大的服务器收益。尽管IBM在二季度保持着服务器市场31%的市场份额成为最大的服务器厂商,但与去年同期相比其收入略微下滑了2.2%。

    很显然,低调的IBM并不代表迟缓的IBM,这是其第二次全力投入基于Power 5+四核系统的p系列服务器市场。上次进入这一领域是在IBM推出基于第一代时钟频率为1.5GHz处理器的服务器时。

    IBM此次推出的服务器包括505Q Express、510Q、520Q以及550Q等4U系统。除了550Q系列为双插槽,其他的均为单插槽架构。IBM自称这种模式是“四核心共用一插槽,业界创新”。

急行的Intel

    英特尔在最近几个季度的业绩表现很不理想,但是它正在努力夺回失去的市场份额。从双核安腾2的发布开始,英特尔似乎已经开始在紧锣密鼓的准备着一场与时间赛跑的战争。尤其是与竞争对手IBM、AMD等在未来多核处理器的开发上展开你死我活的竞争。

    英特尔早就宣布将在今年提前发布四核服务器处理器和台式机处理器,其首席执行官奥特里尼说:“我们已经通知了客户我们将在今年第四季度发布原计划在明年上半年推出的台式机适用的和服务器适用的第一款四核处理器。”英特尔的四核Xeon服务器处理器的产品代码为Clovertown,四核台式机处理器的产品代码为Kentsfield。但随着SUN发布其八核心处理器的白皮书,Intel也急急得发布消息,称其八核处理器也将于今年底同步推出。

    来自其业绩和市场份额的压力,促使英特尔做出了这样急进的决策。虽然有评论指出英特尔所谓的四核心是整合了两个双核处理器的“合体”版四核。但这并不奇怪:英特尔的首款双内核芯片就是通过这种方法“炼成”的。

    日前英特尔公司的一款四核处理器Kentsfield已经对外曝光。这款处理器具有两个芯核、四个计算核心,主频2.4GHz,1066MHz FSB,65nm工艺制程。

    有关测试表示出,这颗四核处理器与Conroe 2.95GHz和Merom 2.96GHz的对比:在同时转换两个编码文件时,相比超频后的Conroe还可以将时间缩短33%,快了5分钟左右,更是超过了Merom 6分钟的时间。而据说其同时跑4个SuperPI算到1M位还可以保持在25秒左右的成绩,笔者只能用强悍来形容其并行性能。

    相比IBM的低调,英特尔倒是把棋都下在了明处,而在今年底的四核大战拉开序幕之后,尽快投入到45nm工艺才是英特尔当先要考虑的王道。

独行侠般的AMD

    8月中的64位Opteron双核处理器回击了安腾2的进攻,而且颇为符合AMD风格,再次向Intel提出了一个挑战:它可无缝衔接至即将推出的四核处理器。

    在英特尔决定将Kentsfield、Clovertown提前至2006年底推出后, AMD不甘示弱的也将其4核心架构K8L产品的推出时间提前至2006年底。CPU双雄原本在2007年才上演的4核心处理器大战将提前开打。可以说AMD在面对SUN的优势,面对IBM的低调伏击,面对Intel的大张旗鼓时,选择了正面出击的态度,表达了足够的自信。

    根据今年早些时候AMD的规划,其4核心处理器架构K8L,是采取单芯片封装4核心的作法,原本预计在2007年上半才要登场,如今AMD不但要将4核心的新处理器提前在2006年底上阵,还强调不排除比照对手英特尔的作法,把2颗双核心处理器组成的4核心处理器Deerhound架构产品,再提前上市。

    根据已经公布的AMD内部技术文档,AMD下一代四核心Opteron处理器将采用65nm工艺生产、共享三级缓存、HyperTransport x16互联、FB-DIMM内存支持、动态独立核心管理(DICE)等等。

    AMD宣称,其四核处理器的每个核心都具备“改进的分支预测”能力,可以在每个时钟周期循环内完成两个128-bit载入、执行最多四个双精度浮点操作,以及两个128-bit的SSE数据流,并支持SSE指令集扩展。

    而作为其四核处理器亮点的“动态独立核心管理”(DICE)四核心电源管理系统也非常有利的阐述了AMD的独特设计理念:资源的高效应用与能源的低消耗。这就是AMD宣称“四核心性能、双核心功耗”的技术保障。

    笔者认为AMD的独到技术总是能在关键的竞争时机里获得一些小的成效,这也是AMD的生存本色。


又一个摩尔时代的开始

    并行,整合,线程,变成了时下最时髦的词汇。双核的芯,四核的芯,八核的芯,CPU开始向一个全新的方向发展。现在的CPU厂商已经从追求CPU频率高低中解脱出来,而将目光放在具有更佳每瓦特性能(performance per watt)的多核处理器的竞争上。

    可以预见,在今后的日子里,集成更多的内核将依旧照着摩尔定律的法则进展。引用英特尔技术总监拉特纳的话:到2010年,芯片可能会集成有数十个内核;在未来10年后,从理论上说,芯片中集成的内核数量可能达到数百。

    时间会验证一切。

0
相关文章