服务器 频道

评论:应用比摩尔定律更重要

    【IT168 专稿】引子: “2007年度技术卓越奖” 活动从7月份启动至今,有几百家厂商提交了上千款产品角逐十项技术卓越奖、二十项产品创新奖和一百项年度产品奖。我们的专家团队对于每一个候选产品的资料都进行了仔细的研究,观点冲突的激烈程度超出了我们的想象。通过本系列文章,读者将会体会到技术卓越奖评审过程的严谨,体会到我们对业界所投入关注的广度和深度。

    2007年,是CPU技术飞跃革新的一年。无论是采用45纳米新工艺的英特尔Penryn,还是拥有8核心64线程的Sun UltraSPARC T2,抑或是主频高达4.7GHz的IBM POWER6,都无不让人印象深刻。在今年技术卓越奖的评审过程中,这些堪称各家史上最强的CPU也引发了评审专家间的激烈辩论:到底谁的创新意义更大?谁能代表未来的方向?

谁会用到4.7GHz


    两年前,由于NetBurst架构功耗过高导致英特尔无法实现突破4GHz的诺言,曾经让人们一度认为见证了CPU 40年发展历程的摩尔定律即将走向尽头。但2007年5月IBM POWER6的出现,让人们又重新看到了高主频高性能的希望,而且IBM POWER6是在现有65纳米工艺下证明摩尔定律的继续有效——双核POWER6容纳了7.9亿个晶体管,核心面积341平方毫米,主频高达4.7GHz,采用65纳米工艺,速度比其上一代的POWER5快两倍,值得注意的是,用来运行和散热所需要的电耗却保持相同水平。这意味着用户可以在相同功耗水平条件下将性能提升一倍,或者在相同性能水平下将功耗减少50%。

    一些测试数据也证明,POWER6芯片的速度堪称一绝,基于POWER6的IBM System p 570在SPECint2006、SPECfp2006、SPECjbb2005和TPC-C四项典型的基准测试中占据首位,这是有史以来一个单一系统同时在这四项基准测试中占据领先位置。当然,这种领先的性能在很大程度上并不仅仅是因为高主频,而是得益于其系统的平衡设计——平衡地同时提升处理器性能、缓存容量和I/O带宽。每颗POWER6芯片的总L2缓存容量高达8MB——相当于POWER5芯片的四倍——保证有足够的数据来充分发挥处理器速度的优势;POWER6芯片的处理器带宽也高达300GBps。

    对于POWER6处理器而言,受到质疑的是,由于高主频往往总是伴随着高功耗的出现,尽管IBM此次通过一些节能降耗技术将POWER6的功耗保持在与POWER5相同的水平,但未来主频能否进一步得到提升,而且在多核化、并行化的趋势下,有多少应用需要如此高的主频?从应用面来看,POWER6也主要局限于IBM自身的System p和System i系列服务器中。另外,专家们也希望能够看到下一代POWER处理器在多核并行架构方面实现更大的创新。

CPU的步伐太快了


    跟IBM在现有65纳米工艺下通过提升主频来提升性能的做法不同,英特尔带来了半导体工艺和晶体管材料层面的创新——2007年11月英特尔祭出了其基于45纳米高K栅介质45nm硅制程技术的新一代处理器Penryn。

    从工艺层面看,更精细工艺的采用使得英特尔可以在相同大小的芯片中塞进更多的晶体管,做成更大的缓存,并在保持功耗相同的情况下提升主频;从半导体材料层面来看,Penryn最大的突破在于采用金属铪替代二氧化硅,成为新的栅极氧化物,同时为了解决金属铪与原有的多晶硅栅极不兼容的问题,用新的金属物质替代多晶硅,制作新的栅极。英特尔公司联合创始人戈登•摩尔给予了这项技术极高的评价:“采用高-k栅介质和金属栅极材料,是自上世纪60年代晚期推出多晶硅栅极金属氧化物半导体(MOS)晶体管以来,晶体管技术领域里最重大的突破!能让摩尔定律在未来10-15年继续有效。”也就是说,45纳米技术由于解决了原来晶体管之间日益严重的漏电和功耗问题,为CPU未来的发展铺平了道路——要知道,在65nm的工艺中,二氧化硅层的厚度已经薄到只有5个氧原子了,基本接近物理的极限。

    英特尔认为,CPU工艺、CPU微架构设计以及以芯片组为代表的计算机体系架构是推动计算机系统效能不断提升的三大核心技术。为此,英特尔制定了“TICK-TOCK”战略,根据这一战略,每隔两年更新一次处理器微架构,每隔两年更新一次制造工艺,而且这两个核心技术不会在同一年出现。因此,2008年英特尔将在45纳米工艺的基础上推出全新的微架构——Nehalem。这将是英特尔第一款真正实现设计可扩充性的动态微体系结构,其革命性意义不仅体现在Nehalem会把产业带入8核时代,而是它采用了可扩展的模块化设计以及跟以往不同的系统架构,如改良前端总线架构,集成内存控制器,集成图形处理器,采用QuickPath直连总线技术,从而使性能、功能可根据能效和不同应用领域进行动态扩充——英特尔和AMD的做法殊途同归——后者在2003年推出皓龙处理器时就采用了类似架构:直连架构、超传输(HT)总线、集成内存控制器,并计划在CPU中进一步集成GPU。

    对Penryn而言,评审专家形成了两派意见:一方认为45纳米技术只是半导体基础工艺方面的进步,不能代表CPU本身的技术革新,在英特尔之前,这一工艺已经被东芝、索尼和NEC等企业采用;另一方则认为,45纳米工艺和新材料采用的意义在于为未来打好基础,铺平道路,而且在主流CPU领域,英特尔是第一家实现45纳米产品量产的企业。不过,专家们普遍对英特尔过快的产品更新换代速度提出了质疑,65纳米、酷睿微架构、45纳米、Nehalem微架构、32纳米……CPU的发展速度已经明显超出了其他硬件特别是软件的发展,一年一次的重大革新是否真的有必要,而且如何保护下游OEM厂商和用户的投资?相比较而言,AMD的创新虽然不如英特尔频繁,但平台也相对更加稳定。

一个芯片上的64路系统


    谈了IBM和英特尔,我们再来看看Sun。对于SUN公司而言,尽管其于8月份新推出的UltraSPARC T2(研发代号为Niagara 2)主频不算高——不到2GHz,工艺不算先进——不过65纳米,但在多核微架构设计方面却走得更远——该处理器有8个内核、每内核可以执行8线程,从而实现单芯片的64线程。1997年,Sun公司推出的企业级数据中心服务器Sun Fire E10K也不过64个物理处理器内核,提供64个线程。10年间,Sun就在一个处理器上实现64个线程。作为对比,Sun Fire E10K企业级服务器有1人多高,而UltraSPARC T2处理器仅有成人手掌的1/3~1/4大小。

    UltraSPARC T2领先的模块化的微架构设计给评审专家留下了深刻的印象——集成8个内核,共64个线程,每线程2瓦特,8个浮点单元,2个万兆以太网口、8个密码加速单元、4个内存控制器、8个I/O通道。而且,由于每个线程都能运行自己的操作系统,因此该处理器芯片就象在单芯片上提供了一个巨大的64路系统。UltraSPARC T2通过将虚拟化、处理、网络连接、安全特性、浮点单元和加速内存访存等功能单元集中到一块芯片上,降低了成本,提高了性能、可靠性和功效,使其应用领域变得非常宽泛——服务器、存储、路由器、交换机、网络器件、医学影像和工业印刷等。2008年,SUN还将推出代号为Rock的的16核心UltraSPARC处理器。

    当然,这一产品并非完美。跟POWER6相比,UltraSPARC T2目前只能用于单路服务器中,主频仅900MHz到1.4GHz;跟Penryn相比,UltraSPARC T2采用的是65纳米工艺,而且对主流服务器市场的影响力也不可同日而语。

    尽管CPU之间的竞争还远没有结束,尽管未来还存在许多可能,但我们还是能隐隐约约地看到,英特尔、Sun和IBM用不同的方法为我们指引了不同的道路——继续遵循摩尔定律,不断提升性能,降低功耗。但是我们也看到,除了性能问题之外,这些厂商要面临许多共同的棘手问题:如何更有有效地降低功耗?如何更有效地实现同构或异构多核的扩展?如何更有效地实现虚拟化功能?如何更有效地实现CPU与内存、I/O之间的平衡?如何更有效地帮助软件界面对CPU多核化所带来的并行化挑战?如何让IT与应用实现良性的平衡发展?……显然,在应用日趋多样化、世界越来越“平”的今天,厂商要做的不仅仅是芯片,我们要的也不只是CPU!因此,我们能否延续摩尔定律其实并不重要,重要的是,能否引导产业应用进入一个新的境界!

0
相关文章