服务器 频道

高效计算 2008年度双路四核服务器横评

  工艺改进最直接的表现通常是能耗降低,我们先来看看Intel的45nm High-k工艺技术,当然45nm Xeon上的历史来看,这个工艺已经算是很“老”了,相信大家都有所耳闻:


Intel 45nm High-k

  在Penryn中,使用High-K半导体技术,可以在晶圆尺寸变化不大的情况下增加两倍晶体管从而提升CPU的性能。而High-K也时晶体管的开关速度有20%的提升。最为重要的是,在与目前酷睿2 CPU同等共号线,Penryn肯定可以提供更好的性能。下面我们来看Penryn在其他方面的改进和特点。

  除了工艺进步带来的效果之外,Intel处理器还主要通过几个手段来实现处理器电源管理以达到节能的目的,可以猜想,它们都属于动态地调节处理器主频和电压来降低非满负荷工作时不必要的能耗。


C1E & EIST(图上为Intel SpeedStep选项)

C1E Enhanced Halt State

  C1E Enhanced Halt State取代了传统x86处理器中常用的C1 Halt State。C1 Halt State和C1 Enhaned Halt Stat都是由操作系统发出的HLT命令触发,然后处理器就会进入到低功耗的挂起状态(Halt State)。老的C1 Halt State只是让处理器在相关时钟周期内出于挂起状态,而C1 Enhanced Halt State则会通过调节倍频来逐级的降低处理器的主频,以及同时降低电压来降低功耗、节约能源。

Enhanced Intel SpeedStep Technology

  SpeedStep是一个根据处理器负载来调节主频和电压的模块,不过它的触发机制同C1E Halt State是不同的。C1E Enhanced Halt State通过操作系统的HLT指令触发,而EIST须要主板、BIOS、操作系统的全面支持,操作系统通过ACPI进行调节控制。SpeedStep提供了更多的CPU频率和电压调节级别,因此可以比C1E Enhanced Halt State更加精确的调节处理器的状态。技术。

Deep Power Down Technology深层关机技术

  我们对C1E、EIST等技术已经熟知能详了,Deep Power Down Technology深层关机技术在先前架构的基础上再引入了一个被称为C6的深层关机状态(当然,还有一个C5,不过这不是重点)。在以往的状态中,休眠的处理器最低可切换到C4状态,此时核心电压会略微降低(EIST的功能),核心时钟和PLL始终都会进行关闭,L2缓存的数据会部分地写入到外部存储器,而L1缓存则会完全地写入外部存储器而处于休眠状态,而在新的深层关机状态中,核心电压会降得更低,L1、L2缓存电路会完全地关闭,此时处理器的功率会降低到一个前所未有的高度,大大地降低了待机能耗。

  当然,对于服务器来说,尽可能地让它多干活才是主要的,因此DPDT技术相对在桌面和移动领域更受关注一些。对于服务器CPU而言,EIST和C1E是主要的手段。

   虽然AMD的45nm Shanghai处理器在横评结束前就已经到达了我们测试实验室,然而就横评的宗旨——对比2008年市场上的主要服务器——来看,将Shanghai处理器计入横评就不太合适。因此我们对AMD的考量仍然是基于65nm的Barcelona处理器。

 

  Barcelona处理器支持DDPM(双动态电源管理,Dual Dynamic Power Management)功能,这个功能允许多处理器系统中的处理器乃至多个核心根据负载情况运行在不同的频率和电压下。同时,即便某个处理器或者某个核心处于低速状态,其内存控制器依然可以保持在高速状态下。此外AMD ColCore技术还可以通过关闭处理器中不使用的部分来节电。比如,内存控制器在执行读取操作的时候,可以关闭写电路。这个功能内嵌于处理内部,不需要驱动程序或者BIOS的支持。每次开关的最小单位是一个时钟周期,因此这个功能并不会影响性能。 AMD通过一系列的同功率有关的技术来确保处理器子系统和内存子系统具有更好的能效比。


L(Low Voltage)系列的Xeon处理器相信大家都很少接触,Intel还有UL等几个功耗更低也更加少见的系列

  除了EIST这些处理器内置的节能功能之外,一些厂商还通过特别的途径来达到节能的目的:低电压处理器,浪潮英信NF285E就采用了这样的产品,和通常的处理器相比,功耗更低。不过价格应该是稍微高一点。


Intel Xeon L5420处理器,2.50GHz,架构和E5420是一模一样的。L5400是Intel的第二代低电压处理器(L5300是第一代),L5420的TDP为50W,E5420的TDP则为90W(再说一次,TDP不是功耗)

  除了在物理手段(降低工作电压、频率等)对控制处理器功耗之外,一些厂商还通过一些技术来提高能耗比,从而提供了另一条降低功耗的路径:多线程技术(Multi-Threading)。和通常的多核心技术不同,多线程技术不需要大规模增加相应的电路,从而功耗轮倍提升,多线程技术只需要增加规模很少的部分线路(通常,约2%)就可以提升处理器的总体处理器能力,可以很简单地提升相关应用的性能。处理器设计上可以相应地减少物理核心,从而降低了功耗。


Sun UltraSPARC T1处理器,8核心,每核4个线程

  FMT——Fine-Grained MultiThreading随时可以在每个时钟周期内切换多个线程,以追求最大的输出能力——当然,随时可以切换也是有代价的,它拉长了每个执行线程的平均执行时间。Fine-Grained MultiThreading有时也叫Interleaved MultiThreading交错多线程或者Pre-emptive MultiThreading抢先多线程。Sun UltraSPARC T1处理器就采用了这样的技术。


IBM Power6处理器,双核,每核两个线程

Intel NetBurst或者Nehalem

  SMT和CMT(Coarse-Grained MultiThreading,粗粒度多线程)和FMT这两种多线程技术都不同——那两种技术被称之为TMT时间多线程。SMT——Simultaneous MultiThreading具有多个执行单元,可以同时运行多条指令,因此才叫做“同步多线程”!SMT起先源自充分挖掘超标量架构处理器的潜力——超标量的意思就是可以同时执行多个不同的指令。因此SMT具有最大的灵活性和资源利用率,然而实现也最复杂(当然比起多核结构来说就是小意思了)。

  这些多线程技术都可以明显地提升服务器应用的性能同时却并没有增加功耗,因此就功耗来说,要达到同样的性能表现,可以采用更少的处理器核心数量来降低能耗。Sun的单处理器64线程的UltraSPARC T1处理器就不支持多处理器(直到T2才开始支持),Sun倡导的叫做“绿色”芯片技术。

  同样,在Nehalem-EP(服务器版本的Nehalem)上也搭载了超线程技术(属于SMT),在我们的测试当中,单个Nehalem桌面版本就能和双Xeon平台打个不分上下:《性能大幅提升 Core i7 服务器应用测试》(Core i7属于桌面版Nehalem)。关于多线程更多的细节,可以看这里:《机密揭露:Intel超线程技术有多少种?》。

0