服务器 频道

IBM POWER7服务器开启小型机新纪元

  内存与缓存对于处理器的性能有着重要的作用,基本上第一代新处理器都会在这两点上做文章,而POWER7在这方面的改进也非常大。

  IBM对于eDRAM比较偏爱,在IBM看来,eDRAM在性能、带宽、能耗方面达到了一种理想的平衡,它的性能(带宽、延迟)虽然不如SRAM,但所需的晶体管数量也要少很多,所以在能耗与成本方面也更为出色。因此,可以在有限的晶体管数量下,提供更大的缓存容量和更平衡的表现

  在POWER7之前,Power4/5/6也是采用了eDRAM三级缓存,但是在片外的,并不与处理核心融为一体。而随着CPU核心数量的提升,CPU插槽的引脚数量已经很难满足CPU核心与片外的缓存相连,因此这次在POWER7中,将eDRAM三级缓存移到了芯片内部,从而也成为了首个使用片内eDRAM三级缓存的处理器。

  POWER7处理器的芯片结构布局,每个核心都有专属L3缓存(Fast L3 Region),容量4MB

  POWER7的L3缓存设计,IBM采用了一种被称为Fluid(流动)的混合L3缓存结构

  eDRAM的性能介于传统的SRAM缓存与SDRAM内存之间,延迟性能比本地内存低3倍,不过IBM为POWER7的每个核心都划定了自己的专属L3缓存区,即Fast Local L3 Region,这个区域的容量为4MB,8个核心正好是32MB。每个核心访问自己的专属缓存里的延迟比整体的L3缓存延迟还要低5倍,并且L3缓存中的容量可以根据情况迅速的克隆至多个核心的专属区,以方便多核心的共享访问。

  POWER7的L3缓存也可以在某种情况下被单个核心所独享

  POWER7的三级缓存的另一个特点就是,每个核心虽然有自己的专属缓存区,但当有些核心未使用时,它们所对应的专属缓存区将会共享,如果只有一个核心工作,那就意味着它的L3缓存将达到32MB的容量。当然,访问自有专属缓存区之外的三级缓存的速度将会降低,但容量的增加是不可比拟的。

  谈完L3缓存,再来看看L2缓存。与Power6相比,POWER7的L2缓存的容量只有它的1/16,不过按IBM的说法它非常的快。而且L3缓存本身就在片上,而Power6的L3缓存在片外,工作主频是Power6主频的一半,所以里外对比,POWER7的L3缓存的效率显然更高,这也让L2缓存的压力大大降低。

  POWER7的整体缓存设计

  POWER7中的L2缓存(L2 Turbo Cache)的延迟比每个核心专属的L3缓存还要低3倍,将有效的降低L3缓存的功耗并提高性能,而从总体的缓存设计上,我们能看出来,只有到了POWER7这一代,才真正开始了传统快速SRAM与eDRAM在缓存架构中的平滑结合

  POWER7的内存架构设计

  POWER7的内存采用了业界主流的DDR3内存,CPU内置两个内存控制器,不过内存控制器并不是与内存DIMM直接打交道,而是通过一个高级缓冲芯片(ABC,Advanced Buffer Chip)访问DDR3内存,每个控制器有4个ABC通道。这个ABC有点类似于FB-DIMM上的高级内存缓冲器(AMB),与内存控制器之间应该是以串行总线相连,每个通道的数据位宽是16bit,传输率为6.4GT/s,这样8个通道的数据带宽就是102.4GB/s。而ABC也对应着8个DDR3通道,规格不凡为DDR3-1600,目前来看,每个DDR3通道可容纳最多4条DIMM,以DDR3-1600计算,8个通道的带宽也正好是102.4GB/s,而以单DIMM 8GB的容量计算,单颗POWER7的内存容量为256GB,平均每核心32GB。与Power6相比,POWER7的内存带宽提高了一倍(Power6最高支持DDR2-800),不过由于POWER7的核心数量提高,所以相对于Power6每核心最多48GB的内存容量,有所降低。

  另外,POWER7的内存架构也支持高级的电源管理和RAS特性,这一点将在下文进一步介绍。

0
相关文章