服务器 频道

X86巅峰 Intel Nehalem-EX架构深入解析

  我们已经知道,Nehalem-EX的Uncore架构处处都透露着不同,这首先要从L3缓存以及与核心 之间的互联总线说起,看过的朋友可能知道Nehalem-EX使用了独特的环形总线,不过现在我们可以看到更多的细节:

   和普通的Nehalem不同,Nehalem-EX的L3缓存容量达到了24MB,每个核心可以分到3MB,比Nehalem-EP/Westmere-EP的2MB要更大。大容量缓存在大型系统下是相当有必要的。此外,Nehalem-EX的L3缓存真的是分成了8个3MB的Slice(块),每一个L3块在每一个时钟周期可以同时进行4个存取操作,这样Nehalem-EX在同一个时钟周期就可以同时进行32个L3缓存操作,并且经过哈希计算,可以将操作分散到多个L3 Slice上,避免了热区效应(hot-spot)。通常的处理器中,共享的LLC缓存只会有一个端口,同时只能进行数个操作。


Nehalem-EX:Ring Interconnet

  多个核心/L3块之间的互联通过一个环形总线来完成,而通常的Nehalem处理器则是通过传统的Crossbar来进行,在Intel 32nm Westmere-EP处理器首发评测中我们对Westmere-EP进行的测试结果表现, 六核Westmere-EP比四核Nehalem-EP的L3缓存内存潜伏期有所上升,内存带宽也下降了,这表明了传统架构在核心数量变多、访问冲突增加之后的效应。要想达到8个或者更多的核心数量,最好是:使用其他的总线架构,就像Nehalem-EX这样。

 

  Nehalem-EX的环形总线包含了两个方向相反的环,包含了10个站(8个Core/L3站,两个外部IO站),相邻站之间通信只需要一个时钟周期,每个方向具有32Bytes(256bit)的带宽,运行频率为Uncore频率,可以提供很高的总带宽。在起步阶段,它可以提供200GB/s以上的带宽,平均延迟约21ns

0
相关文章