服务器 频道

Intel 32nm Westmere-EP处理器首发评测

  SiSoftware Sandra的缓存内存性能测试也比较有参考价值:

SiSoftware Sandra Pro Business 2010
测试对象
双路Intel Nehalem-EP
Xeon X5570
双路Intel Westmere-EP
Xeon X5670
双路Intel Westmere-EP
Xeon X5680
Memory Bandwidth Benchmark
内存带宽测试
Int Buff'd iSSE2 Memory Bandwidth
38GB/s35GB/s35.2GB/s
Float Buff'd iSSE2 Memory Bandwidth
38GB/s35GB/s35.18GB/s
Memory Latency Benchmark(Random)
内存延迟测试(随机)
Memory(Random Access) Latency
(越小越好)
80ns83ns82ns
Speed Factor
(越小越好)
55.5057.0064.60
Internal Data Cache
4clocks4clocks4clocks
L2 On-board Cache
11clocks10clocks10clocks
L3 On-board Cache
49clocks57clocks60clocks
Memory Latency Benchmark(Linear)
内存延迟测试(线性)
Memory(Linear Access) Latency
(越小越好)
7ns7ns7ns
Speed Factor
(越小越好)
4.805.105.50
Internal Data Cache
4clocks4clocks4clocks
L2 On-board Cache
10clocks11clocks11clocks
L3 On-board Cache
13clocks13clocks13clocks
Cache and Memory Benchmark
缓存及内存测试
Cache/Memory Bandwidth
142GB/s183.26GB/s195.6GB/s
Cache/Memory Bandwidth vs SPEED
49.57MB/s/MHz63.96MB/s/MHz60.07MB/s/MHz
Speed Factor
(越小越好)
21.2031.0035.20
Internal Data Cache
471GB/s663.51GB/s744.49GB/s
L2 On-board Cache
295.4GB/s537.88GB/s611GB/s

   不出意外的是,Westmere-EP的内存读写带宽数值反而要低一些——它们的内存存取延迟也要长一点。内存带宽低了约7.4%,内存随机延迟高了2~3ns,L3缓存延迟高了约10个时钟周期。为什么会这样呢?因为Nehalem-EP/Westmere-EP所有的核心都是通过一个交叉开关的结构来连接到L3缓存乃至内存控制器、QPI的,核心数量越多,那么核心访问发生冲突的几率就越大,这导致了其内存潜伏期的提升。在八核心的Nehalem-EX上,为了避免这种情况变得更严重,开始采用了新的总线来代替这个交叉开关,如下所示:

 
Nehalem-EX:Ring Interconnet

ISSCC 2010:Nehalem-EX的环状总线架构

   这个总线提供了极高的带宽(一共1.2TB/s)和很低的延迟(5个时钟周期)。在Nehalem-EX的发布文章当中笔者将会继续解析这个结构。

0
相关文章