在以往,缓存/内存上,AMD的Opteron和Intel的Xeon基本上是采用了两个策略:AMD Opteron采用了直联架构,处理器独立拥有L1/L2,所有核心共享L3,每一个处理器都直接访问RAM和另外的处理器;Intel Xeon则采用了传统的MCH架构,4核心处理器中,独立拥有L1,每两个核心共享一个L2,没有L3,此外所有的处理器通过FSB互通,以及通过FSB再通过MCH访问RAM。相对来说,在处理器大架构上,AMD的无疑更为先进一些。现在,Nehalem-EP也采用了直联架构,因此对比起来,AMD Operton的优势就消失了。
无论AMD还是Intel,目前的内存架构仍然是读取和写入对称:速度都一样。毫无疑问,虽然不同的应用具有不同的读写比,不过在大多数情况下都应该是读需求远高于写需求的,未来可能会采用特别为读取优化的不对称内存读写架构。
SiSoftware Sandra Pro Business 2009
|
|||
测试对象
|
Dawning I620r-G Nehalem-EP服务器 双路Intel Gainestown Xeon E5540 2.53GHz |
DELL PE2900 III 双路Intel Harptown Xeon E5430 2.66GHz |
|
Memory Bandwidth Benchmark
内存带宽测试 |
|||
Int Buff'd iSSE2 Memory Bandwidth
|
9.02GB/s
|
6.13GB/s | |
Int Buff'd iSSE2 Memory Bandwidth vs SPEED
|
9.43MB/s/MHz | ||
Float Buff'd iSSE2 Memory Bandwidth
|
8.90GB/s
|
6.13GB/s | |
Float Buff'd iSSE2 Memory Bandwidth vs SPEED
|
9.43MB/s/MHz | ||
Memory Latency Benchmark
内存延迟测试 |
|||
Memory(Random Access) Latency
(越小越好) |
96ns
|
108ns | |
Memory(Random Access) Latency vs SPEED
(越小越好) |
0.16ns/MHz | ||
Speed Factor
(越小越好) |
59.40
|
95.20 | |
Internal Data Cache
|
4clocks
|
3clocks | |
L2 On-board Cache
|
10clocks
|
18clocks | |
L3 On-board Cache
|
52clocks
|
||
Cache and Memory Benchmark
缓存及内存测试 |
|||
Cache/Memory Bandwidth
|
122.06GB/s
|
68.88GB/s | |
Cache/Memory Bandwidth vs SPEED
|
49.46MB/s/MHz | 26.52MB/s/MHz | |
Speed Factor
(越小越好) |
22.80
|
111.90 | |
Internal Data Cache | 398.74GB/s | 421.23GB/s | |
L2 On-board Cache | 368.03GB/s | 122.68GB/s |
SiSoftware Sandra对比,用蓝色标出了性能特出的项目
和上一页类似,采用了直联架构之后,Nehalem-EP的缓存/内存性能大幅度提升。