4级缓存结构
处理器再快,如果数据供应不上,也只能干着急,这样缓存系统就变成非常关键了。
跟上一代的z10 EC大型机相比,z196增加了一级共享缓存L4,缓存容量也更大。新的缓存结构设计能够让数据更“接近”处理器,从而改善系统针对多种生产应用负载的性能。
比前一代产品显著增大的缓存——每核1.5MB L2缓存,每处理器24MB L3缓存,使得更多的数据可以“接近”处理器,从而提高处理速度,这对于商业分析类应用特别关键。
z196的四级缓存结构如下图所示:
每个核有自己的192KB L1缓存,分为128KB数据缓存和64KB指令缓存。每核还有自己的1.5MB L2缓存。L3缓存共有24MB大小,也是装在PU芯片上,被四个核共享。L4缓存则装在MCM上的两块SC(storage control,存储控制)芯片上,每块SC芯片有96MB,共192MB,被MCM上的所有PU共享。L2和L3缓存做在PU芯片上,用来减少处理器与L4级大共享缓存之间的延迟。L1和L2均采用store-through设计,即改变的数据同时也会存储在上一级缓存中,而L3和L4则采用store-in设计。
值得一提的是,SC芯片包括4个24MB eDRAM,虽然此前eDRAM被认为因为速度慢难以担当重任,但IBM已经在这一块取得了技术突破,而且,使用eDRAM可以实现更高的密度、更低能耗、更少软错误以及更好的性能。