3)多核芯片与RISC SMP的相似性
我们注意到,在多核芯片与上世纪90年代中繁荣了RISC服务器市场的RISC SMP系统之间,存在着非常有趣的相似现象。在过去的10年中,RISC服务器市场的硬件收入可是达到了2400亿美元。
首先,传统的RISC SMP提供了易于使用、缓存一致(cache-coherent)、共享内存(shared-memory)的应用特性,未来的多核处理器也同样会提供这些价值,不同的是,SMP是在一个单一的芯片上来实现。
其次,二者拥有相似的主内存延迟比率。1995年,SGI POWER Challenge是当时中端市场上最畅销的HPC服务器——笔者之一(McCalpin)就曾买过一台8 CPU的系统,花了40万美元。在1996-1997年间,其CPU主频是90 MHz (11 ns),主内存延迟接近 1000 ns(即90 个时钟周期)。而到了2007年,一颗AMD四核处理器的主频将超过 2 GHz (0.5 ns),主内存延迟约为 55 ns(即110 个时钟周期)。比较一下,我们不难发现,主内存延迟的比率是多么惊人的相似,均在100个时钟周期左右。
再次,二者在字节/FLOP上也相似。对于RISC SMP系统来说,能否提供足够的内存带宽是一大挑战。一套配备8颗CPU的SGI POWER Challenge的峰值浮点运算性能是2.88 GFLOPS,最高内存带宽为1.2 GB/s,即平均每FLOP约 0.42 字节。而一颗AMD四核处理器的峰值浮点性能将达到32 GFLOPS,最高内存带宽约12.8 GB/s,平均每FLOP也大约是0.4 字节。