Nehalem处理器的多种改进

Nehalem相对于Penry做了多个方面的改进,主要包括增强的处理器内核、新的SSE4.2指令集、改进的锁存支持、附加的缓存层级、改进的环流、更好的分支预测、更快速的虚拟化、同步多线程、更深度缓冲等等。
在酷睿2处理器中引入了宏融合的功能,它可以将条件分支后的Test/CMP看做单一一条指令,从而提升执行效率。Nehalem中定义了更多的宏融合机会,并且增加了64bit宏融合模式。

利用环流检测器,可以尽量的避免不必要的分支预测和取指令,从而达到提升效能甚至节能的目的。Nehalem扩大了可检测数据环的大小,从而进一步提升环流检测器的效果。
分支预测功能是确保在当前复杂的处理器架构和应用的环境下,得到高效的计算系统的必要功能。英特尔一直在不断的改进着分支预测的准确率,从而提升处理器的性能同时降低不必要的功耗。
为了保证强大的执行单元获得足够的供给,Nehalem将保留站点(Reservation Station)的数量扩充到了36个,相应的负载缓冲器和存储缓冲器也做了增加。
Nehalem增加了新的低延迟联合二级TLB数量;优化了无排列指令,编译器可以更随心所欲的使用无排列指令;更快速起始同步。这三个方面使得Nehalem在内存子系统方面会有进一步的改进。

同步多线程(SMT)功能可以算是HT技术的回归,Nehalem处理器中的每个核心可以运行2个线程,从而更加充分的利用处理器的各种资源,这主要得益于Nehalem具有更大的缓存和更高的内存带宽。

Nehalem为虚拟化应用做了进一步的改进,主要是减少转换延迟、减少虚拟处理器ID转换成本、减少EPT(扩展页表)转换次数。从英特尔展示的数据来看,Nehalem虚拟化应用的延迟会比上一代产品缩短40%以上,这是一个很让人期待的数字。

STTNI(字符串文本新指令)和ATA(面向应用的加速器)是SSE4.2相对于SSE4.1最大的改变。Intel C++ Compiler 10.x和Microsoft Visual Studio 2008 VC++均已经实现了对于SSE4.2的支持。
期待精彩第二天
2008年春季英特尔信息技术峰会的第一天,英特尔带给了我们不少的惊喜。IT168派出了前所未有的报道团队对于这一IT盛世进行报道,请广大读者密切关注。点击下面的Banner可以让你“亲临”2008年春季英特尔信息技术峰会现场。