服务器 频道

IDF2010:Sandy Bridge处理器与AVX详解

  【2010年IDF报道】由英特尔主办的全球IT界高水平的技术论坛活动——2010英特尔信息技术峰会(Intel Developer Forum, IDF),将于4月13至14日在北京国家会议中心举行。这是IDF连续第4年在中国首发。本届IDF以“智领先机,共创明天”为主题,旨在抓住智能计算和个性化互联网时代机遇,揭示产业发展脉动,携手合作伙伴引领创新,抢占复苏增长之先机。


点击查看IT168关于2010IDF专题报道

  在14日的技术讲座上,Intel在307B课室用了整整两个小时的时间介绍了其下一代处理器架构Sandy Bridge以及Sandy Bridge上的新指令集:AVX(Advanced Vector Extensions,高级矢量扩展)。

  所谓的矢量,就是带有方向的标量……在数学上的表现就是多个参数的代数式,也就是多个标量的集合。为了更好地表示多个标量,AVX高级适量扩展将原有的128位浮点指令扩展到了256位,可以同时处理8个32位(4字节)的浮点数或者一个256位的数:

  AVX指令集是和Sandy Bridge微架构紧密结合的,因此,微架构的浮点寄存器也要从128位扩展到256位,此外,Load单元也要适应一次载入256位的能力,Sandy Bridge没有直接扩展原有Load单元的位宽,而是通过增加了一个Load单元来达到256bit Load的能力,如下图所示:

  可以看到,在0、1、5端口都增加了256位宽度AVX指令执行单元。


新的3、4操作数指令格式是非常重要的革新,希望笔者还有机会对它进行进一步的解释

 

 

 

 

 

 

 

 

最后,Intel提到了,由于128位SSE指令与256位AVX指令位宽不同,在混合编码的时候,指令切换需要进行额外的寄存器高位保留操作,因此混用SSE/AVX将会导致性能损失。应尽量向新指令集进行迁移


最后,Intel给出了在如前所述的4种常见运算下的AVX指令集加速比(AVX vs SSE over Sandy Bridge)


最后的最后:下一代增强指令集FMA介绍,FMA是同时进行一个乘法和一个加法的运算,在图形操作上很是常见

0
相关文章