服务器 频道

IA32多媒体指令集革命 Intel SSE4前瞻

  SSE4图形加速部分包括了32条指令,包括了图形构造上的大量基本操作指令:点积、双字节乘积、非单位步长存取等,并对现有指令的交叉支持改进了编译器的向量化,这部分指令相当于重新提供了一个向量化的图形操作基础,可以极大地提升处理器在图形处理方面的能力。

  32条指令具体划分6个部分:

12条32位向量整数操作,用于提供快速的向量整数运算

7条非单位步长存取操作,提供快速的向量载入/保存

2条点积操作,在构造阵列(Array-Of-Structures)运算中可以提供非常快的点积运算能力

6条变量及立即混合,用于提升传统SIMD代码的性能

1条早期参量输出,可以快速测试128-bit宽度数据

4条浮点取整,用于如Floor()、Ceil(),NINT(),nearbyint()这些经常用到的高级语言代码,提高他们的性能

  作为例子,32位向量整数操作指令是当前编程语言原语的向量版本,包括了双字节乘、填充双字节最小值/最大值、DWORD到Word组转换、QWORD比较等指令,右下显示了DWORD到Word组转换使用SSE2和SSE4指令分别编写的情形:SSE4只需要1条,而SSE2需要11条。

0
相关文章