服务器 频道

AMD称双调度器设计提升推土机浮点效率

  【IT168 资讯】对于将要推出的Bulldozer架构,AMD公司仍然坚持严格保密的态度。最近该公司表示其新的FPU(浮点单元)将会被称为Flex FP,并且承诺将会带来高性能的计算性能,同时在尺寸及功耗方面将极具效率。

  我们都知道,AMD Bulldozer处理器是由多个所谓的模块组成。每个模块将拥有2个整数引擎以及一个由"Flex FP" FPU双128-bit FMAC组成。另外就是根据AMD的介绍,FP与整数单元使用统一的调试器也会影响到效率。
 

AMD称双调度器设计提升推土机浮点效率

  AMD的服务器/工作站产品经理John Fruehe表示:“每个Flex FP均拥有自己的调度器,并不依赖整数调度器来调度FP指令,或者会使用整数资源来调度256-bit执行。这将有助于确保FP单元在浮点指令发生时保持完整。我们竞争对手的架构拥有一个单独调度器同时满足整数和浮点,这意味着无论整或者浮点指令都会受到单独的共享调度器的影响。”

  当前的128-bit FPUs能够在一个并行的循环执行四条单精度指令或者2个双精度指令。而将要推出的AVX技术则可以在一个循环执行8条32-bit指令或者4条64-bit指令。

  Flex FP的出彩之处在于其单个256-bit FPU可被2个整数核心共享。每一个循环任何一个核心将可以通过2条128-bit指令或者一条256-bit指令运行256 bits并行数据,或者每个整数核心能够同时执行128-bit指令。

  “在当前典型的数据中心负荷中,大量的处理都是整数和较小部分的浮点。因此在大多数案例中,你并不会希望一个巨大的256-bit浮点单元占据了所有的核心空间以及所有的功耗,当整数核心处理所有的重担时在一旁看热闹。通过每2个核心共享一个256-bit浮点单元,我们可以减少核心尺寸以及功耗,从而有效降低购买成本和长期维护成本。”

  在采用了共享Flex FP设计之后,处理器的功耗必然会出现下降。这也将会使得AMD能够在其中加入更多的整数核心。根据AMD的介绍,在采用了Flex FP设计后,待机时功耗仅为运行时的2%。

0
相关文章