服务器 频道

NV发布CUDA 3.0 全面支持C++力挺Fermi

    【IT168 专稿】本周,Nvidia正式发布了CUDA系列开发工具包的第三个版本“CUDA 3.0 Toolkit”,其中最引人注目的是加入了对C++编程语言的支持,并支持NV即将推出的Fermi架构GPU(点击这里下载CUDA 3.0详细说明和相关资源)。

    由于去年底Nvidia发布了全新的Tesla 20系列并行计算卡(Fermi架构),但是CUDA编程环境却仍然停留在2.0阶段,因此无法支持Fermi架构GPU的诸多新特性。而最新推出的CUDA 3.0则支持包括Tesla 20系列、Geforce GTX 400系列、Quadro专业显卡等三大产品线的所有Fermi架构GPU核心。

    从Nvidia发布Fermi时公布的数据来看,Fermi架构拥有完整的16组SMI阵列,每组又有32个流处理器(Nvidia称之为CUDA核心),总共512个,但是实际上Tesla 20系列使用的GPU屏蔽了两组SMI阵列,因此实际拥有448个流处理器。其原因也很简单——为了控制功耗。服务器功耗现在已经成为数据中心和企业在选择IT设备时必须考虑的关键因素,而Tesla 20系列在正常负载的情况下功耗可达190瓦,而满载功耗最大可以达到225瓦,不过就计算性能和功耗比来看,Fermi拥有的30多亿个晶体管将带来前所未有的浮点运算速度。

    而想要应用Fermi的所有性能,就必须拥有全新的程序支持。众所周知的是GPU并行计算的编程是非常复杂的,因此很多程序员并不看好基于GPU的通用计算。而CUDA的出现恰恰解决了这一难题。新发布的CUDA 3.0支持原生64位GPU核心,多重复制引擎,ECC精确纠错,并行内存执行,CUDA-gdb支持Fermi硬件挑事,Visual Profiler CUDA C和OpenCL硬件分析。

    据了解,新的CUDA 3.0支持Windows XP、Vista、Win 7等经典系统,并支持Fedora 10、RHEL 5.3/4.8,Open SUSE 11.1 SUSE Linux Enterprise 11等Linux阵营的操作系统,当然也包括了苹果的MAC OS X(均支持32/64位版本)。值得注意的是,CUDA 3.0首次支持C++类继承和模板继承,从而提高编程灵活性,同时CUDA C/C++内核现在以标准ELF格式进行编译,还增加了一个新的Direct3D、OpenGL统一协作API,支持OpenGL纹理和Direct3D 11。

0
相关文章