GPU(图形处理器)计算模型在一个异构计算模型中同时使用了CPU和GPU(图形处理器)。应用程序的顺序部分在CPU上运行,计算密集型部分在GPU(图形处理器)上运行。虽然应用程序使用了GPU(图形处理器)的卓越性能来提升运行性能,但对用户而言,他们所能感知到的将仅仅是运行速度更快的应用程序。
应用程序开发人员将需要修改其应用程序中的计算密集型内核,并将其关联到GPU(图形处理器)。应用程序的其它部分将仍然依赖于CPU进行处理。将一项功能关联到GPU(图形处理器)需要重写功能,以在其中支持并行处理,同时添加“C”关键字以在应用程序和GPU(图形处理器)之间往返传输数据。
GPU(图形处理器)计算得到了NVIDIA(英伟达)被称作CUDA 架构的GPU(图形处理器)大规模并行架构的支持。CUDA 架构由100多个处理器内核组成,这些内核能够协作运行来处理应用程序中的数据集。
Tesla 10系列GPU(图形处理器)是第二代CUDA 架构,包含有专为科学应用程序优化的特性,如IEEE 标准双精度浮点硬件支持、以分布于GPU(图形处理器)中的共享内存形式存在的本地数据高速缓存、以及结合内存访问等。(完)