服务器 频道

NVIDIA高性能计算开发技术经理 王鹏

        【IT168 资讯】现任 NVIDIA 高性能计算开发技术中国区经理,主要负责 GPU 并行算法的开发及优化。之前他在 NVIDIA 美国总部任高性能计算高级工程师,主要负责商业 CAE 软件及分子动力学软件中 GPU 求解器的开发与优化。曾获南开大学科学计算及应用软件系学士学位及斯坦福大学物理系计算物理方向博士学位。

NVIDIA高性能计算开发技术经理 王鹏
▲王鹏(在SSC大会上演讲)

  演讲主题:CUDA 优化基础

  演讲概述:介绍 CUDA 中延迟优化,内存优化及指令优化的技术。首先介绍一下 NVIDIA Fermi GPU 的体系结构。然后讨论 CUDA kernel 瓶颈的分类与测量方法。在延迟优化中我们主要讨论如何提高线程数来隐藏延迟。提高线程数的主要技术是配置 kernel 的资源使用。内存优化中主要讨论全局内存合并访问的规则及优化方法。我们也会使用矩阵相乘的例子来介绍共享内存的使用。指令优化主要讨论分支发散及各种指令的吞吐率。最后我们介绍如何使用 CUDA 流来使数据传输及计算异步执行。

0
相关文章