服务器 频道

NVIDIA公司王鹏简介

  

NVIDIA王鹏简介
▲NVIDIA公司高性能计算开发技术中国区经理 王鹏

  个人介绍:现任NVIDIA 高性能计算开发技术中国区经理,主要负责 GPU 并行算法的开发及优化。之前他在 NVIDIA 美国总部任高性能计算高级工程师,主要负责商业 CAE 软件及分子动力学软件中 GPU 求解器的开发与优化。曾获南开大学科学计算及应用软件系学士学位及斯坦福大学物理系计算物理方向博士学位。

  演讲主题:CUDA 优化基础

  演讲概述:该演讲将介绍CUDA 中延迟优化,内存优化及指令优化的技术。首先介绍NVIDIA Fermi GPU 的体系结构,并讨论CUDA kernel 瓶颈的分类与测量方法。在延迟优化中我们将主要讨论如何提高线程数来隐藏延迟。提高线程数的主要技术是配置kernel 的资源使用。内存优化中会重点讨论全局内存合并访问的规则及优化方法。同时会使用矩阵相乘的例子来介绍共享内存的使用。指令优化主要讨论分支发散及各种指令的吞吐率。最后还将介绍如何使用CUDA 流来使数据传输及计算异步执行。

0
相关文章