嘉宾介绍:毕业于北京邮电大学多媒体与模式识别专业,硕士学位。拥有多年CUDA开发经验与丰富的实际工作经验。在NVIDIA公司高性能计算开发技术组主要负责视频分析领域的项目研究,协助多家企业开发过指纹识别,入侵检测,车辆识别等多款基于GPU的产品。并且在分子动力学方向参与过大学与研究机构的多个重点项目。
演讲主题:CUDA 编程与优化
主题概述:在CUDA编程部分首先通过对比CPU与GPU架构,介绍异构计算的概念。通过几个实例Helloworld, Memory Management, 与VectorAdd介绍CUDA编程的基本方法。然后进一步通过实例介绍GPU内存的层次模型。
在优化部分,主要介绍基于分析的优化方法。然后针对三种不同的bottle neck,内存受限型,指令吞吐受限型,延迟受限型,介绍各自的优化策略。