服务器 频道

Nvidia邓培智:CPU+GPU应对并发计算挑战

  【IT168 专稿】2012年9月18-21日,首届曙光超算技术大会(SSC 12,Sugon Supercomputing Conference 2012)在北京曙光公司总部盛大召开。本届大会面向广大从事与高性能计算应用、超级计算系统维护和应用相关的科研院所及高校老师、硕博研究生及相关企业工程师、从事高性能计算工作的技术人员,邀请重量级嘉宾,以及业界知名专家、以及Intel、Mellanox、Nvidia等知名厂商的技术专家等担任主讲教师,为与会学员奉献国内高性能计算培训的饕餮盛宴,帮助了解高性能领域的前沿技术,以及如何管理、使用、优化高性能集群。

  现场Nvidia公司CUDA及HPC项目高级经理邓培智先生接受IT168编辑独家专访,介绍高性能计算领域GPU的应用领域与范围,CPU+GPU异构计算独特的技术优势,以及Nvidia公司在促进GPU多核编程与应用移植方面所做的工作。

Nvidia邓培智:CPU+GPU应对并发计算挑战
▲Nvidia公司CUDA及HPC项目高级经理邓培智先生

  邓培智介绍,Nvidia公司强调CPU+GPU异构计算的模式应对大规模并行计算带来的挑战,GPU在并行计算领域拥有天然的优势,通过和CPU协同作用,整体系统达到最高效率。此外,云计算应用日渐火热,Nvidia公司也推出相应的解决方案满足用户需求,例如Nvidia Geforce Grid游戏加速解决方案,可以让用户在手机、平板电脑等移动设备上自由享受以往在PC上才能运行的游戏,iray云端渲染工具则允许用户将模版提交到云端进行渲染。

  此外,邓培智重点介绍了Nvidia公司全新的架构Kepler(开普勒),据介绍,Kepler性能比上一代产品有大幅提升,凭借该架构,用户可实现3倍的性能。更重要一点,Kepler(开普勒)的每瓦功耗产生的性能也比上代产品有显著提升,性能能耗比提升三倍,也就是说,在提供相同计算能力的前提下,Kepler(开普勒)的功耗只有过去的一半到三分之一,例如同样要实现100T的系统,过去需要5万瓦,现在只需要2万瓦能耗,这样就可以搭建非常绿色的系统。由于具备诸多创新的计算技术与特性,该架构可应用到更广泛的科学计算应用程序上,让应用程序开发者和研究人员能够更轻松地运用混合式计算。

  访谈全文如下:

  IT168.com:GPU在高性能计算领域侧重哪些应用类型?哪些领域尤其适合GPU?

  邓培智:GPU在高性能领域是以异构方式,和CPU共同对任务进行处理。GPU较为适合一些重负载的计算应用中,尤其是一些并行数据的应用领域,是GPU强项,在传统高性能计算领域,有很多这类型应用。数据量很大,有很高的并行度,这方面GPU有天然优势,GPU本身就是高度并行的架构。

  IT168.com:现在在谈高性能计算云,GPU在高性能计算云领域有什么前景?

  邓培智:云计算方面GPU已经有很多应用,具体来说,有很多人用云的资源做一些渲染方面的工作,游戏云也是非常热门的应用。我们就有专门针对游戏云的Geforce Grid解决方案,我们还有还有针对专业设计师VGX的解决方案、专门针对CAD、CAE人员,我们新一代开普勒(Kepler)解决了虚拟化等一些问题,对云计算也有非常好的支持。

  邓培智:我们的iray就是一个云端图形渲染的工具,比如把模型提交上去,进行渲染,速度非常快。是Nvidia针对云端渲染的解决方案。

  IT168.com:您提到了应用于游戏环节的Geforce Grid,能介绍得具体一些吗?

  邓培智:很多游戏对系统要求很高,很难在平板电脑、手机上运行,有非常复杂的光影特效,过去只能在传统的PC、游戏机上应用,现在通过Geforce Grid可以在平板电脑上、手机上运行,尽管游戏并没有运行在手机上,但是感觉就像在本地一样,GPU加速可以让延迟大大缩短。

  IT168.com:所以我们看到GPU不仅仅是和游戏结合,同时也是和移动互联网结合?

  邓培智:确实是,我们从技术上解决了一系列的问题,因为游戏对图形性能要求非常高,要求非常快速的反馈。我们也有类似VGX解决方案,支持再电脑上运行一些较大的专业应用,例如玛雅,在平板电脑上运行,感觉和在大型电脑上是一样的。

  IT168.com:您还提到开普勒(Kepler),是否能做更详细的介绍?

  邓培智:开普勒(Kepler)是全新的架构,解决了很多问题,包括性能问题,相比上一代产品有大幅提高,达到上一代产品一倍以上。另外非常重要一点,开普勒(Kepler)每瓦产生的性能能耗比过去好三倍,也就是说,提供相同计算的能力,功耗只有过去的一半到三分之一,比如过去同样要实现100T的系统,过去需要5万瓦,现在只需要2万瓦。可以搭建非常绿色的系统。开普勒(Kepler)是我们今年出的一个非常重要的架构,在不同的高性能产品里都被采用。

${PageNumber}

  IT168.com:对高性能计算来说,应用是个瓶颈,尤其是多核软件编程是很大的问题,Nvidia在促进多核编程上做了哪些工作?

  邓培智:我们提供各种各样开发工具促进应用一致,CUDA推出之后我们配套了很多工具,包括编辑器,是开发应用非常重要的一个工具平台,另外还有很多程序库,这些库都是一些已经开发和优化好的函数,如果你对开发程序感觉到有点困难,可以直接调用库,比如我原来程序里面使用FFD的函数,现在想使用不同的函数,只需要把库里现成的函数、使用GPU优化过的函数取代就可以。另外还有很多优化和调试的工具,这些工具都可以给开发者来一些便利。

  去年我们推出了非常重要的标准OpenACC,对于应用程序来说是非常重要的标准,应用人员不用重新编写整个程序,应用OpenACC标记语言,把写好的程序进行标记就可以实现GPU加速。例如我觉得某段代码最适合GPU开发,可以加上标记,让编译器知道这段代码放在GPU上运行,剩下的工作由编译器完成。实际达到的效果非常不错,大部分应用,用两个星期就可以把程序和系统匹配。

  我看到的最极端的情况,一些生命科学方面的计算任务,只用一天时间就让程序提高了20倍性能,这是非常极端的现象。但是OpenACC确实把GPU的开发难度降低了很多,整个程序不用重新写,只需要在现有程序做一些简单处理,就可以获得性能提升。

  IT168.com:GPU在处理一些大数据应用上有哪些优势?

  邓培智:大数据处理是GPU的强项,因为数据量越大达到的密集度越高,GPU的密集度和CPU不是一个量级,CPU现在8核已经到达极限,而GPU一般有1000-2000核,这种情况下需要更高的密集度将GPU计算能力填满。一般GPU对大数据而言拥有天然的优势。而且GPU带宽非常高,比如新一代开普勒(Kepler)能够达到每秒200T以上的带宽。

  IT168.com:您刚才也谈到GPU得天独厚的优势,哪些任务不适合GPU处理呢?

  邓培智:操作系统、信息计算是GPU的强项,但我们并不认为GPU适用所有的计算任务,有些计算以顺序计算为主,最好在CPU里完成。所以我们强调的是异构计算平台,非常重要的是强调应用适合的处理器来处理适合的计算任务。例如CPU顺序计算的能力很强,而GPU的长项在于并行计算,两者协作可以达到最高的效率。

  邓培智:高性能计算往往是非常高的计算密度,同时也是典型的并行系统,非常适合GPU处理。

  IT168.com:现在看高计算领域,GPU暂时还没有占领特别大的份额,您认为推广GPU是否会遇到瓶颈和问题?

  邓培智:推广GPU需要一个过程,因为大量的应用软件经过几十年的积累,都是在CPU上开发的,我们需要对应用软件进行改造、让它在GPU上也可以运行,因此需要一个过程。目前GPU的进展还是比较快,最早使用GPU的往往是一些比较容易改造的应用,比如石油天然气勘探里经常会使用一些开发和运算,这种算法比较容易应用GPU,还有生命科学的案例。

  但是一些应用首先算法非常复杂,另外有一些行业对计算准确性有异乎寻常的要求,需要时间来验证,即使改用GPU也需要验证以确保结果的正确性。在应用当中在逐渐迁移。我相信不久以后,GPU应用会有更快速的增长,因为现在越来越多的应用是慢慢转移到GPU上,比如重量级的商业应用。

  IT168.com:GPU普及需要打造一个健康成熟的生态圈,需要更多合作伙伴。Nvidia在合作伙伴方面有哪些进展?

  邓培智:国内外从事高性能计算方面的主流公司都是我们的合作伙伴,比如IBM,还有国内公司都是我们非常重要的合作伙伴,这些合作伙伴来自很多其他方面,像超级计算机的生产商,我们不仅在硬件上进行合作,软件上也展开合作,开发独特的编译器,我们合作使编译器更适合工作。我们和曙光也是合作伙伴关系,星云曾经是世界上最快的计算机,其中就有我们的应用在其中,达到了非常好的功耗,有非常高的效率。

  IT168.com:高性能计算领域绿色节能也是重要方面,GPU有哪些优势?

  邓培智:GPU天然就是绿色节能。比如要达到1T的计算能力,如果用CPU可能需要十多个CPU,耗电达到上千瓦,而GPU仅耗能200瓦左右,只有传统的CPU的五分之一、十分之一。

  可以看到世界五百强里最绿色的超级计算机排行榜,排在前列的的机器都是应用GPU,最绿色的是日本的一台计算机,获得绿色排行榜首位。因为其中50%的计算性能由GPU提供。京的功耗是非常大的,虽然计算能力很高。

  IT168.com:您希望这次曙光超算技术大会SSC12对GPU推广起到什么促进作用?

  邓培智:我觉得在超算领域大家对GPU有强烈的兴趣,我希望大家通过大会了解到更多GPU计算方面的细节,在今天下午,我们会有一个专门的讲座,我们公司的工程师、开发经理也会给大家做一些详细的介绍。参加课程可以学到GPU程序开发、优化方面的内容,是一个比较实际的交流、讲解。对于有意开发GPU应用程序的人,一定会从这个课程里得到自己想要的内容。

  IT168.com:感谢各位网友,本期访谈结束。

0
相关文章