服务器 频道

NVIDIA全球副总裁张建中在HBCC论坛演讲

  英伟达(NVIDIA)全球副总裁、中国区总经理张建中:

  尊敬的各位来宾,大家下午好!今天下午是HPC的论坛,可能在座的有很多是HPC的专家,但是我想还是用普通消费者的眼光去看待今天的高性能计算跟所谓的云计算,这样的话,我相信大家可以听得明白一点。

NVIDIA全球副总裁张建中在HBCC论坛演讲
NVIDIA全球副总裁张建中在HBCC论坛演讲

  首先我先代表英伟达(NVIDIA)公司祝贺战旗科技在常州基地的开业,也祝贺梅总跟李女士在常州的企业能够更上一层楼。

  在今天开会的同时,如果有人在美国的话,可以看到他们现在正在开美国的SC2010年的会议,他们的大会今天一天就要结束了,在中国好像是开一小峰会。但实际上,在美国这个会上,你会发现美国这个会议的很多内容离不开两个字,第一个就是英伟达(NVIDIA),第二个是中国。为什么离不开中国?为什么离不开英伟达(NVIDIA)呢?我相信大家已经看到了很多消息,中国的超级计算机业内知名,去年就有超级计算机排名第二,目前全球前五中有三台使用了NVIDIA Tesla GPU,可以看到英伟达(NVIDIA)Tesla GPU已经帮助很多的高性能计算机走向全球高性能计算机的前列。

     这些原因我想得益于英伟达(NVIDIA)新的发明GPU运行计算方案。我们都知道英伟达(NVIDIA)公司是一家以GPU为核心的技术性公司,所以可以看到我们基本上生产的产品全都是以GPU为核心去拓展开的产品线。我们发家的产品就是英伟达精视(NVIDIA GeForce),今天电脑里面无论是台式机还是笔记本,我相信多多少少都有英伟达精视(NVIDIA GeForce)在你的电脑当中使用。如果说你是用来玩游戏的话,你就离不开英伟达精视(NVIDIA GeForce)。如果说你是用来制造产品的、创造的,去创造一种数字多媒体的内容,那你离不开。

     如果说今天除了传统的产业,PC级服务器工作站的产品以外,我想今天的电脑随着移动计算的发展,云计算才会起到作用,中国的计算中心大部分是以服务器为数据中心来设计它计算机的架构。但今天随着移动科技的发展,每个公司肯定都是smartphone,很少有人手机只是能打电话,今天已经找不到了。因为你去柜台只买一部手机说我只要打电话,那他还真没有,因为每一部手机基本上都是一个smartphone,如果smartphone的话,今天smartphone的产品终端服务器用的一定很强大的,比如说iPhone,普通的手机它的通信功能已经很强大了。

     随着英伟达(NVIDIA)在Tegra上面的进展,在移动领域里面,我们已经把CPU直接拖到每一个移动终端上面,所以你的手机、你的手持设备、你的TV、你的汽车,你的各个PC终端都已经有GPU在你的系统内部。

    但如果说这样有这样好的PC设备,假设我们在数据中心当中有一个比较好的云服务,那我们信息能够传递到每一个移动终端的话,我想这个就是今天云计算的概念所在了。今天的云计算,英伟达(NVIDIA)配合整个计算机新的变化,把所有的GPU延伸到终端当中,就是叫英伟达(NVIDIA)Tesla GPU产品。在服务器端,为了加快服务器的图形处理,我们把英伟达(NVIDIA)Tesla GPU的技术引入到服务器当中。所以说你可以看到,今天最快的超级计算都是基于GPU的架构去发展起来的,而这个就是我们英伟达(NVIDIA)Tesla GPU的产品。所以,英伟达(NVIDIA)四条产品线基本上就是围绕着传统的产业跟新兴云计算的产业当中去发展和延伸。

赞奇科技与众多合作伙伴公司签约
张建中先生现场讲解NVIDIA对于HPC所做的贡献

     在这个产品当中,我相信英伟达(NVIDIA)Tesla GPU是我们今天要谈的一个主题。如果我们讲英伟达(NVIDIA)Tesla GPU的话,今天的应用已经远远不能此时用来做一个(mini player),实际上它的应用已经远远超出我们的想象。可能在5年前,我们看计算机的时候,大家说CPU的架构,每台电脑都离不开CPU但那时的计算机就是一个单核的X86的计算机。但是今天所有的计算,没有一台计算机是单核X86的计算机,因为每一台计算机都有GPU。

     你们都知道,明年Intel、AMD,很多公司都会把GPU跟他的CPU合并在一起,他就会把CPU应用到更加广泛,这也是所有厂家、所有行业的参加团都已经意识到这一点,计算机的异构计算的架构已经真正到来。提起异构架构这个计算,CPU+GPU的架构已经成为一个标准。那我们今天看到的就是我们想推广的,以GPU为核心的未来CPU+GPU异构计算的计算机架构,它也是英伟达(NVIDIA)在今后发展当中推广的一个标准。

     我们在刚刚在美国结束的GTC大会上,我们展示了所有的应用解决方案,都是基于CPU+GPU诞生。当然在这个会上,可以看到我们发布了很多零零总总的应用解决方案,其中有很多内容的提供,可以看到它在新的GPU的发展下来,有一个很大的变化,就是它的图形图像的处理能力比以前有大幅度的提高。

     这是一个最新的游戏,DX11的游戏,叫做《鹰击长空》,它还没有发布,但这个游戏的场景可以以假乱真到,跟你在真实的环境当中拍一部大片还要精致、还要更加细节化的效果。这些效果的取得,是得益于新的GPU的强大的计算能力,而不是说得益于我们凌空的想象力,以前的想象力也很强,但由于技术的限制,做不到这样的效果,可是今天它能够做我们要的效果。所以今天看到的无论是飞机也好,无论是背景也好,已经真实到跟你的想象是一模一样的。

     如果看汽车的渲染,更是发展很快。所以今天去战旗的办公室,你们可以看到《HAWX》的demo,它渲染的实时效果跟它的真实性,已经是非常逼真了,而这些逼真的效果不只是让反光图像的光线追踪的效果,而是能够让你所有的背景在上面呈现出一个真实的反应,它的光线计算的复杂度远远比我们想象的要复杂得多,而以前计算机的计算能力是没有办法做得到的,而今天的GPU已经把它变为现实。

     最快的计算机是得益于英伟达(NVIDIA)Tesla GPU的帮助,可以看到在“天河一号A”里面,所有计算的性能,80%是来自于GPU。当然还有其他的一部分来自于CPU。整体上去看,7000多个英伟达(NVIDIA)Tesla GPU就已经把它打造成世界上最快的超级电脑。你看这个电脑有多大?以前世界靠前的话,它是一栋楼,很多的机房,现在是一层楼,一层机柜就已经达到一栋楼的效果。当然还不算它的功耗,如果我们讲它的功耗跟以前相比的话,以前的功耗比现在的功耗要高3-4倍。我想这些效果都是从GPU新的变化给我们大家带来的变化。

     曙光的“星云”系统也是一样,今年的春天发布了世界上第二块的超级计算机,他是采用了4000多个英伟达(NVIDIA)Tesla GPU,4000多个英伟达(NVIDIA)Tesla GPU变成第二,7000多个就变成第一了,如果再放得更多的话,我相信这个计算能力会远远超过我们现在所有的计算机power的综合。所以可以看到计算机的变化比以前传统上的飞跃,以前要这样的系统,可能要搭几万甚至于十几万的CPU组成这样的超级系统。十几万的CPU去做,这个复杂程度是难以想象的,它的成功概率就会很低。我们不要说讲整个预见的能力性,我们知道每一个行业当中都有一个故障率,如果我们假设说只是百万分之一的话,10万个CPU,运算比如说是10小时,最后可能会有1小时的组长,这样的系统是很难想象的。因为接点越多,稳定性越差,你的系统如果高性能计算不能稳定的话,基本上这个计算机是没有用的,因为你的点数很多,算出来的结果不可靠的话,基本上是没有用的。所以可以想像到接点的减少对于我们计算的帮助是有那么的重要。

     现在图片上的这个系统是初发明是在日本的东京大学,可以看到他也是采用的我们的GPU跟HP的服务器组合在一起建成的超级计算机。

    所有的这些例子仅仅在一年之内,陆陆续续会有很多的公司、很多的高性能计算中心能够把Tesla接到他的计算中心。在之前,如果有人做GP GPU高性能计算的话,花很多时间写自己的程序。英伟达(NVIDIA)帮助大家尽快从CPU的架构转到CPU+GPU一流计算的架构,我们在4年前就发布了英伟达(NVIDIA)CUDA。在发布了英伟达(NVIDIA)CUDA之后,我们把所有英伟达(NVIDIA)CUDA的编程工具延伸到C语言、C++、Fortran,有很多各种各样的语言,现在看到的OpenGL、OpenCL、DirectX、DirectInput,所有的语言都能够去操纵英伟达(NVIDIA)CUDA架构的计算机。就变成我们在程序当中,在软件应用当中,更加容易方便的去使用超级计算机。

     整个开发系统的建立,加上我们在英伟达(NVIDIA)CUDA编程工具的普及,使得所有的运用能够可以很快的实现到实际当中去。今天会看到我们在全球已经出版了十几本基于英伟达(NVIDIA)CUDA计算的书刊,有各种各样的语言,有英文、日文、中文、德文,各种语言都可以买得到。这些语言的编程工具我们也把它在全球大概有1000个以上的大学课堂里面去普及教育,今天在中国,几乎所有的大学,他们都在开设CUDA的课程。除了这些大学以外,中科院在自己的研究院里面,开设了很多课程。还有课外的课程,在外面培训的班也开出了很多课程。同时在中国为了让大家自学,英伟达(NVIDIA)CUDA在中国设立了一个英伟达(NVIDIA)CUDA专区,叫CUDA-ZONE,很多的软件工程师可以透过远程网络自学所有英伟达(NVIDIA)CUDA的课程。无论在中国还是在国外,CUDA的应用程序是非常广泛的。

     在中国,我们每年都在全国的高校举办英伟达(NVIDIA)CUDA的编程大赛,今年刚刚举办完中国的CUDA编程大赛,在下个月应该会颁布比赛的结果。你会看到他们的水平越来越多的提高,编程的技巧跟他的知识都是越来越好。我想这些知识的普及,也帮助我们中国在其他的应用软件当中,能够很快的从X86的架构转向X86+GPU计算的步伐。

     全球性的应用,以前很多都是在科研领域采用GPU,但今天,商业领域的应用软件在CUDA上的应用已经非常普及了。给大家看几个应用的例子,这是PNG,用GPU做分子多边形研究,去研发和开发新的洗发液。可以看到很多的领域里面,以前没有想象得到,他们可以用高性能计算帮他们提高他们的工作效率。

     他们用高性能计算做财务数据的分析,帮他们去分析基于股票产品的收益。像所有的航天航空领域的应用,还有电子信息系统的应用,甚至于海洋生物的应用,还有在疫苗各方面的应用,都已经使用得很普及了。
   
  如果我们再把它分分类,具体的应用软件,这些绿色的是表示已经可以在市场当中买到,他们已经开始销售,有自己的用户的产品的地方,各行各业都有。这些蓝色的是正在计划当中的,马上要开始,正在编程当中,移植的过程当中。还有些其他行业,可以财务的行业、EA的行业,等等等等,成千上万种软件都会在很短的时间之内尽快的移植到新的平台上面。所以今后会看到所有的软件都会有一个异构计算的架构,为了加快这个应用,英伟达(NVIDIA)还特别把CUDA开放到CPU。

     在今天的应用当中,已经看到实际的成功拟用的软件或者实际应用的软件,在中国的吉星捷达,他们在做石油勘探,在大连油田都已经安装试用成功,今年已经是实现了商业运作。这些产品性能的提升,从几十倍到300倍的效果都有。

     已经有十多个银行开始把这个应用在他的实际应用当中使用在国航,政府领域,可以看到各个GPS应用、处理的应用等等,这些基本上已经在实际运用当中。

    刚才看到的像UMB Video的案例当中,这是用来做监控摄像的分析,对于社会的安全、保安的管理上都有很大的帮助。在商用领域里面,这些应用已经全部在CUDA上面移植成功。我们提供给他们的不只是应用,我们给他提供很多的平台,提供所有的升级的服务,帮助他们去杀毒的应用软件,去看各种各样的文档,让他们去讨论,设立论坛,大家一起把这些应用软件逐步逐步提高,逐步逐步地改善,让他们的效率从几十倍到成百倍的提高。

     同样可以看到这些性能,比如分子动力学,8颗Tesla的效果就已经取得192个CPU核的效果。其他的像常用的工程应用软件Ansys,这是非常普及的应用软件,基本上已经全部能够用GPU处理以后,不光速度很快,能够让他们分析得更好,可以把产品提升,对质量有一个极大的提高。

     在MagNet应用当中,我相信这些用户是非常广泛,要看全球的话,大概是175个国家有100万个用户在使用MagNet。而这些里面,MagNet是用GPU架构效率提高最快的应用软件,它非常适合用并行处理的算法去提高它的效率。今天可以看到,全球大概有几千个大学都在使用MagNet免费应用软件,中国也是有很多。

     这就是在各个不同的应用领域当中,GPU给他们带来的好处。所有的超级计算机GPU是它的核心,但GPU是它的核心,如果说我们去研究为什么GPU可以怎么帮到CPU提高这么快?我相信跟它的并行架构是有很大的关系。如果我们去分析今天的HPCC,以前大部分是看它的性能到底提高的多快。比如说1颗CPU加1颗GPU跟一个普通的CPU,它的性能大概提升8倍。但是如果说我们看,花同样的价钱与性能提升的话,大概就会有6倍的提升,有6倍性能的提升,性价比也有6倍的性价比。但如果我们看今天的社会能源的部分,大家更加关注你的能源功耗,性能、功耗大概也有5倍的提升。无论是从性能、从价钱还是从功耗,能源的节省,CPU+GPU都是一个非常好的手段,让我们今天的高性能从一个以CPU为核心的计算转向一个以GPU为核心加CPU的电脑。

     我想举一些具体的数据去考核我们实际达到的效果,比如说这个是曙光的数据系统,这个是我们在中科院做了一个IP的系统,这是世界上第一块的JAVA系统。你会看到曙光的基本上是它的2倍之多,至少省掉一半的电耗,电耗最大的计算机一年的电耗是以多少兆瓦计算,这个消耗的电量,像常州市可能用一年整年的电。我想这些能源的节省,尤其对发展中国家,在中国是非常有帮助的。

     当然这些里面,我想其他的很多就不想花太多的时间去研究具体的细节,但是我想给大家一个概念,如果我们看全球排名500个超级计算器的话,这个蓝色的线是排名从第一一直500,会看到前几十名当中的差距是很大,这些排到前500,已经是非常非常小的速率。但是不要小看他们,他们都是有成千上万个CPU在里面。但如果说今天只要用同样价值,加上GPU之后,这500个里面,立刻有人排到前大概200名,会看到很快。整体的性能计算,就可以把这一批计算机很快的升级到全球的排名前几十名的超级计算中。而这些性能的提升,是对于投入跟功耗都有很大的节省。

     也可以看到像这些,比如说分析的时候,48颗GPU跟2000个CPU的集群去比较,会发现它占用的空间少了1/42,它的成本节约了28倍,它的功耗节约了38倍。所以对它来讲,是一个非常大的节省。

     其他的行业也是一样,比如说我们可以看到从空间上节省的31,功耗节省了二十几,都是几十倍、好几十倍的提升。

     比如说做这个超级计算机,以前大概是用21千瓦,现在可能只要用1千瓦,节约是20倍。可以看到很多的应用都会很快。刚才我讲到,为了让普及,不光在GPU上面,为了让所有的应用软件和今后在CUDA上面开发的应用软件,如果你的电脑里面没有CUDA的系统,没有GeForce,怎么办呢?这些系统就运行不了。为了保证这个系统的兼容性,我们给他开放了CUDA的X86。所以说今天如果你的电脑里面没有英伟达精视 (NVIDIA GeForce) 图形处理器(GPU),没有英伟达(NVIDIA )Tesla GPU,没有英伟达( NVIDIA ) Quadro图形处理器(GPU),没关系,这些软件可以用,但速度可能慢一点。但是如果一旦插上Quadro、Tesla或者是GeForce,你的整个系统可能提高30倍。这个开放,让我们所有软件的应用,以后的软件开发商不需要开发多次了,只需要开发一次,他的软件就能兼容所有的电脑,兼容所有的服务器。这个技术是非常重要的,可以让CUDA普及到每一台PC,每一台工作站,每一台笔记本,每一台手机,每一个服务器。

     世界上最快的计算机基本上都已经在CUDA上面移植成功。我想讲几个,可能也是大家比较关心的几个软件。一个是3DS MAX,3DS MAX新的版本都已经全部在GPU上面全线加速,在今后用3D SMAX的话,你的上网本发挥的作用就不仅仅是以前的Quadro OpenGL的作用,CUDA在里面就会发挥出巨大的威力,帮助你的创意设计做得更好。新一代的Fermi Quadro产品已经在柜台有销售了,所以说这一群用户应该尽快的转向基于我们Fermi架构的Quadro产品上。

     另外一个应用就是Adobe这个新的科技,这个新的科技对我们普通的消费者是非常有帮助的。以前大家都有照相机,现在每个人都用数码相机,而数码相机虽然说可以随意去拍照片,但是有时候在很多很重要的场合,你拍照片的时候,聚焦的点没有聚焦好,所以把你的照片就会拍错。比如我想聚焦梅总,可能聚焦点拍到中间去,那怎么办呢?是没有办法修复的。今天发明的这个科技叫多点聚焦,比如说我们整个会场拍完一张照片以后,它每个点都有聚焦,但是你只要用你的软件去选择你的聚焦点放在哪里,你就可以把哪里聚焦的图像取过来。对于新闻记者,你们不需要去聚焦,你想要干什么都可以,因为你的焦点是随着技术去任意截取的。

     那样的话,带给大家很多好处,可是计算机就要有很强的计算能力才够,这个就GPU帮你了。假设只有64个镜头,64个镜头任何一个点要聚焦的时候,GPU的计算会可以把图像重新算在里面,所以整个图片就会有一个新的焦点。如果再换一个焦点的时候,就会非常容易。任何一个数码相机都需要一台比较好的GPU帮助你去加速你的图形处理的能力,那我想我们每一个笔记本、每台台式机里面都会有一个GPU帮助我们去运用。

     这个是Adobe的科技,我相信这个科技的发展很快就会普及到每一个人的数码相机当中,可能下一次你们再带数码相机的时候,更新换代你现在手上数码相机的时候,下一代要不要多点聚焦的拍摄的数码相机。这一部分对我们普通消费者有很大的帮助,同时对于日常的用户,对根本不懂电脑的用户也没有帮助呢?也有很多帮助。比如说今天他们去医院看病的时候,现在大家知道有彩色B超,有各种各样实际的效果。现在不光是彩色B超,还可以把你的内部器官渲染成真正的图像。所以你们去看B超的时候,看到有一个心脏在那边跳,里面的心脏是你真正的心脏?不是,它是渲染出来的,但是跟真的不会有差别。这一切已经开始在实际应用。

     像这个医生用来干什么呢?做内部的手术,这个手术精确度要很高,它能够渲染到实际内部的情况,然后做手术。你知道手术刀一定要很准确,这样的计算一定要实时,因为心脏在跳,在心脏做手术要跟着它去跳,要跟着它去渲染,而这一切只有很强的计算能力,这个系统才可以帮助得到,以前传统的CPU是做不到的。而这一切都已经变成现实,会发现GPU的运用已经普及到身边的每一个细节。

    除了这些以外,我们客户的产品,从各个不同区分的应用当中都可以看到,像奥迪,奥迪A7新版本里面的电脑控制系统,都是英伟达(NVIDIA)的GPU在里面控制的,你可以用它做3D的渲染,你可以在里面看立体的导航,今天看到的导航今天都是平面的,但是以后会用立体的,会有立交桥出来,你在桥下,可能桥上就会不一样,今天桥上桥下看不出,明天可能会看到桥上桥下的区别。

     而这些电子系统的应用,像汽车领域,基本上都是我们的客户,他们都会采用英伟达(NVIDIA)的GPU帮他们做信息的管理,同时做无人驾驶跟辅助导航,还有辅助停车、泊车,用计算机帮他去计算自动停车,等等这些都会帮助我们把生活改善得更好。

     除了这个以外,我相信今天看到各种各样的应用。但实际上云计算已经不仅仅是在传统的理念,云计算已经变成可行性应用。大家看上去很虚,实际上不虚,在实际应用当中已经产生了。今天使用的smartphone,这些都是基于云计算。但是很少有企业花钱建立这么庞大的HPCC,投资世界靠前的超级计算机要花十个亿、几十个亿,几十个亿我想企业一般不会花这么多钱去做。但是为了服务给更多的企业,国家政府投了这样大的计算机中心,把它开放到所有的中小企业或者是一些企业里面或者个人用户去使用。

     在美国我相信他们做的比较强,但在中国,虽然说我们有很大的世界上最快的超级计算机,但是我们很多理念,还有一个是政府开放给企业应用的理念,都在不断的成熟和培养当中。所以我相信,中国这一部分的应用需要一段时间去普及起来。但是不要忘了,GPU在云计算当中的应用可以帮助我们普通的企业建立自己的私有云,因为以前的企业要建立一个大的计算中心,成本都很高,但是今天如果说要建自己的云的话,我不需要再花一个亿、两个亿,可能几百万甚至几十万,或者更便宜的,建一个自己的云计算中心,你可能只需要一个Tesla,一个Quadro,就可以建立自己个人的云计算中心。

     我想这些普及的应用在中国是非常快的,我也希望赞奇能够帮助我们新的科技、新的应用解决方案推广得更广,让更多中国的消费者、个人用户、企业用户或者家庭用户都能够享受到GPU给我们带来的新的技术的创新,同时带来更加节约成本的科技应用的普及,也希望在后面的工作当中多多帮助我们把GPU在中国高性能计算的应用推广得更快。祝各位生意兴隆,祝各位家庭生活幸福,工作愉快。谢谢大家!

0
相关文章