【IT168 评论】日前,与美国奥斯汀举行的SC15超算大会正在召开之中。作为行业一年一度的盛会,SC吸引了世界各地的企业、专家和从业者来此交流,许多公司也选择在这一时刻发布最新的产品、技术和解决方案。作为业界的重量级厂商,NVIDIA在本次大会上宣布了全新的加速器全新时代的到来,NVIDIA联合创始人、总裁兼首席执行官黄仁勋亲自出席了大会。
加速器时代已经来临
每一次,黄老板的出现都会引起粉丝的兴奋与骚动,特别是对于那些女粉丝来说。这一次,黄老板演讲的主题是“加速器时代”,他认为目前加速时代已经来临,以NVIDIA GPU为代表的加速器已经成为了业界的主流。在奥斯汀最新发布的第46届TOP500榜单中,使用加速器的系统首次突破100台,而这些加速器当中有超过2/3都是NVIDIA的 Tesla GPU,且这个数字正在以每年50%的速度增长。
毫无疑问的是,加速器已经成为业界发展的趋势,但笔者认为早在几年前这个趋势就已经非常明显了。自从2012年Titan成为TOP500的冠军,就已经意味着加速器时代即将到来。而最近几年,随着科学计算特别是深度学习的应用从科研领域向互联网公司的传递,GPU加速已经越来越成为业界的主流趋势。套用黄老板的话来说:“(GPU加速)影响力不亚于主宰过去十年的英特尔至强处理器。在CPU的配合下,它的迅速发展将蓄积起巨大的能量,为超级计算树立全新的标准”。
深耕机器学习:NVIDIA新Tesla解读
除了大谈行业趋势及发展之外,黄老板也同时宣布了两款全新的Telsa产品。相比之前我们看到的那些面向通用计算的Tesla来说,本次发布的产品更是专为深度学习而定制,其中两款名为M40和M4的产品就面向了不同的深度学习应用。
M40堪称是当下速度最快的Tesla深度学习产品,相比于传统的K80产品来说,M40在软件的优化方面有所改变。据NVIDIA官方数据显示,M40相比通用产品可以实现8倍性能提升,如此一来用户的计算时间将大大缩短,执行效率变得更高。
另外一款型号为M4的产品则面向深度学习的后期应用。一般来说,在训练模型的前期,需要反复进行学习,而在完成学习之后,系统资源的计算能力要求将大大降低,这也就给M4提供了存在的价值。相比刚刚介绍的M40和通用的K80来说,M4的功耗只有50-75W,相当于普通CPU的水平。但是在视频、图片处理、机器学习等方面,它相比之前则有最多5倍的性能提升,能效比更为出色。
除了这两款产品之外,NVIDIA本次也发布了诸如FFMPEG、GPU REST Engine和Image Computer Engine在内的多款软件与应用平台,这些平台能够在超大规模数据中心内实现GPU加速的机器学习,最高可达10倍加速效果。
扩大生态系统,寻求更多合作伙伴
事实上,除了NVIDIA之外,其他企业也看到了深度学习的巨大作用,并在不同层面寻求与NVIDIA的深度合作。在NVIDIA展台,我们看到一个由IBM开发的应用展示。这款应用基于Spark架构,在使用GPU加速之后性能获得了大幅度提升,仅仅在延迟方面就下降了5倍。IBM能够在NVIDIA平台上展示这个应用,也充分说明对于NVIDIA加速作用的肯定。
作为OpenPOWER的成员,NVIDIA与IBM一直保持较好的合作,包括NVLink的合作与多家超算中心的项目参与。而在IBM展台,笔者也看到了采用NVIDIA GPU加速的SuperVesseler超能云系统。据现场的工作人员介绍,OpenPOWER生态圈的用户可以在SuperVesseler超能云上进行CUDA以及深度学习研究和应用的开发,并充分享受来自云端的GPU加速性能。
从技术角度来说,SuperVessel上的GPU加速服务基于Docker容器的GPU共享技术,多个用户可以同时共享同一片GPU;与此同时,用户使用GPU的方式与使用物理GPU完全相同,任何能在物理机上运行的GPU加速程序理论上都可以在SuperVessel上的GPU实例中运行。
或许正如Intersect360 Research 首席执行官Addison Snell所说的那样,在高性能计算领域中,加速计算现已达到引爆点,而NVIDIA的Tesla GPU在加速计算市场中处于领军地位。在可以预见到的未来,GPU加速依然有着强大而旺盛的生命,将推动高性能计算、互联网行业的进一步发展。