【IT168 评论】我第一次采访Sumit Gupta是2012年的冬天。当时我在美国盐湖城参加SC12大会,在那届大会上使用NVIDIA Tesla K20加速器的Titan超级计算机获得了TOP500业内知名。我曾清楚的记得Sumit Gupta向我介绍这项成绩的时候显得十分兴奋。“你知道吗?如果不用NVIDIA GPU加速器,想获得这样强大的性能需要达到相当于6-8万户美国居民的年耗电量,这是完全不可想象的事情。”——这位NVIDIA Tesla事业部的总经理一本正经的对我说。
▲我在2012年SC12大会上与Sumit Gupta的合影
时隔2年,再次见到Sumit Gupta是在上个月NVIDIA GTC 2014的大会上。他的脸上依然挂着标准的礼节性笑容,不过我相信这2年他过得并不轻松。竞争对手的出现给NVIDIA形成了巨大的压力,NVIDIA在HPC这个传统意义上的商业蓝海遭遇到了英特尔这样强大竞争对手的阻击,而天河二号的著名案例更是夺去了长久以来照耀在Tesla头顶的光环。我有太多的问题想问问眼前这个技术出身的NVIDIA高层,关于Tesla未来的发展、关于对待竞争对手的态度、关于如何选择合作伙伴……就这样,一场专访开始了。
Machine Learning(机器学习)与大数据分析
在GTC 2014的大会上,NVIDIA联合创始人、总裁兼首席执行官黄仁勋先生演示了Machine Learning(机器学习)的应用——可以在众多图片中智能选择用户需要的图片。这种Machine Learning(机器学习)得益于GPU计算的加速分析作用。Sumit Gupta在谈到这个问题的时候特别列举了百度搜索的案例。他表示,目前百度APP翻译软件(语音翻译)就是用的是来自NVIDIA提供的GPU计算解决方案,百度也已经实现了Machine Learning(机器学习)的初步应用。未来,当用户在上传文件、图片、视频等内容的时候,服务器可以根据自我学习的经验自动增加标签,可以实现机器的搜索,进而实现图片或视频的标签检索。
除了百度之外,Machine Learning(机器学习)已经应用到了计算的各个领域,而基于数据库的查询应用无疑是其中最重要的内容。在Sumit Gupta 介绍的案例中,俄罗斯最大的的搜索引擎yandex也在使用GPU进行加速计算。除了应用在搜索引擎方面,在twitter上也有类似的应用案例。twitter的后端服务器可以通过用户发布的文字、图片等数据进行综合分析,比如可以提前预报天气的情况,检测一段时间内是否有台风或者沙尘暴来袭。这些都基于NVIDIA GPU所提供的强大性能,而在GPU解决方案出现之前,这样的应用是不可能出现的。
Machine Learning(机器学习)是实现大数据应用的前提,利用大数据分析NVIDIA可以帮助客户实现更好的服务或者寻找到更多的商业机会。Sumit Gupta进一步表示——GPU的价值就是分析海量的数据,进而让数据的表现更为合理。当谈到目前NVIDIA的大数据业务时,Sumit Gupta坦言目前大数据在Tesla的业务中只有6%的市场份额,但是目前的增长速度非常快,发展空间巨大。
Jetson TK1面向嵌入式系统的高性能计算市场
除了Machine Learning(机器学习)之外,NVIDIA还推出了Jetson TK1开发者平台。这款平台核心为Tegra K1移动处理器,拥有326 Gigaflops性能 (高于所有类似的嵌入式系统近 3 倍),包含了基于NVIDIA CUDA 架构的全套 C/C++ 工具包。它是全球首款针对嵌入式系统的移动超级计算机,应用涉及计算机视觉、图像处理以及实时数据处理等领域。
在谈到这款平台的时候,Sumit Gupta充分肯定了CUDA对于改变数据中心高性能运算的局面的重要作用,而Jetson TK1则针对的是低功耗却又需要较高计算性能的计算机而展开的。相对于其他的同类型平台来说,Jackson TK1的特定在于并非使用了GeForce类型的图形处理器,而使用的是Tegra的计算式处理器。从这一点来说,Jetson TK1开发者平台提供了足够强大的移动计算能力,这是其他针对移动平台或者低功耗平台的产品(比如Intel Atom C2000或者AMD皓龙A1100)所无法比拟的。
谈到具体的应用方面,Sumit Gupta认为Tegra K1非常适合移动领域中需要高性能应用的环境,比如移动医疗应用或者在国防、安全监控等领域。在移动医疗中,Tegra K1可以提供给便携式的B超机提供足够强大的运算能力;而在监控方面,通过雷达或摄像头的数据可以通过Tegra K1实现进行本地分析。虽然相比其他嵌入式产品在性能上有了明显的提升,但是NVIDIA在目前并没有进入嵌入式的市场的计划,NVIDIA也不会为嵌入式市场开发全新的产品,所以Tegra K1也将兼顾这个市场。
而相对于数据中心市场来说,Sumit Gupta认为这个市场需要的最基本功能就是ECC校验和冗余纠错,这显然是Tegra K1所不具备的。同时他也表示,这部分市场应该是Tesla的主要应用阵地,因为数据中心的应用并非是以缩减功耗或者控制功耗为主要目的,因此也不会将Tegra K1引入数据中心市场。
与IBM的良好合作关系
在去年宣布组建的OpenPOWER联盟中,NVIDIA也是重要的发起者之一。自从Intel发布自家的Xeon Phi加速器开始,在HPC市场就与NVIDIA Tesla展开了正面的竞争。因此NVIDIA加入OpenPOWER基金会被看作是与Intel的另一种对抗。对于这样的说法,Sumit Gupta首先予以澄清。他表示NVIDIA与Intel保持着长期友好的合作关系,但NVIDIA与IBM也是持续良好的合作伙伴,并建立了强大的合作关系。在加入OpenPOWER基金会之后,NVIDIA希望为IBM POWER处理器进行GPU的加速,并且借助于下一代芯片的NVLink技术实现CPU与GPU之间的互联,特别是与POWER的互联。
有消息说下一代的英特尔Xeon Phi加速器(Knights Landing)将实现CPU与GPU的融合,以此扩大应用范围,占领更多应用领域的市场。不过Sumit Gupta并不认同这样的设计思路,他甚至认为在相同的DIE上,如果使用CPU+GPU的模式,势必减少GPU的面积空间,而相比之下明显是GPU的计算更具备优势,因此这种做法得不偿失。而在谈到NVIDIA未来是否有类似融合处理器架构的时候,Sumit Gupta则表示NVIDIA还将专注于GPU的研发,凭借NVLink技术实现与任何能够支持NVLink技术的处理器互联。