服务器 频道

没有等量级对手 NVIDIA高层解读GPU计算

  【IT168 评论】2014年11月6-8日,一年一度的HPC China 2014在广州举行。作为中国HPC行业盛会,本次大会吸引了行业内各个领域的专家和从业厂商加入,特别是对于HPC并行计算来说,NVIDIA早在多年前就提供了完善的解决方案,在首日的大会主题报告中,NVIDIA加速计算首席技术官Steve Oberlin畅谈了NVIDIA GPU加速的优势及未来NV-Link技术的发展趋势。会后我们有幸采访到了Steve Oberlin先生及另外两位嘉宾——NVIDIA 解决方案工程架构副总裁Marc Hamilton与NVIDIA全球副总裁、PSG&云计算业务总经理Ashok Pandey。

没有等量级对手 NVIDIA高层解读GPU计算
▲从左至右分别为NVIDIA 解决方案工程架构副总裁Marc Hamilton、NVIDIA加速计算首席技术官Steve Oberlin与NVIDIA全球副总裁、PSG&云计算业务总经理Ashok Pandey

  GPU加速的优势与使命

  对于NVIDIA来说,它所实现的GPU加速改变了高性能计算行业的发展速度,从原来单纯的CPU加速实现了CPU+GPU的并行计算模式,进而使得超级计算机的峰值不断获得突破。在谈到GPU计算加速的意义时,Steve Oberlin特别谈到了GPU的历史使命——优化能效。

  Steve Oberlin表示:能耗是NVIDIA认为最为重要的一个指标。随着内存带宽的进一步提升给,CUDA编程实现的难度进一步降低,也就要求NVIDIA提供更先进的芯片架构和电路设计,也只有这样才能实现更强大的芯片,进而制造跟强大的计算机。

  未来的Pascal架构与NV-Link技术

  在今年3月的GTC大会上,NVIDIA总裁黄仁勋宣布了下一代GPU架构Pascal和2016年将推出的NV-Link技术。而在本次HPC大会上,Steve Oberlin在主题演讲中介绍了NV-Link技术的实现原理与应用场景。作为与IBM合作开发的技术,NV-Link将被应用在并行计算中,实现GPU与Power处理器的互联。相比传统的模式来说,NV-Link的好处是可以实现CPU和GPU逻辑上的集成,使得它们在运行应用的时候,可以更好地无缝对接进行协作,特别是结合Pascal架构实现高带宽和更高的性能。不过对于Power来说,它并非是HPC行业的主流,x86才是。因此,NV-Link技术是否支持x86架构也是大家关心的问题。

  NVIDIA 解决方案工程架构副总裁Marc Hamilton表示——毫无疑问Pascal是会支持X86的,NV-Link可以实现CPU和GPU的连接,也可以实现多个GPU之间的连接。从目前的应用模式来看,未来集成商将用NV-Link连接多个Pascal GPU,然后再把这些GPU通过PCI-E连到x86系统的CPU上。从发展来看,未来NV-Link将实现对于x86、Power和ARM架构的多重支持。

  Low不Low,看价值不看价格

  在这次发布的TOP100中国超算排行榜中,有超过一半的系统来自于互联网公司,其中应用于BAT三家的系统就达到了20套。这也说明互联网行业对于传统HPC的冲击。面对这种情况,许多传统的HPC专家认为互联网公司不能实现高性能计算,也不能对科研有所帮助。与此同时,处于成本因素的考虑,互联网公司在选购设备的时候也不大可能考虑GPU加速。

  对于这种说法,Marc Hamilton提出了不同的观点。他认为互联网公司是未来发展的趋势,在市场的占有率非常大,因此从绝对数量来看也是不可忽视的一份子。不过对于互联网公司“穷酸”的说法,Marc Hamilton认为这并非是互联网公司的本意,而是追求投资的最大化。相比之下,如果他们意识到GPU对于业务的帮助作用,也会考虑大规模的采购。因此,不能单纯说互联网公司很Low,而是要从对于业务的驱动价值来看。他列举了百度的机器学习案例(Machine Learning),说明百度其实已经采用GPU进行加速计算。

  Steve Oberlin更是从数字方向解读了这个问题。他谈到:谷歌有一个名为“谷歌大脑”的项目,最初使用的是1000台服务器,而在经过性能评估之后,在同样情况下选择更多的GPU替代CPU,使得总成本由原来的500万美元下降到了3.3万美元,并达到了性能的平衡。由此说明,实际应用价值对于客户来说才是最重要的。正如IBM大型机非常昂贵,但出于价值的考虑还是有人会买。

  NVIDIA没有遇到势均力敌的竞争对手

  在Steve Oberlin的演讲中,曾提到GPU相比Xeon Phi的巨大优势,说明GPU在性能上的强大。那么是不是意味着NVIDIA没有遇到真正意义上的竞争对手呢?Steve Oberlin认为迄今为止Tesla还没有遇到势均力敌的产品。

没有等量级对手 NVIDIA高层解读GPU计算

  “如果你们比较我们的产品和其他一些公司的产品,在跑实际应用时候的性能,确实没有真正意义上和我们水平相当的势均力敌的产品,但这并不是说我们没有竞争对手,竞争对手肯定是很多的,但是目前能够可以跟我们比较的,在性能上能跟我们真正达到比较水平的,是没有的。

  但是这也不意味着我们就可以放松警惕,就可以骄傲自满,因为首先客户的要求非常高,他们希望有更高效的能耗比,他们希望我们能够提供更好的性能。而且在高性能计算的领域,对应用的要求也是非常高的,不仅仅是涉及到公司盈利的问题,还涉及到科学发现,医学药物的探索,以及可能和现代社会的基础都有关很多一些非常重要的方面。从应用这方面来说,客户的要求非常高,更何况很多人可能想取代NVIDIA公司在这个市场上的地位,所以我们也是一刻不能放松的。”

  NVIDIA是软件公司,更是平台公司

  如今,软件定义一切成为了IT行业的主题。NVIDIA全球副总裁、PSG&云计算业务总经理Ashok Pandey认为,NVIDIA不仅提供硬件产品,还提供了包括CUDA在内的软件和相关服务器内容。如果之前说NVIDIA是一家软件公司的话,那么现在NVIDIA能够为用户提供平台化的解决方案,在这个平台上让用户的业务性能得到最大化。“从这个角度来说,我们是一家平台公司”。

  总结:正如潘迪提到的那样,如果说之前NVIDIA提供的是GPU加速卡,提供的是CUDA培训,那么现在它所实现的则是在基于GPU并行计算的平台上实现高性能计算的解决方案,并且它也成功的让超级计算机的性能逐年提升。在下周举行的SC14大会上,NVIDIA还将发布全新一代的GPU加速卡,推动高性能计算行业进一步发展。

1
相关文章