服务器 频道

推动百亿亿次 解读NVLink背后的故事

  【IT168 评论】去年11月,美国能源局宣布了全新超级计算机发展计划,其中一项重要的内容就是面向未来百亿亿次计算能力而进军。在之前披露的消息中,并没有提及这些计算机的具体信息,只是谈到了将采用来自IBM和NVIDIA全新的技术加速运算。不过在近日,我们有幸采访到了NVIDIA 解决方案工程架构副总裁 Marc Hamilton和NVIDIA 副总裁及PSG&云计算业务总经理 Ashok Pandey,他们将具体介绍未来超级计算机的形态和发展方向。

推动百亿亿次 解读NVLink背后的故事
▲NVIDIA 解决方案工程架构副总裁 Marc Hamilton

  事实上,多年来NVIDIA一直在超级计算机领域处于领先地位,特别是它所提出的异构计算模式已经成为当下主流应用,曾获得2012年TOP500冠军、目前美国最快的超级计算机泰坦Titan就采用了NVIDIA提供的异构计算解决方案。这次,NVIDIA更是为美国能源局提供了最新的Tesla GPU和非常先进的NVLink技术,帮助能源局实现更快的计算速度。

推动百亿亿次 解读NVLink背后的故事

  据Marc Hamilton介绍,目前美国能源局正在打造两款名为“高峰”和“峰峦”的超级计算机,它们均采用了IBM POWER9处理器和NVIDIA Volta GPU。在谈到为何选择这样的组合模式时,Marc认为这是IBM与NVIDIA携手合作的解决方案更能够满足客户的需求,在最初提案的时候美国能源局并没有提供具体的配置要求,只是根据实际的运行情况设计了25个微型APP程序,用以模拟不同配置情况下的方案优劣。而提到这次中标的优势,Marc更是将其归功于NVLink技术。

推动百亿亿次 解读NVLink背后的故事

  这个名词许多人并不陌生,因为早在今年3月的GTC大会上,我们就曾经详细的报道过这种技术的优势。一直以来,GPU和CPU间的数据传输速度都是一项技术瓶颈,因为GPU的显存能够快速而少量的读写数据,而CPU使用内存读写则大量而慢速,因此,CPU的传输带宽大于GPU。NVLink通过调整相应架构,使得GPU和CPU间的传输速度获得巨大的提升。来自NVIDIA官方数据显示,NVLink可以让GPU与CPU之间共享数据的速度能够比当今速度快5-12倍。

推动百亿亿次 解读NVLink背后的故事

  Marc同样提到了一个非常重要的问题——OPENPOWER基金会。这是IBM联合NVIDIA、Google、Mellanox等公司于2013年成立的全新组织,这是一个基于POWER微处理器架构的开放式研发群体,最新数据显示其成员已经达到了80家。NVLink可以看作是这一基金会成立之后的重要成果,特别是美国能源局的采用使得这项技术得以彻底“落地”。除此之外,许多客户也对NVLink保持了浓厚的兴趣,只是NVIDIA迫于商业原则不能公布他们的名字。“随着时间的推移,2015年大家会看到有一些新的系统和项目的发布”,Marc如是说。

  当然,NVLink的应用领域不仅仅局限于POWER平台中,Pandey作为PSG业务中国区负责人,更为我们描绘了这项技术的广阔应用前景。如今中国政府尤其重视自主可控的软硬件设备,包括龙芯、神威等许多国产处理器也已经应用在高性能计算领域中。Pandey表示,未来NVLink将能够实现对于龙芯、神威等处理器的支持,而且在2016年我们或许可以看到对于ARM处理器的支持。

  如果你使用的并不是上面我们提到的任何一款处理器,您依然能够使用NVLink技术。除了GPU与CPU的传输之外,GPU之间的数据传输也是我们经常需要遇到的问题。NVLink同样可以在这些应用中发挥作用,让你的高性能服务器更快的运转起来。

推动百亿亿次 解读NVLink背后的故事
▲NVIDIA 副总裁及PSG&云计算业务总经理 Ashok Pandey

  作为一款软件技术,NVLink的好处还在于,你甚至不需要学习就可以免费应用这款技术;当然如果你能够根据业务模型进行优化的话,也将会获得更好的性能。而对于中国市场,NVIDIA也有着自己的打算。按照Pandey的想法,NVIDIA在中国最重要的战略分为三个层面:

  首先是应用及技术来带动。高性能计算的发展越来越与实际的应用相结合,一方面科学计算、分子动力学等传统计算领域还是NVIDIA的应用基础,而另一方面深度学习正在成为广大互联网客户应用的主流。从国外的谷歌大脑到中国的讯飞超脑,深度学习正在逐步影响着互联网应用,进而影响大众的生活。因此从这个层面来说,NVIDIA除了将会宣传NVLink技术,在合作伙伴及用户中推广这个技术之外,更会结合OPENPOWER基金会的力量,在POWER平台及ARM平台上进一步发力。

  其次是扎根中国,与中国的合作伙伴一起成长。在过去的今年,NVIDIA与包括浪潮、曙光、华为在内的本地合作伙伴建立的良好的关系并一起成长。未来NVIDIA还将继续保持这部分内容,并且将会吸纳更多的合伙伙伴加入其中,比如联想。

  第三,Pandey重新强调了“NVIDIA是一家平台公司”的概念。他表示:“转入到平台公司的时候,软件+服务是非常非常重要的,我们现在也是积极的把我们软件,我们CUDA的企业服务,也带入到中国”。

  记得在2014年3月的GTC大会上,听到NVIDIA联合创始人兼首席执行官黄仁勋宣布NVLink将在2016年正式推出的时候,我还感觉这个时间很遥远。但是现在看来,迫不及待的用户需求推动了技术的不断前进与发展,同时NVIDIA的转型也使得它不仅能够在HPC领域,包括云计算、大数据等多个新兴领域中发挥越来越关键的作用。

4
相关文章