服务器 频道

Mellanox副总裁谈Co-design是个什么鬼?

  【IT168 评论】这个标题让人看得一头雾水,但并不影响实质的表达。Mellanox的名字并不被人熟知,甚至连它自己也承认在中国还处于“闷声发大财”的阶段:一方面在网络领域,Mellanox远不如思科、华为那样声名赫赫,但另一方面在InfiniBand领域,在涉及到高带宽与低延迟的网络传输领域,Mellanox却是行业的领军者。日前,Mellanox市场副总裁Gilad Shainer在北京与众多媒体畅谈了未来市场发展方向,重点提及了“Co-design(协同设计)”战略及新品特性。

Mellanox副总裁谈Co-design是个什么鬼?
▲Mellanox市场副总裁Gilad Shainer

  Co-design战略——让专业的人做专业的事儿

  人类历史的发展从某种程度上来说就是社会分工细化的历史,套用当下一句流行语——让专业的人做专业的事儿。从整个社会的角度来说,这样细致的分工可以让每个人各司其职,最大限度发挥自己的特长;而从计算机设计的角度来说,处理器、GPU、网络……每个部件都应该有所分工,实现有机的整合。Gilad Shainer甚至从网络发展的角度说明了Co-design存在的必要性:“十年前,网络延迟和软件都是100微秒。如今,网络延迟已经降低到了1微秒,而软件延迟停留在10微秒的水平。与十年前相比,硬件快了100倍,而软件优化只快了10倍。最郁闷的是,接下来无论硬件如何优化提升,基本上已经达到物理极限。同时,整个应用程序性能提升也是微乎其微了,因为软件负荷太大”。

Mellanox副总裁谈Co-design是个什么鬼?

  Co-design存在的意义就是通过一种任务卸载的方式,让很多组件共同协同完成一个任务,通过专业的芯片进行处理,从而实现性能的大幅度提升——“通过很多技术协同和卸载的功能,可以让虚拟化做到更高效率,更好地处理这种应用程序失败的情景。将来虚拟化在高性能计算上是大有用武之地的。”虽然这个想法听起来不错,但是在当今英特尔引领的x86平台中,这种做法却是与主流方式背道而驰的。

Mellanox副总裁谈Co-design是个什么鬼?

  为此,Mellanox也正在积极寻求非x86架构平台的突破,迄今为止已经能够在ARM、POWER等多个平台运行,同时与NVIDIA也结成了良好的合作关系,比如GPU-Direct技术的出现。而除了硬件厂商之外,Mellanox还积极拓展软件平台的合作,成立了OPEN UCX联盟——这个联盟中的成员(软件公司)把自己最优秀的程序贡献出来,同时去互相交流,创建一个适合HPC更好性能更高的软件组合。而在于科研界、工业界等上下游的研发和生产应用方面,Mellanox也在不断听取他们的意见,通过产学研的共同作用实现技术创新。

  作为InfiniBand网络的领先供应商,Mellanox随着人工智能、深度学习等全新HPC概念的普及也有了广阔的发展空间。事实上,除了作为Mellanox市场副总裁之外,Gilad Shainer还兼任国际高性能计算咨询委员会的主席,对于高性能计算的发展及普及也更有发言权。在谈到今年7月德国发布的最新一期TOP500榜单时,Gilad表示InfiniBand第一次在总体份额上面超过以太网,成为最主流的高性能计算网络,这也说明业界对于InfiniBand技术的高度认可。除此之外,Mellanox非常先进的EDR 100Gb/s网络也已经在中国、欧洲和美国市场有所应用。

最高效的EDR网络与HPC发展

  Gilad特别提到了当下对于EDR 100Gb/s网络的质疑与竞争对手新品的预期。他表示:“我们的网络毋庸置疑的是被证明使用时间最长的、最可靠的、最可扩展最高性能的端到端的网络,而且它是最灵活的,没有一家网络公司现在可以支持所有的网络架构。我们已经完成了所有的CPU架构支持,所有的Mellanox产品都是开放标准的产品,有大型的生态圈,不是我们自己独创的技术规范。不管是InfiniBand还是以太网都是开放工业标准的网络,所以我们一直坚持走标准体系。还有一个就是卸载架构,我们希望网卡不仅仅是传输信息,它能够做更多的智能工作,去分担CPU所承担的任务,做成一个协同处理器,而不简简单单的是一个通信部件。

  那通过RDMA,通过卸载,通过应用程序的加速,我们会继续做卸载的架构。支持灵活的网络架构,胖树、Mash、Dragon-Fly等这些网络拓扑几乎在市面上大家能用到的、比较主流的网络架构,我们全部都支持。大家不要小看这个网络架构。在高性能计算领域里面,其它公司没有任何一个可以全部都支持的网络架构,我们是全部都支持的。我们想将计算、存储、管理,所有涉及到的通讯,都能集中到我们一个网络设备上面来,而不是用传统光纤做存储,用以太网来做计算、管理,变成三个分开的网络。我们是一个网络,所有的流量类型都支持,而且它无论是以前的网络还是将来的网络,我们都是前后兼容的,技术不会做成一个全新的技术,它是会前后具备一个很好的兼容性”。

  说到激动之处,Gilad还特别展示了Mellanox EDR产品的发展路线图,从图中我们可以看到,未来Mellanox的产品还将有200Gb/s网络。“我们已经做了200G的网络产品,我们将会一直保持着一代产品,领先于竞争对手的发展趋势”。

  在保持InfiniBand网络领先优势的同时,Mellanox也计划吹响向以太网市场冲锋的号角。其实早在6月18日,Mellanox就在美国发布了全球首款无阻塞100千兆以太网交换机Spectrum(光谱),它基于开放式以太网架构,为Mellanox客户提供应用程序接口(API)选择,以实现更快的上市时间和更大的灵活性,同时还提供业内领先的25、50及100千兆以太网性能,确保数据中心可以推动其业务向前发展。而这次,Mellanox计划10月14日在北京中华世纪坛发布这款产品。

Mellanox即将在京召开规模盛大的发布会

  据悉,Spectrum是全球首款无阻塞100千兆以太网交换机,其决定性的零丢包性能和超大规模使其成为云、Web 2.0和企业应用程序的最高效的构建基块, 可实时处理和完成请求。作为25G以太网联盟(25G Ethernet Consortium)创始成员,Mellanox的Spectrum交换机将引导服务器向25Gb/s和50Gb/s的增强型机架内连接性过渡。 除此之外,Spectrum还提供先进的监控接口,用于持续跟踪带宽和拥塞,还提供可编程负荷平衡功能,以便快速高效地解决拥塞。通过诸如OpenFlow之类的协议,利用弹性传输路径可实现基于流的策略执行,不会影响性能,并且可实现几乎无限的连续策略流。

  之所以大张旗鼓的发布这款产品,是因为Mellanox认为10Gb网络已经远远不能满足客户的需求,而25Gb甚至50Gb的产品可以在最大可能保障用户使用习惯和投资的情况下实现效益的最大化。“为什么现在的网络架构可以从四万兆跳到25Gb和50Gb,其原因很简单——因为25Gb和10Gb他们的连接方式非常相近,基本上是一样的连接方式,一样的连接端口,但是却有了2.5倍的吞吐量,而且成本变化不大”,Gilad坚定的表示。

0
相关文章