服务器 频道

NVIDIA云原生超级计算挺进千万数据中心

  容器已成为现代工作负载的标准部署单元。容器的可移植性和可扩展性使开发和运营人员能够快速构建和部署应用程序。

  云原生是一种架构模式,用于在几乎任何环境下开发和部署由Kubernetes管理的容器化应用程序,包括本地数据中心、公共云等环境。

  NVIDIA是AI基础架构和平台领域的专家,它积极采用云原生技术,使云原生开发人员易于访问及使用GPU。它构建了各种服务和工具,以缩小GPU和DPU等硬件加速器与Kubernetes生态系统之间的差距。

  会计算的网络:NVIDIA Quantum-2平台融计算与通信于一身

  几个月前,NVIDIA Quantum交换机在高性能计算大会ISC上初露锋芒,为NVIDIA DGX A100系统的性能提升起到了关键作用。

  几个月后,NVIDIA Quantum-2新一代InfiniBand网络平台在GTC大会上正式发布,为云计算提供商和超级计算中心提供极致的性能、广泛的接入能力以及强大的安全性,带领企业迈进云计算和超级计算融合的时代。

  据介绍,NVIDIA Quantum-2平台即400Gbps的InfiniBand网络平台,包括NVIDIA Quantum-2交换机、ConnectX-7网卡、BlueField-3数据中心处理器(DPU)和支持这种新架构的软件,这也是迄今为止非常先进的端到端高性能网络平台。

  NVIDIA Quantum-2平台推出之时,正值越来越多的超级计算中心走向为广大用户开放之际,其中也包括许多外部用户,与此同时,全球云服务提供商也开始为他们的数以百万计的客户提供更多的超级计算服务。

  NVIDIA Quantum-2平台正是为上述两种趋势的高要求应用而量身定制。凭借其云原生技术,这款产品可提供每秒400Gb/s的高吞吐量和先进的多租户支持功能,可满足众多用户的需求。

  英伟达网络事业部亚太区市场开发高级总监宋庆春表示,云原生是未来提供算力平台的发展趋势。把云原生的设备高效连接起来,InfiniBand网络是目前看到最贴切、最合适的网络。

  不仅如此,NVIDIA Quantum-2平台还实现了多租户之间的性能隔离,这使得一个租户的行为不会干扰到其他租户,同时通过利用先进的主动遥测和支持云原生的拥塞控制机制,确保了可靠的数据吞吐量,并且不受用户或应用需求高峰的影响。

  3U一体云原生架构赋能无限算力资源

  随着AI技术的普及和数据量爆发性增长,数据中心正在发生变革。从传统的冯·诺依曼架构的数据中心转向以数据为中心的架构,数据在网络通信过程中,很多通信模型会制约整个系统性能的发展,这就给我们提出了一个新的挑战——如何继续提升数据中心性能。

  网络计算以数据为中心的新的架构,帮我们解决了这个问题。以数据为中心的新的架构,意味着数据在哪里,计算就在那里;当数据在GPU上,计算就在GPU上;当数据在CPU上,计算就在CPU上;当数据在网络中传输的时候,计算就在网络中。

  通过这样的方式就可以解决网络传输中多打一的瓶颈问题或丢包问题。新的架构可以使通信延时降低10倍以上。所以,网络计算成为我们现在以数据为中心这种核心计算架构的关键技术之一。

  宋庆春表示,DPU的出现为以数据为中心的计算架构提供了非常创新的思路。据介绍,BlueField-3是业界第一款400G速度的DPU。在BlueField-3上可以来实现400Gb/s加解密的速度,不管是用IPSec还是用TLS,在加解密的速度上都可以达到400Gb/s的全线速。

  NVIDIA云原生软件定义安全技术直面现代零信任

  如今,数据中心需要处理快速增长的用户、应用及数据流量,这使企业在缺乏零信任保护模式的情况下,极易受到攻击。因此,NVIDIA DOCA 1.2应运而生,支持开发者构建基于NVIDIA BlueField DPU的应用。

  借助DOCA 1.2零信任安全框架,开发者可以建立量化的云服务来控制资源访问、验证每个应用和用户、隔离可能受到影响的机器并帮助保护数据免灾破坏和盗窃。

  宋庆春表示,传统方法应对恶意攻击的方法往往是先对恶意攻击进行识别,再进行安全防御。其问题在于恶意攻击行为在不断出新,无法自动识别这些恶意攻击行为的传统方法就无法实现100%的安全防御。

  而Morpheus安全框架的特别之处在于,其通过AI深度学习,对数据中心的人、行为、设备、流量等特征进行提取、分析、训练、推理,最终产生一套数字指纹模型。该安全框架可以在零监督、自学习的环境下,识别行为是否标准、存在恶意,对非标准行为进行监督,防护数据中心安全。

  DOCA 1.2零信任安全框架是驱动NVIDIA BlueField DPU的基础软件,NVIDIA BlueField DPU可以卸载、加速和隔离数据中心基础架构任务。如同NVIDIA CUDA使开发者能够构建基于NVIDIA GPU的应用,DOCA使开发者能够基于BlueField DPU构建软件定义、硬件加速的网络、安全、存储和管理应用。

  写在最后,如今,行业面临的问题不再是计算机能够做什么,而是谁率先利用它来推动行业的革新。从传统的高性能计算到新型的加速计算,再到AI与HPC的融合,以及云原生、云HPC的诸多应用,NVIDIA始终站在舞台的中央,推动着各行各业的前沿应用走向未来的创新。

0
相关文章