服务器 频道

发力数字孪生 NVIDIA Spectrum-4平台引领数据中心网络升级

  如今,数据中心规模正在呈指数级增长,需要超高的性能、先进的安全性和强大的功能来大规模实现先进的高性能、虚拟化和模拟仿真,而专为人工智能打造的NVIDIA Spectrum-4网络平台将满足这一系列需求。

  在GTC 2022春季大会上,NVIDIA发布了全新的Spectrum-4端到端400Gbps以太网网络平台,可为大规模云计算、企业人工智能和模拟仿真进行性能优化,提供极致的性能、高级的安全性和强大的功能,同时降低功耗和成本。接下来,让我们一起看看Spectrum-4以太网平台如何构成Omniverse数字孪生骨干网络。

  虚拟世界对下一代人工智能至关重要

  众所周知,NVIDIA在虚拟世界中占有特定的位置,虚拟世界对下一代人工智能起着至关重要的作用,NVIDIA从创建之初就致力于虚拟世界的模拟,包括游戏与计算机图形方面的技术。

  多年来,随着互连的虚拟世界持续推动下一代人工智能工作负载的发展,NVIDIA从工业和工程的角度来重新审视虚拟世界,从而构建了Omniverse,创建和模拟与现实世界无法区分的虚拟世界平台,为实现数字孪生模型铺平了道路,并广泛应用于机器人、自动驾驶汽车、智能工厂和气候研究等领域。

NVIDIA网络专家 崔岩

  那么,什么是数字孪生呢?NVIDIA网络专家崔岩表示,真正的数字孪生实际上是一个实物世界的现实翻版,从更大规模的角度看,数字孪生是和物理世界相连接的一个虚拟世界,真正的数字孪生必须满足以下四大特征:

  第一,物理上有准确性和真实性,必须遵循物理的定律;第二,不间断的与物理世界进行同步,基本上实现所见即所得的同步体验;第三,精准的运行时间,在多个计算节点上实现同步;第四,包括多种多个自制系统,各种各样的系统来支撑数字孪生技术。

  崔岩表示,Omniverse是一个数字孪生对工业资产、流程或环境大规模精确模拟的平台,具有多个与现实世界数据流完美同步的自治系统,所以,Omniverse相当于是一个大融合,可以支持多个同步自制系统。

  那么,Omniverse是如何帮助企业的呢?崔岩以宝马集团借助Omniverse数字孪生构建未来工厂为例,宝马工厂平均每分钟生产一辆新车,要满足宝马不断改进和创新的需求,需要复杂的生产场景仿真,快速的输出,提高敏捷性,并从各方面优化效率。NVIDIA Omniverse能够随时随地在宝马需要时推出新的仿真功能,以便做出重要决策并引入自动化。

  为实现宝马工厂的数字孪生应用场景,数字孪生需要利用NVIDIA加速计算的全部力量。在今年的GTC春季大会上,NVIDIA对外发布了OVX加速计算系统,可以更好的去支撑Omniverse数字孪生平台,更好的为客户提供一个专为Omniverse数字孪生需求而打造的基础设施。

  据了解,NVIDIA OVX不仅仅是一台服务器,它旨在扩展以支持最苛刻的数字孪生工作负载。据崔岩介绍,OVX服务器由8颗NVIDIA A40 RTX GPU、3块NVIDIA ConnectX-6 Dx 200Gbps网卡、1TB系统内存和16TB NVMe存储组成。OVX加速计算系统可以从由8台至16台OVX服务器组成的OVX POD扩展到32台OVX服务器组成的OVX SuperPOD,并通过NVIDIA Spectrum-3交换网络架构进行连接,来加速大规模数字孪生模拟。

  NVIDIA Spectrum-4平台构成Omniverse数字孪生的骨干网络

  据崔岩介绍,Spectrum-4网络平台不只是一款交换机产品,它是由四大部分构成:Spectrum-4以太网交换机,加速整个云网络架构;ConnectX-7智能网卡,加速服务器节点中网络性能适配器;BlueField-3 DPU,可编程数据中心基础架构;以及这些硬件平台上的相关软件;这四大组合部分共同构成了端到端的400Gbps超大规模网络平台——Spectrum-4。

  那么,它有哪些过人之处呢?作为全球首个400Gbps端到端以太网网络平台,NVIDIA Spectrum-4的交换吞吐量比前几代产品高出4倍,达到51.2Tbps,能够大幅加速大规模云原生应用。

  在Spectrum-4交换机性能与创新方面,NVIDIA Spectrum-4 ASIC基于4N制程工艺,包含千亿个晶体管以及经过简化的收发器设计,具有领先的能效和总拥有成本。凭借支持128个400GbE端口的51.2Tbps聚合ASIC带宽,以及自适应路由选择和增强拥塞控制机制,Spectrum-4优化了基于融合以太网的RDMA(RoCE)网络架构,并显著提升了数据中心的应用速度。

  在Spectrum-4整个大环境中的另外两个重要组件,一是ConnectX-7智能网卡,另一个是NVIDIA BlueField-3 DPU。

  ConnectX-7智能网卡具有四个方面的优势:加速软件定义的网络、提供从边缘到核心的安全性和存储性能上的提升,精准计时为数据中心应用程序和时间敏感型基础设施提供更精准的时间同步。

  NVIDIA BlueField-3 DPU和DOCA软件框架能够大幅加速大规模云原生应用。而且BlueField-3 DPU还可以实现零信任安全,把应用域和基础设施域进行隔离,保障客户端的应用和基础设施端的数据安全。

  崔岩表示,Spectrum-4不只是一个网络平台,我们会将其和NVIDIA其他的平台软件和应用做整合,这样可以达到最好的网络应用效果。同时,我们还有开放的Cumulus Linux网络操作系统、SONiC网络操作系统和DOCA软件开发套件。通过DOCA可以更好的在BlueField DPU上面做软件开发,在大规模云原生应用场景下加速整个数据中心,基于基础设施的虚拟化和软件定义、硬件加速的网络、存储、安全来提供更多的应用和服务。

  写在最后,随着数据中心对于网络的要求越来越高,网络平台的革新不可缺少。不管是Spectrum-4以太网网络平台还是NVLink、InfiniBand等互连技术的更新,NVIDIA在数据中心的互联互通方面一直持续持续创新,让数据中心能够应对不断涌现的新型工作负载。

1
相关文章