服务器 频道

高性能 + 高可靠 NVIDIA Quantum-2平台来了!

  几个月前,NVIDIA Quantum-2在高性能计算大会ISC上初露锋芒,为NVIDIA DGX A100系统的性能提升起到了关键作用。

  几个月后,NVIDIA Quantum-2新一代InfiniBand网络平台在GTC大会上正式发布,为云计算提供商和超级计算中心提供极致的性能、广泛的接入能力以及强大的安全性,带领企业迈进云计算和超级计算融合的时代。

  据介绍,NVIDIA Quantum-2平台即400Gbps的InfiniBand网络平台,包括NVIDIA Quantum-2交换机、ConnectX-7网卡、BlueField-3数据中心DPU和支持这种新架构的软件,这也是迄今为止非常先进的端到端高性能网络平台。

  NVIDIA Quantum-2平台推出之时,正值越来越多的超级计算中心走向为广大用户开放之际,其中也包括许多外部用户,与此同时,全球云服务提供商也开始为他们的数以百万计的客户提供更多的超级计算服务。

  NVIDIA Quantum-2平台正式为上述两种趋势的高要求应用而量身定制。凭借其云原生技术,这款产品可提供每秒400Gb/s的高吞吐量和先进的多租户支持功能,可满足众多用户的需求。

  NVIDIA网络高级副总裁Gilad Shainer表示:“如今,超级计算中心和公有云的诉求正在走向融合,他们需要为新一代高性能计算、AI和数据分析的应用提供尽可能高的性能,同时还应安全隔离应用,并响应用户对流量的不同诉求。凭借NVIDIA Quantum InfiniBand平台,现代数据中心已经可以将这一远景变为现实。”

  NVIDIA Quantum-2平台的性能和云原生功能

  凭借每秒400Gbps的高吞吐量,NVIDIA Quantum-2 InfiniBand将网速提高了一倍,网络端口数量增加了三倍。它在性能提升3倍的同时,还将使数据中心网络所需的交换机数量减少了6倍,与此同时,数据中心的能耗和空间也将各减少7%。

  不仅如此,NVIDIA Quantum-2平台还实现了多租户之间的性能隔离,这使得一个租户的行为不会干扰到其他租户,同时通过利用先进的主动遥测和支持云原生的拥塞控制机制,确保了可靠的数据吞吐量,并且不受用户或应用需求高峰的影响。

  NVIDIA Quantum-2 SHARPv3网络计算技术可为AI应用提供超出上一代产品32倍的加速引擎能力,借助NVIDIA UFM Cyber-AI平台,将为数据中心提供先进的InfiniBand网络管理功能,包括预测性维护等。

  值得一提的是,NVIDIA Quantum-2平台中还集成了纳秒级精度的时钟系统可以同步分布式应用,如在数据库处理中,有助于减少等待及空闲时间。纳秒时钟同步是一种新功能,其使得云数据中心成为电信网络的一部分,可以托管软件定义的5G无线服务。

  Quantum-2 InfiniBand交换机

  Quantum-2平台的核心是全新的Quantum-2 InfiniBand交换机,其主芯片采用7纳米制程,包含了570亿个晶体管,略多于含有540亿个晶体管的NVIDIA A100 GPU。

  它支持64个400Gbps端口或128个200Gbps端口,并将提供不同端口数的模块式交换机系统,最多达2048个端口,在交换能力上超出上一代Quantum-1约5倍。携网络速度、交换能力和高扩展性的优势,使其成为构建下一代巨型高性能计算系统的理想选择。

  据悉,全球众多领先的基础架构和系统厂商已经支持NVIDIA Quantum-2平台,包括Atos、DataDirect Networks、戴尔、Excelero、技嘉、惠普、IBM、浪潮、联想、Penguin Computing、QCT、超微、VAST Data和WekaIO。

  Quantum-2 ConnectX-7和BlueField-3

  NVIDIA Quantum-2平台在主机端提供了两个网络选项,NVIDIA ConnectX-7网卡和NVIDIA BlueField-3 DPU InfiniBand。

  据介绍,NVIDIA ConnectX-7基于7纳米工艺设计,包含80亿个晶体管,其数据传输速率是目前世界领先的高性能计算网络芯片NVIDIA ConnectX-6的两倍,还将RDMA、GPUDirect Storage、GPUDirect RDMA和网络计算的性能翻倍,NVIDIA方面表示,ConnectX-7样片将于明年1月问世。

  BlueField-3 InfiniBand也采用7纳米工艺设计,包含220亿个晶体管,提供16个64位的Arm CPU,以卸载和隔离各种数据中心基础设施服务,据悉,BlueField-3样片将于明年5月问世。

  NVIDIA与网络安全行业领导者共同助力数据中心实现深度零信任保护

  在GTC大会期间,NVIDIA发布了一款零信任安全框架。此框架帮助开发者实现网络安全即服务,将数据中心安全保护扩展到用户涉及的应用、数据、设备、存储、基础架构等几乎所有关键点。

  如今,数据中心需要处理快速增长的用户、应用及数据流量,这使企业在缺乏零信任保护模式的情况下,极易受到攻击。因此,NVIDIA DOCA 1.2应运而生,支持开发者构建基于NVIDIA BlueField DPU的应用。

  借助DOCA 1.2零信任安全框架,开发者可以建立量化的云服务来控制资源访问、验证每个应用和用户、隔离可能受到影响的机器并帮助保护数据免灾破坏和盗窃。

  NVIDIA网络高级副总裁Kevin Deierling表示:“AI、5G和智能设备等革命性创新的增长,极大地增长了现代数据中心的流量,使得识别潜在漏洞的攻击变得更加困难。NVIDIA零信任安全框架使开发者能够创建全面安全的环境,从而保护云原生数据中心的几乎每一个方面,并始终比日益复杂的安全威胁更领先一步。”

  DOCA 1.2中提供的其他高级零信任安全功能包括软件和硬件认证、硬件加速的线速数据加密、对分布式防火墙和智能遥测的支持,以及策略执行,如基于角色的访问控制和微服务、租户之间的安全隔离等,所有这些都可以作为容器部署,以提供给开发者使用。

  DOCA 1.2与NVIDIA Morpheus相得益彰。Morpheus是一个基于NVIDIA RAPIDS的零信任AI应用框架,用于分析来自网络流量日志、应用日志和云日志的流式遥测数据,为网络上的每个应用和用户建立独立的行为档案,一旦出现异常情况,它将提醒安全运营团队注意潜在的安全漏洞。

  BlueField和DOCA 1.2推动数据中心创新

  DOCA 1.2零信任安全框架是驱动NVIDIA BlueField DPU的基础软件,NVIDIA BlueField DPU可以卸载、加速和隔离数据中心基础架构任务。如同NVIDIA CUDA使开发者能够构建基于NVIDIA GPU的应用,DOCA使开发者能够基于BlueField DPU构建软件定义、硬件加速的网络、安全、存储和管理应用。

  Juniper Networks是首批使用BlueField和DOCA的网络安全行业领导者之一。

  Juniper Networks首席技术官Raj Yavatkar表示:“零信任安全应成为全面安全战略的一个基础支柱。通过引入新的方法实现零信任安全的操作化,我们可以使这项技术在整个行业中快速普及。Juniper Networks长期以来一直倡导开放架构以确保客户的选择权。DOCA能够很好地满足行业客户的数字化转型需求,这种方法的应用将帮助客户更好地保护其云应用并采用零信任原则。”

  写在最后,如今,行业面临的问题不再是计算机能够做什么,而是谁率先利用它来推动行业的革新。从传统的高性能计算到新型的加速计算,再到AI与HPC的融合,以及云原生、云HPC的诸多应用,NVIDIA始终站在舞台的中央,推动着各行各业的前沿应用走向未来的创新。

2
相关文章