【IT168 资讯】11月21日,NVIDIA(英伟达) GTC China 2018在苏州举行。上午,NVIDIA创始人兼CEO黄仁勋宣布了NVIDIA在中国的一系列最新成果与合作进展。
NVIDIA是加速计算的开创者与领导者,多年来利用其专门设计的处理器堆栈为众多关键应用程序、工作负载进行了加速。近期在2018全球超算大会(SC2018)上公布的全球超算系统TOP 500榜单里,能效最出色的25台计算机中,有22台由NVIDIA提供支持。其中全球业内知名的Summit超算系统使用了27648个NVIDIA V100 GPU,以获得更高的计算能力。
NVIDIA创始人兼CEO 黄仁勋
会上,黄仁勋介绍了其最新的HGX-2服务器平台,并宣布了与中国领先科技公司基于HGX-2的合作动态。
NVIDIA HGX-2单节点可提供2千万亿次的计算性能,利用 NVIDIA NVSwitch互联结构等突破性功能,将16个 NVIDIA Tesla V100 Tensor Core GPU 无缝连接到一起,形成一个巨型 GPU。HGX-2 还具有 0.5 TB 内存和 16 TB/s 总内存带宽。借助多精度计算能力,NVIDIA HGX-2可提供无可比拟的灵活性——融合了高精度FP64和FP32,可实现精确高性能计算;也融合了更快速的低精度 FP16 和 INT8,可实现深度学习和机器学习。
NVIDIA HGX-2
黄仁勋宣布,多家领先的服务器制造商正在利用HGX-2生产具有更高性能的服务器设备。浪潮是中国首家构建HGX-2服务器的厂商,浪潮AI超级服务器 AGX-5专为解决当前AI深度学习和高性能计算的性能扩展难题而设计。同时,联想、华为、曙光也正在使用HGX-2制造高性能计算平台。除此之外,百度和腾讯也将借助 HGX-2为内部应用及云客户提供一系列更强大的AI及云计算服务。
NVIDIA HGX-2的目标是帮助HPC提升计算能力,加速AI与数据分析;而NVIDIA T4,则是专为大规模计算集群而生。
NVIDIA T4 GPU基于全新NVIDIA Turing架构,采用多精度Turing Tensor Core和全新RT Core,与加速的容器化软件堆栈相结合,可提供更高的性能。如我们所说,T4旨在满足大规模计算集群的需求,它具有小巧的外形,功率为70瓦特,单节点服务器设计可支持从单个 T4 GPU到20 个。通过T4,客户可同时获得高性能与灵活性,最大限度地提高计算集群的吞吐量、利用率和用户并发性。
NVIDIA T4 GPU
今天,NVIDIA公布了采用T4 GPU的中国客户,并表示T4已成为普及迅速最快的服务器GPU。中国首批开始使用T4扩展计算集群的公司包括百度云、腾讯云、京东云以及科大讯飞。中国领先的服务器制造商,包括浪潮、联想、华为、曙光、浪潮商用机器和新华三也将推出一系列基于T4的服务器。黄仁勋表示,目前有超过50款基于T4的服务器设计正在进行中。
除硬件外,软件堆栈对于加速计算也非常重要,借助快速的核函数、快速库、创新算法和优化的应用程序,可实现10到50倍的加速。黄仁勋在演讲中指出:“如今,NVIDIA已有600多种加速应用程序,我们的架构兼容策略使这些应用可适用于大型部署。加速堆栈是多层次的,并经过精心优化,NVIDIA已将许多受欢迎的加速应用容器化,并存储在NGC(NVIDIA GPU 云)注册表中。”
NVIDIA宣布,中国领先服务器制造商华为、浪潮、联想、曙光,已经推出了的全新NGC-Ready系统,让客户可以放心地在基于NVIDIA GPU的系统上部署加速软件,能够以一种具有可重复性、容器化的方式,在从开发到生产的整个过程中运行加速应用。
“新HPC市场,就是科学计算、数据科学和AI。”黄仁勋表示,“每个HPC应用程序都受到摩尔定律中介的限制,NVIDIA一直在为加速整个新HPC市场铺平道路并超越摩尔定律。借助V100、HGX-2、T4以及所有加速堆栈,NVIDIA启动了加速整个新HPC生态的过程。”