黄仁勋：NVIDIA加速计算为新HPC市场铺平道路-服务器专区

黄仁勋：NVIDIA加速计算为新HPC市场铺平道路

作者：谢涛编辑：谢涛 2018-11-21 17:08 IT168网站原创

　　【IT168 资讯】11月21日，NVIDIA(英伟达) GTC China 2018在苏州举行。上午，NVIDIA创始人兼CEO黄仁勋宣布了NVIDIA在中国的一系列最新成果与合作进展。

　　NVIDIA是加速计算的开创者与领导者，多年来利用其专门设计的处理器堆栈为众多关键应用程序、工作负载进行了加速。近期在2018全球超算大会(SC2018)上公布的全球超算系统TOP 500榜单里，能效最出色的25台计算机中，有22台由NVIDIA提供支持。其中全球业内知名的Summit超算系统使用了27648个NVIDIA V100 GPU，以获得更高的计算能力。

NVIDIA创始人兼CEO 黄仁勋

　　会上，黄仁勋介绍了其最新的HGX-2服务器平台，并宣布了与中国领先科技公司基于HGX-2的合作动态。

　　NVIDIA HGX-2单节点可提供2千万亿次的计算性能，利用 NVIDIA NVSwitch互联结构等突破性功能，将16个 NVIDIA Tesla V100 Tensor Core GPU 无缝连接到一起，形成一个巨型 GPU。HGX-2 还具有 0.5 TB 内存和 16 TB/s 总内存带宽。借助多精度计算能力，NVIDIA HGX-2可提供无可比拟的灵活性——融合了高精度FP64和FP32，可实现精确高性能计算;也融合了更快速的低精度 FP16 和 INT8，可实现深度学习和机器学习。

NVIDIA HGX-2

　　黄仁勋宣布，多家领先的服务器制造商正在利用HGX-2生产具有更高性能的服务器设备。浪潮是中国首家构建HGX-2服务器的厂商，浪潮AI超级服务器 AGX-5专为解决当前AI深度学习和高性能计算的性能扩展难题而设计。同时，联想、华为、曙光也正在使用HGX-2制造高性能计算平台。除此之外，百度和腾讯也将借助 HGX-2为内部应用及云客户提供一系列更强大的AI及云计算服务。

　　NVIDIA HGX-2的目标是帮助HPC提升计算能力，加速AI与数据分析;而NVIDIA T4，则是专为大规模计算集群而生。

　　NVIDIA T4 GPU基于全新NVIDIA Turing架构，采用多精度Turing Tensor Core和全新RT Core，与加速的容器化软件堆栈相结合，可提供更高的性能。如我们所说，T4旨在满足大规模计算集群的需求，它具有小巧的外形，功率为70瓦特，单节点服务器设计可支持从单个 T4 GPU到20 个。通过T4，客户可同时获得高性能与灵活性，最大限度地提高计算集群的吞吐量、利用率和用户并发性。

NVIDIA T4 GPU

　　今天，NVIDIA公布了采用T4 GPU的中国客户，并表示T4已成为普及迅速最快的服务器GPU。中国首批开始使用T4扩展计算集群的公司包括百度云、腾讯云、京东云以及科大讯飞。中国领先的服务器制造商，包括浪潮、联想、华为、曙光、浪潮商用机器和新华三也将推出一系列基于T4的服务器。黄仁勋表示，目前有超过50款基于T4的服务器设计正在进行中。

　　除硬件外，软件堆栈对于加速计算也非常重要，借助快速的核函数、快速库、创新算法和优化的应用程序，可实现10到50倍的加速。黄仁勋在演讲中指出：“如今，NVIDIA已有600多种加速应用程序，我们的架构兼容策略使这些应用可适用于大型部署。加速堆栈是多层次的，并经过精心优化，NVIDIA已将许多受欢迎的加速应用容器化，并存储在NGC(NVIDIA GPU 云)注册表中。”

　　NVIDIA宣布，中国领先服务器制造商华为、浪潮、联想、曙光，已经推出了的全新NGC-Ready系统，让客户可以放心地在基于NVIDIA GPU的系统上部署加速软件，能够以一种具有可重复性、容器化的方式，在从开发到生产的整个过程中运行加速应用。

　　“新HPC市场，就是科学计算、数据科学和AI。”黄仁勋表示，“每个HPC应用程序都受到摩尔定律中介的限制，NVIDIA一直在为加速整个新HPC市场铺平道路并超越摩尔定律。借助V100、HGX-2、T4以及所有加速堆栈，NVIDIA启动了加速整个新HPC生态的过程。”

关注我们