【IT168 资讯】NVIDIA今天宣布,该公司计划将名为NVIDIA NVLink的高速互连技术集成到其未来的GPU中,让GPU与CPU之间共享数据的速度能够比当今速度快5-12倍。这将消除长期以来的瓶颈,有助于铺平新一代百亿亿次级(Exascale)超级计算机的道路,这种超级计算机比当今最强大的系统还要快50-100倍。
NVIDIA将把NVLink技术添加到其Pascal GPU架构当中,该架构将承接今年全新的NVIDIA Maxwell计算架构,预计将于2016年推出。这一全新的互联技术是与IBM合作开发的,IBM正在将该技术融入到其未来版本的POWER CPU当中。
NVIDIAGPU工程高级副总裁BrianKelleher表示:“NVLink技术通过大幅提升CPU与GPU之间的数据传输速度,最大限度缩短了GPU等待数据处理的时间,从而释放了GPU的全部潜能。”
IBM副总裁兼IBM院士BradleyMcCredie表示:“NVLink让CPU与GPU之间能够快速交换数据,从而提升了整个计算系统的数据吞吐量,克服了当今加速计算的一大瓶颈。NVLink让开发者能够更轻松地修改高性能与数据分析应用,以便充分利用加速的CPU-GPU系统。我们认为,该技术标志着我们对OpenPOWER生态系统又做出了一大贡献。”
由于NVLink技术能够将IBM POWER CPU与NVIDIA Tesla GPU紧密结合,POWER数据中心生态系统将能够在各种各样的应用程序上充分利用GPU加速,例如高性能计算、数据分析以及机器学习等应用。
与PCIExpress3.0相比之下的优势
当今的GPU通过PCIExpress(PCIe)接口连接至x86 CPU。PCIe限制了GPU存取CPU系统内存的能力,比一般的CPU内存系统慢4-5倍。IBM POWER CPU的带宽高于x86 CPU,因此在GPU与IBM POWER CPU之间,PCIe成为了更加显著的瓶颈。由于NVLink接口可与一般CPU内存系统的带宽相匹配,因而让GPU能够以全带宽的速度存取CPU内存。
这一高带宽互联技术将大幅提高加速软件应用的性能。GPU的显存速度快但容量小,CPU内存速度慢但容量大。因为内存系统的差异,加速的计算应用一般先把数据从网络或磁盘移至CPU内存,然后再把数据复制到GPU显存,数据才可以被GPU处理。凭借NVLink,数据在CPU内存与GPU显存之间的移动速度得到了大幅提升,从而让GPU加速的应用能够大幅提升运行速度。
统一内存特性
更快的数据移动加上名为统一内存的另一大特性,将简化GPU加速器的编程。统一内存让程序员能够将CPU内存和GPU显存视为一个内存块。程序员可以操作数据,无需担心数据存在于CPU内存还是GPU显存当中。
虽然将来的NVIDIA GPU会继续支持PCIe,但是NVLink技术将被用于连接GPU与支持NVLink技术的CPU,另外还将用于在多颗GPU之间直接提供高带宽连接。此外,尽管拥有极高的带宽,NVLink却在每比特数据的传输上比PCIe节能得多。
NVIDIA现已设计了一个模块来容纳Pascal架构的GPU与NVLink。这一全新的GPU模块仅为当今标准PCIe显卡尺寸的三分之一。Pascal模块底部的接口使其能够插入到主板当中,从而改善了系统设计、提升了信号完整性。
NVLink高速互连技术将成就紧密结合的系统,这类系统为人们呈现了一条通往超节能可扩展百亿亿次级超级计算机的道路。百亿亿次级超级计算机的运行速度为1,000Petaflops(每秒1x1018次浮点运算),比当今最快的系统还要快50-100倍。