服务器 频道

4U空间搭载20颗GPU的服务器 就问你怕不怕

  【IT168 评论】GTC China 2017(GPU技术大会)余温尚在,整个大会——包括黄教主的演讲——都在向我们传达一个信息:AI时代,没GPU不行。这个说法可能有点儿夸张,但其实相差无几。GPU所提供的加速计算能力极大地推动了AI的发展,这点是毋庸置疑的。不信的朋友可以去看看NVIDIA的股票走势,一切就都明了了。

  紧扣时代脉搏的各大科技企业,包括NVIDIA在AI方面都做了不少的努力,从硬件到软件,再到应用层。其中,处于最底层的、支撑着AI计算的服务器,无疑是最不可或缺的角色之一。

  随着GPU在AI计算中重要作用的逐渐体现,各大服务器厂商也纷纷推出了专为AI计算而设计的搭载GPU的服务器。而今天我们要介绍的,是来自连续八年稳居中国市场份额第一的“HPC大佬”曙光的新一代高密度深度学习服务器——SuperBox。

  不为别的,只因为这款服务器能够搭载多达20个GPU,而且是在4U空间内,可以说是“为了性能,连命都不要了!”

搭载20颗GPU的4U服务器 就问你怕不怕

  关于我们最关注的性能

  严格来说,SuperBox在4U空间中内置有20个PCI-E接口,可搭载GPU、FPGA、MIC等多种处理单元。如此密度,称得上是当前全球最高了。在搭载20片最新NVIDIA P100 GPU时,单机运算能力可达到184 TFLOPS,是当前世界上单机运算能力最强的服务器。同时SuperBox完美支持NVIDIA下一代Volta架构的GPU处理器,对于高端深度学习用户而言,这款产品绝对值得列入备选清单。

  配备这么多加速器,若没有高效的通信架构,也都只能是鸡肋。SuperBOX采用PCI-E Switching Fabric架构,机内全部加速器可以实现P2P通信,提供960Gbp/s的通信速率,高效完成并行运算不是问题。

搭载20颗GPU的4U服务器 就问你怕不怕
▲SuperBox所采用的PCI-E Switching Fabric架构示意图

  灵活性与可靠性必不可少

  不同用户的需求是不同的,甚至同一用户的需求也可能发生变化。因此,产品的灵活性也至关重要。SuperBox机内的PCI-E端口不仅可搭载一些主流深度学习加速器,还可以适配IB、Raid等功能元件。此外,该产品也支持USB、VGA、GBE等多种端口,用户完全可以根据自身需求进行配置,实现多样化搭配。

  为保障业务稳定运行,SuperBox关键部件均实现模块化、冗余化、热插拔化,大幅度提高系统整体可靠性。在运维方面,通过搭配曙光clussoft环境部署工具包,无论单机或者集群环境都可提供简易部署、高效可控的管理体验,进一步降低运维成本。

搭载20颗GPU的4U服务器 就问你怕不怕
▲曙光SuperBox

  曙光SuperBox所具备的超高密度和所能提供的超强运算能力是非常亮眼的,想必其价值也将集中体现在如智慧城市等高端深度学习应用领域,但绝不限于这些领域。随着AI的发展,优秀算法、模型等的不断涌现,对计算力的需求也将随之迅速提升。作为HPC大厂,曙光对计算力的追求是迫切的。SuperBox会是其产品线上的一颗明珠,但在这之后,也必定会有更优秀的产品出现,我们拭目以待。

1
相关文章