服务器 频道

IBM或于10月推基于超级计算机的Power9

  【IT168 资讯】7月底,橡树岭国家实验室开始接收第一批服务器,这些服务器最终将扩展成为“Summit”超级计算机,这是人们期待已久的的“Titan”混合CPU-GPU系统,由“Cray”构建并于2012年秋季安装。因此,从技术上讲,IBM已经开始出货其基于Power9的Witherspoon系统。

  鉴于IBM正在将Summit节点发送到橡树岭,并且已经开始向劳伦斯利弗莫尔国家实验室发送类似(但不同的)节点,用于“Sierra”超级计算机,我们预计将有一些类似Power9服务器的公告。这样的声明目前还没有,有可能在9月下旬或10月的某个时候宣布。

  随着英特尔在7月份将“Skylake”Xeon SP处理器正式关闭, AMD将Epyc X86服务器处理器和配套的Radeon Instinct 加速器形成组合拳发布,英特尔恐怕是无法做到这一点的。因此,对于IBM的Power9系统来说,发布宜早不宜迟。毫无疑问,支持IBM自己的AIX Unix和IBM i(以前的OS / 400)专有操作系统/数据库平台的Power9系统将到2018年初才会到来,可能是3月或4月。但这并不意味着在年底之前,IBM无法推出Linux的Power9系统,其中最有可能瞄准利润丰厚的HPC和AI市场。

  Power9芯片有两种类型,一种是“Nimbus”Power9扩展处理器,具有一个,两个或四个插槽这三种,另一种是 “Cumulus” Power9扩展处理器,具有四个,八个或十六个插槽这三种。

  自从2016年中期以来,IBM已经表示,在2020年打开电源芯片路线图的时候,应该预计到今年下半年将有Power9系统出货,并且推测不仅仅是Summit和Sierra,对于其他希望通过NVLink互连去部署Power9 CPUs和英伟达的Tesla V100 GPU协处理器紧密耦合的组织,也希望得到美国能源部的资助 。Intel Xeon或AMD Epyc处理器无法实现紧密耦合,因为到目前为止,CPU上没有像Power9芯片一样的本地NVLink端口。

  IBM各式样的机器都是用Power8和Power8 +处理器,我们怀疑,Big Blue及其主板和系统合作伙伴,包括OpenPower联盟的众多成员,将会带来大量机器用Power9芯片。IBM无疑将在2018年期间推出一系列Power9机器,并可能从2017年底开始,但是确切的交付时间尚未公布。

  Minksy系统在开发时有“Garrison”的代号,之后被卖给HPC。它有两个Power8 +芯片,两个NVLink 1.0端口和四个“Pascal”特斯拉P100加速器。两个Pascal通过NVLink端口直接链接到每个Power8 +芯片,然后剩余的NVLink端口用于将系统中的GPU交叉连接在一起,以便它们可以以80 GB /秒的速率共享数据。这个设计就像OpenPower营地的其他Power8系统一样,把主内存放在一个转接卡和内存缓冲芯片上,就像IBM为自己的设计那样。

  传言说,在每个节点上都有两个Power9处理器和四个Volta加速器。但劳伦斯·利弗莫尔(Lawrence Livermore)对这台机器的精确速度一直保持沉默,但他说,Sierra将在大约120个petaflops的地方交付150个petaflops,其总内存约为2PB至2.4 PB。

  该内存容量不包括每个Volta协处理器上的16 GB HBM2内存。HBM2内存的带宽为900 GB /秒,就应用程序而言,这很重要。Power9处理器上的主存储器更像是GPU的L3高速缓存,一旦开启了一致性,Power9系统中的所有其他缓存(包括Centaur缓冲区芯片中的L4缓存)只是暂存 GPU,直到他们做了有关C语言或Fortran语言相关的工作。

  正如之前报道的,橡树岭的Summit超级计算机将会对两个Power9芯片与六个Volta GPU加速器进行配对。橡树岭说,它将从大约4,600个节点上建立峰会,比几年前的估计高出一点,每个节点将拥有512 GB的主内存和800 GB的闪存。2.24 PB主存储器,3.5 PB的闪存,以及集群中将近72 GB的HBM2内存,将与100 Gb /秒的EDR InfiniBand连接。这些额外的GPU将Summit机器的功率范围推至大约13兆瓦,并且应该在双精度的情况下交付约207千万亿次的峰值性能。橡树岭一直在计划每个节点每秒大约40个petaflops,但它看起来像是45个petaflops。

  如果不得不猜测,我们会说IBM将使用一致的命名约定,并将电力系统系列中的8替换为认知系统行中的9,因此该机器应称为HPC认知系统922LC。这将是IBM为其他客户正式推出的第一台机器,宜早不宜迟。它不能让英特尔和AMD垄断所有的处理器,它必须为Power9的推出奠定基础,这无疑将在2018年发生,包括针对其核心企业客户的服务器。

  我们预计,HPC的认知系统922LC将采用高核心数和低线程的芯片,并利用没有Centaur缓冲芯片的行业标准内存来降低成本。 Power9芯片设计有24个内核,它将取决于Globalfoundries的产量,使用其14纳米工艺,以查看Summit和Sierra节点以及销往其他节点的产品是否具有SMT4技术。

  我们怀疑未来认知系统系列的其他成员将使用Volta加速器的PCI-Express版本,并扩展其他类型的PCI-Express卡,甚至是NVM-Express存储,这在数据中心中将变得越来越重要。IBM在其服务器同行之间首先支持PCI-Express 4.0协议,他的带宽是PCI-Express 3.0的两倍,并在十六个通道适配器插槽上提供64 GB /秒的总带宽。如果IBM将要转售谷歌和Rackspace Hosting创建的“Zaius”主板,我们也很好奇,美国超微电脑股份有限公司(Supermicro)是否会推出去年支持Power 8芯片的 “Briggs”和“Stratton”系统相关的后续工作。

  Power7,Power7 +和Power8系统过去的部署不一定表明IBM将如何推出Power9系统。但是总的来说,IBM并不会同时启动所有的机器,也没有理由相信它会这样做。很大程度上将取决于IBM认为所需求的位置,以及Globalfoundries在Power9 Nimbus和Cumulus芯片上的收益。

  好消息是,IBM可以通过SMT4线程(每个核心四个线程)或12个内核与SMT8线程(每个核心8个线程)相匹配的方式来优化一个芯片,因此可以在线程数和内核数间保持平衡。SMT4针对Linux工作负载,而SMT8内核主要面向AIX和IBM i。它还可以根据需要在这两种不同类型的平台上以不同的带宽和容量在缓冲内存或无缓冲内存中进行拨号拨打缓冲或无缓冲的内存。

0
相关文章