登录 / 注册
IT168服务器频道
IT168首页 > 服务器 > 服务器评论 > 正文

盘点2016年高性能计算的那些事儿

2016-12-28 13:47    it168网站原创  作者: 陈毅东译 编辑: 陈毅东

  【IT168评论】时值岁末,TOP500回顾了2016年在高性能计算领域的最显著变化趋势,从机器学习到E级超算,有很多话题值得关注。

盘点2016年高性能计算的那些事

  一、无处不在的机器学习

  如果非要选择一个2016年影响HPC的最重要趋势,非机器学习莫属。机器学习应用已经被证明其运算需求不亚于任何传统的超算应用。作为人工智能的范畴,机器学习正在推动互联网搜索、图像识别、语言翻译、推荐引擎和自动驾驶技术等应用上。同时机器学习也被列入到传统HPC的工作流程和工程科学研究中。

  因此机器学习也已经引起了许多IT供应商和用户的目光,决定是否从现在开始重写如芯片、系统和软件开发的规则,并推出针对机器学习的解决方案。NVIDIA在2016年成为了机器学习的最大受益者之一,因为研发较早,为大型企业和汽车供应商开发基于GPU的机器学习解决方案,公司的股票在2016年增长了2倍,被业界广泛认可。

  IBM和英特尔也正在努力成为智能机器竞争的领跑者,IBM拥有Watson平台,倡导认知计算,英特尔也提出了全新的AI战略;同时,谷歌、亚马逊、微软等软件巨头也加大了构建软件生态系统的力度,如工具和应用程序,这无疑给机器学习基础设施提出了更高的要求;在可预见的未来,机器学习的发展将更加良性。

  二、英特尔面临的激烈竞争

  虽然2016年NVIDIA在的机器学习领域大获成功,但英特尔依然主宰高性能计算领域,因为超过90%的HPC系统配置了英特尔处理器,甚至包括了使用NVIDIA GPU加速的机器。尽管多年来,包括AMD、OpenPOWER供应商和ARM处理器的供应商努力攫取更大的市场份额,但迄今为止还无法撼动英特尔在高性能计算领域的统治。

  虽然冲击英特尔的结果不理想,但竞争还在继续。AMD试图通过即将推出的32核心的ZEN“Naples”处理器,重返服务器市场的竞争中,该处理器预计在2017年第二季度发货。这是AMD从2011年推出Bulldozer架构后,再次发力服务器市场所做的努力。由于许多数据中心客户渴望替代英特尔的方案,那么ZEN也许会扭转AMD在服务器市场的局势。

  在过去几年中,IBM所倡导的OpenPOWER计划希望借开放Power架构让自己更加主动。在2014年,OpenPOWER获得美国能源部大单,价值3.25亿美元合同,为劳伦斯·利弗莫尔国家实验室和橡树岭国家实验室开发和部署全世界最先进的基于IBM Power9的超级计算机系统。从那之后,虽然IBM称在Power在HPC领域有所斩获,但其他OpenPOWER供应商却逐渐远离了这一领域。

  三、ARM欠HPC一个承诺

  ARM服务器本应该在2016年进入数据中心(HPC、企业和云),但却并不顺利。经过半年的硬件开发和生态系统构建后,基于ARM的服务器目前仅仅在几个HPC设施的研究项目中,而在主流数据中心中只是昙花一现。来自Cavium或AppliedMicro的ARM处理器解决方案还没有火,后者已经与MACOM达成收购协议,而且MACOM表示将剥离AppliedMicro的计算业务。

  在2016年最值得瞩目的ARM服务器供应商非高通莫属,高通的市值超过1000亿美元,体量庞大。高通近日发布了48核心的Centriq 2400服务器SoC,并计划在2017下半年发货,未来高通可能会成为英特尔在数据中心市场最有力的竞争对手。

  同时,ARM专为高性能计算和数据中心而设计的ARMv8-A可伸缩矢量扩展(SVE),已经由富士通签下授权,并将应用于Post-K exascale系统中;但短期内ARMv8-A限于市场规模其前景还不明朗。

  四、加速器和manycore处理器的进步

  2016年,英特尔的Knights Landing Xeon Phi和NVIDIA的P100 Tesla GPU推出了一系列的多核协同处理器,都比上一代处理器速度提升了两倍。虽然二者都是为了加速浮点密集型应用而进行的多核设计,但它们的加速模型路径已经发生了改变,Xeon Phi可以作为独立CPU运行,而P100 Tesla GPU仍需要连接CPU;每种方式都要考虑在性能与易用性之间的权衡,但最终选择权还在客户手中。

  多核协处理器趋势已经十分明朗,就是其可以获得比多核CPU更好的功率和性能。许多的高速超级计算机,以及最节能的超级计算机,依靠加速器来提供大多数的flops。而它们没有得到广泛应用的的主要原因是可编程性的改善;如果说英特尔相比NVIDIA的优势在哪里?那就是Xeon Phi与Xeon在使用相同的开发工具和软件组件上,没有本质区别。

  FPGA在2016年发展迅速,主要受到两个事件的影响。英特尔收购Altera,以及微软在Azure云中广泛部署FPGA。英特尔预计,到2020年30%的数据中心服务器将配置FPGA,执行机器学习、加解密,数据压缩,网络加速和科学计算等任务。微软正在尝试将它变为现实,在Azure引入FPGA以实现百万亿浮点运算(exaflop)能力来支持人工智能服务。未来10年FPGA的发展,也许2016年是重要的分水岭。

  五、E级超算 向前一步向后一步

  美国政府正在大力酝酿新一代的超级计算计划,美国能源部的E级超算项目重新调整其时间表,预计2021年完成首个系统的基础工作,比原计划提前了至少1年,以获得E级超算竞赛的主动权。而中国希望在2020年之前完成第一台E级超算机器的运行,而法国的CEA也将在同年完成E级超算的部署。

  于此同时,日本的E级超算计划却推迟了1-2年。富士通原计划在2019年向RIKEN提供Post-K exascale系统,并于2020年投入生产。据推测,延迟的原因是半导体设计问题,这可能与实施新的ARMv8-A SVE处理器设计有关。

  高性能计算在不断的卡位竞争下推动向前,可能没有人会特别关心谁先逾越E级超算的里程碑。随着机器学习的大力发展,单纯的角力超算性能高低的热度会逐渐降低。不论怎样,高性能计算都是技术和应用不断取得进步的试金石。

  • IT168企业级IT168企业级
  • IT168文库IT168文库

扫码送文库金币

实时热点
编辑推荐
系统架构师大会
系统架构师大会
点击或扫描关注
IT168企业级微信关注送礼
IT168企业级微信关注送礼
扫描关注
首页 评论 返回顶部