服务器 频道

SC14报道之15:英特尔在hpc的4个狠角色

  【IT168 评论】在高性能计算领域,英特尔的系列产品家族中有4个重要的狠角色:计算、网络、存储、应用。

  一是计算:一方面有至强系列服务器多核处理器,以E5为代表,主要是跟IBM、AMD竞争,在TOP500中系统数量已经占据了86%的份额,这算垄断了吗?另一方面,在加速计算上有至强融核众核处理器(Xeon Phi),跟NVIDIA、AMD的GPU打,占TOP500总计算性能的17%,特别是跟NVIDIA GPU的战斗很激烈,正处于一种胶着的状态,NVIDIA起步早,英特尔追得快,打得难解难分。

  二是网络:英特尔之前收购了QLogic InfiniBand及CRAY公司的互连业务,之后开始全力发展自己的InfiniBand产品,开始直接与另一家Infiniband厂商Mellanox竞争。从SC14的现场来看,Mellanox的展台很大,重点推的也是100G的下一代InfiniBand产品。

  三是存储:英特尔除了推出SSD闪存硬件产品之外,还开始切入存储文件系统,这两年发力较多的就是开源分布式并行文件系统Lustre的企业版。这块市场的参与者众多,如IBM、CRAY、ORACLE、微软、SGI、Veritas、红帽、曙光等等,都有点自己的东西,相比硬件更容易形成差异化竞争优势。而且,文件系统跟上层应用结合更紧密,而HPC的应用又很具多样性,这跟基础架构层面的芯片市场完全不是一回事,很难标准化、规模化运作,英特尔具体能做到什么程度,还有待观察。

  四是应用:除了传统的一系列性能调优工具,英特尔也在全球拓展应用合作伙伴,拓展自身对于最终用户的影响力。

  下面,我们来盘点一下英特尔在SC14全球超级计算大会上,上述几个方面的表现:

英特尔在高性能计算领域的4个狠角色

  至强:新产品没太多好说的,至强E5 V3在今年的Q3刚刚发布。不过,据了解,英特尔将在下一代至强服务器芯片中,集成其最新的Omni-Path互连网络控制器,以取代掉传统的PCIe卡控制器,这无疑将对系统提高密度、降低成本、减少网络延迟都有很大的好处。目前来说,我想英特尔最想让大家知道的是这个:根据最新的第44版TOP500榜单,基于英特尔处理器的超级计算机数量比例达到了86%,而且在新上榜的系统中,更是高达97%,英特尔在高性能计算领域的优势已经到了无以复加的地步。

  融核:英特尔此次公布了其下一代至强融核(Xeon Phi)协处理器的计划,代号Knights Hill,作为第三代至强融核产品,将采用10纳米制造工艺,并也会集成最新的Omni-Path互连的网络控制器。第二代融核产品是Knights Landing,有望明年发货,预计有超过50家厂商会提供基于该芯片的系统级产品,同时也有更多的厂商在其系统中使用PCIe卡形式的融核协处理器来加速。目前,已经有用户在使用第二代的Knights Landing来构建100PFLOPS(即十亿亿次每秒)计算规模的超级计算机。据了解,使用Knights Landing的超级计算机有:Los Alamos和Sandia国家实验室联合开发的Trinity,美国能源部国家能源研究科学计算中心的Cori。另外,一家名为DownUnder GeoSolutions的地理科学公司最近也宣布将使用至强融核来构建最大的商业集群系统,国家超算中心IT4创新项目则计划构建一套新的超级计算机,这将是欧洲最大的一套使用融核协处理器的集群系统。按TOP500的总性能来看,在过去两年时间里,基于至强融核协处理器的系统性能占到了17%。

英特尔在高性能计算领域的4个狠角色

  在英特尔的展台,DownUnder GeoSolutions公司,其在澳洲的地位类似于中国的BGP,演示了地震资料处理系统和3D可视化结果。据了解,这套系统几乎使用了全部的最新的英特尔技术——计算层面的Xeon Phi、网络层面的Omni-Path互连技术,以及存储层面的SSD和Lustre企业版。

英特尔在高性能计算领域的4个狠角色

  网络:英特尔公布了下一代Omni-Path互连技术的细节,其最直接的竞争对手是Mellanox的Infiniband,尤其在高性能计算领域。从这次发布的信息来看,跟现有的Infiniband产品相比,英特尔宣称Omni-Path的优势体现在几个方面:1)100Gbps速度,延迟最大可低56%;2)使用48口交换芯片,比Infiniband的36口密度更高,扩展性更好;3)每个交换芯片可以多连接33%的节点,从而可以减少交换机的数量,简化系统设计,降低IT基础设施成本等。在网络方面,我们看到英特尔的策略是,一方面发展更侧重于企业数据中心的万兆以太网技术,一方面发展更侧重于高性能计算领域的新一代Infiniband互连技术,两头发力。

  存储:英特尔发布了Lustre企业版V2.2和标准版,目前戴尔、DDN、Dot Hill等公司已经在各自的产品中集成了Lustre。其实,对于英特尔来说,并不指望靠Lustre企业版这个软件本身来挣钱,但用户有需要,而且存储系统容易变成整个高性能计算系统中的瓶颈。

  应用:英特尔并行计算中心的规模扩大了,现在13个国家有40多个中心,这些中心基本是同当地的大学、科研院所来合作构建的,通过协同工作来优化HPC领域最流行的70多种开源代码。实际上,有很多HPC开源代码已经很老化了,甚至是二、三十年前的东西,很难发挥今天底层硬件(如至强E5 V3已经是18核36线程,至强融核则有61核244线程)的资源,所以,英特尔跟这些单位合作,来帮助实现代码的并行化、向量化,以充分利用好最新的硬件资源。

  总之,英特尔在高性能计算领域的积累和优势越来越强悍,各块的布局日渐清晰:计算层面稳住至强优势,同时扩大融核协处理器的战果;网络层面,万兆以太网和Infiniband同步发展,各应用户所需;存储层面,一方面大力发展SSD,支持闪存存储方案,另一方面完善Lustre并行文件系统企业版,从软硬两方面来解决今天“计算跑得太快,网络、存储跟不上”的矛盾;应用层面,则是发展其Parallel Studio系列的并行化软件工具,并通过建立遍及全球的并行计算中心来帮助用户优化应用。

  这一系列的做法,使得SC14在一定程度上变成了半个IDF(英特尔开发者大会)——因为有几十家参展商都跟英特尔在硬件或软件层面有合作,英特尔还在现场搞了带队参观合作伙伴展区的活动,一拔接一拔的参会者在英特尔讲解员的带领下,参观了HP、美国能源部、DDN、澳太尔、戴尔、CRAY等等,英特尔HPC生态系统的感觉非常明显。

  跟另一种同样野心勃勃的公司nVidia相比,nVidia已经不满足于GPU只是充当高性能计算机加速器的配角,而是希望朝全面计算平台的方向发展,即将GPU变成计算的中心,而不是CPU,为此,nVidia推出了NVlink互连技术,并在编译器、应用程序库上发力;比较之下,英特尔的野心则在于不满足于现有计算平台的角色,而是朝整个数据中心平台发展,计算、网络、存储、应用,一个都不少。

6
相关文章