服务器 频道

AMAX升级HPC解决方案

  AMAX® 创立于1979年,是数据中心、高性能计算以及服务器OEM解决方案业界标杆。总部位于加州硅谷,与全球IT行业顶尖企业为伍。随着IT技术的不断推陈出新,AMAX® 与时俱进,同步引入非常先进的技术和产品,融入到自身的解决方案中。

  英特尔® 是AMAX最为密切的合作伙伴之一,也是全球最大的个人计算机零件和CPU制造商,主营面向数据中心的全系列领先产品解决方案。Omni-Path Architecture (OPA) 是英特尔® 在True Scale架构和标准InfiniBand的经验及教训上,针对HPC开发的一种高性能网络架构,它能使每条链路的速度达到100 Gbps,是一项专为优化高性能计算的全新互联技术,也是一款端到端的互联解决方案。它可以更广泛的使用户享受到HPC集群的性能优势。

  OPA在链路层上进行了3项革新:首先是数据流控制优化,其次是数据包的保护机制,第三是链路失效保护。这些创新都使得网络方面可以拥有更低的延迟和更高的数据完整性。

  OPA架构避免了PCI总线的以下缺陷:

  1、由于采用了基于总线的共享传输模式,在PCI总线上不可能同时传送两组以上的数据,当一个PCI设备占用总线时,其他设备只能等待;

  2、随着总线频率从33MHz提高到66MHz,甚至133MHz(PCI-X),信号线之间的相互干扰变得越来越严重,在一块主板上布设多条总线的难度也就越来越大;

  3、由于PCI设备采用了内存映射I/O地址的方式建立与内存的联系,在热添加PCI设备时,需在内存中为每一个PCI设备划出一块50M~100M的区域,这段空间用户无法使用。因此主板上支持的热插拔PCI接口越多,用户损失的内存就越多;

  4、PCI的总线传输不具备纠错的功能,如果在传输的过程中发生了数据丢失或损坏的情况,控制器只能中断操作系统,OPA内置纠错码(ECC),提高了链路层次上的可靠性。;

  与Infiniband相比,OPA具有多个优势和创新,具体包括:

  ① OPA边缘交换机芯片支持多达48个接口,相比于Infiniband最多只支持36接口的交换机芯片,如果用户需要37-48接口的交换机时,必须购置2台36端口交换机,造成资源浪费。48端口OPA交换机则可直接连接使用,同时节约空间和成本。

  ② OPA优化了数据流的控制,除了基于VL&SL(虚拟链路和服务级别)消息包发送机制外,OPA还采用固定长度的Flits和LTP(链路传输包)封装数据包,提供更细颗粒度的消息包传递控制。数据包传递时,高优先级数据优先传递,低优先级数据等待传递。

  ③ OPA有着更加高效的链路层错误修复功能,在不增加额外延迟的情况下,快速透明地修复传输错误的链接。修复时只需重传携带error的LTPs (仅1056 bits ) ,而不是整个数据包。而且重传只发生在主机到交换机或交换机之间,无需重传整个链路, 极大减少了延迟。

  ④ OPA在4x链路上,有1条或多条链路失效时,将保存重启或返回前一个检测点,继续保持其余链路可用性,不影响应用任务继续运行。而Infiniband在1条或多条链路失效时,则只能保持1条链路可用,传输速度将降至25Gbps。

  OPA主要硬件产品包括:

  ① 英特尔® Omni-Path Host Fabric 接口适配器:英特尔® Omni-Path HFI是专为高性能计算 (HPC) 而设计,采用先进的无连接设计,提供可扩展更高节点和更多内核数量的性能,端口支持100 Gbps。是最苛刻应用的理想选择。

  ② 英特尔® Omni-Path边缘交换机产品:英特尔® Omni-Path边缘交换机包含两种型号,针对适用于小型群集的入门级24端口交换机和48端口交换机,支持所有端口达到100 Gb/s。而更大型的交换机除了能够在1U内支持48端口架构外,还可以与其他边缘交换机和导向器相结合,以构建更大型的多层结构。

  ③ 英特尔® Omni-Path导向器级交换机:采用英特尔® 新一代48基数交换机芯片,可为小型和大型架构提供非常好的性能。采用紧凑外形设计,支持高达768 100 Gb/秒的端口。

  ④ 英特尔® Omni-Path电缆模块:采用无源铜质电缆或有源光缆设计,让您能够创建一个与英特尔® OPA高性能架构相连接的群集。

  ⑤ 至强® -F处理器:英特尔® 于17年发布了全新至强®可扩展处理器,该系列处理器采用全新架构,单颗处理器最多集成28个核心56线程,采用14nm光刻工艺,针脚数为3467,比上代增加了70%多的针脚数。因此相比上代,至强®可扩展处理器在充足的空间内集成更多的芯片,最典型的就是集成了OPA 100Gb高速网络芯片及Host Fabric接口,使用户不再需要配备独立的OP HFI,简化了HPC集群的部署,优化了性能。尤其适合高性能计算、深度学习和人工智能等应用场景。

  当用户采用带Host Fabric接口的至强® -F处理器时,可直接使用Omni-Path电缆,将HPC与Omni-Path交换机相连,组成OPA网络。或者,用户使用普通CPU,通过配备Omni-Path HFI和Omni-Path电缆,将HPC与Omni-Path交换机相连,同样能体验OPA的强大性能。

  AMAX荣幸获邀,针对OPA架构进行了测试。测试结果表明OPA架构在MPI消息率和带宽上有相对优势,推荐在计算节点之间使用,以最大化发挥OPA的优势。

  MPI Bandwidth Test

  MPI Bi-Directional Bandwidth Test

  MPI Latency Test

  Size(KB)

  Bandwidth (MB/s)

  Size(KB)

  Bi-Bandwidth (MB/s)

  Size(KB)

  Latency (us)

  128

  322.05

  128

  375.12

  512

  1.39

  256

  626.73

  256

  728.90

  1024

  1.59

  512

  1190.56

  512

  1385.65

  2048

  1.99

  1024

  2086.96

  1024

  2559.74

  4096

  2.75

  2048

  2961.83

  2048

  3882.94

  8192

  4.44

  4096

  3773.92

  4096

  5199.59

  16384

  6.02

  8192

  4406.86

  8192

  6460.52

  32768

  9.62

  16384

  5859.94

  16384

  10388.18

  65536

  20.58

  32768

  6483.62

  32768

  11280.91

  131072

  32.14

  65536

  6581.65

  65536

  11726.83

  262144

  50.94

  131072

  6684.24

  131072

  12662.08

  524288

  88.67

  262144

  6740.12

  262144

  12900.75

  1048576

  167.95

  524288

  6762.95

  524288

  13281.76

  2097152

  323.07

  1048576

  6768.91

  1048576

  13410.52

  4194304

  634.94

  注: 随着更多测试的开展,性能指标评测结果可能会进行修改。结果取决于测试中使用的特定平台配置和工作负载,可能不适用于任何特定用户的组件、计算机系统或工作负载。结果不一定代表其他性能指标评测,其他性能指标评测结果可能或多或少地受到抑制的影响。

  上半年引入英特尔® OPA技术后,AMAX立刻将其搭配应用于多款主流机型,例如应用于高性能计算及深度学习的ServMax™ PSC-HC1X,其采用双路英特尔® 至强® Scalable系列处理器,搭载16条DDR4 DIMM内存插槽,可搭配四片GPU卡,支持8块3.5”热插拔硬盘,机塔互转式机箱使其能用于绝大多数场景。该机型可适用于数据分析、卫星成像和计算金融学等方面的应用。

  在专业深度学习、人工智能领域的GMax-1V和ServMax™ XP-48201G机型同样与英特尔® OPA有着不错的结合。XP-48201G采用双路英特尔® 至强®Scalable系列处理器,搭载24条DDR4 DIMM内存插槽,可搭配八片GPU卡,支持24块2.5”和6块3.5”热插拔硬盘。

  ServMax™ GMax-1V采用双路英特尔® 至强®Scalable系列处理器,搭载24条DDR4 DIMM内存插槽,可搭配八片SXM2 GPU,支持16块2.5”热插拔硬盘。

  在高性能计算机领域,目前互联芯片和硬件的成本越来越高,OPA的推出能有效降低互联网络的成本同时提升性能,使用户能将更多的预算投入于提升CPU、加速器等其他HPC部件。目前包括AMAX在内的很多厂商已经开始部署使用OPA产品。在HPC领域,AMAX与英特尔® 展开纵深合作,让AMAX可以为HPC用户提供更为专业和高效的咨询、设计、技术和产品服务,也能更迅速地分享英特尔® 的技术和资源。对于HPC需求用户而言,无疑是带来了巨大的便利和优惠。

  2018年初,AMAX 就已加入英特尔®数据中心构建者计划,成为多项业务的合作伙伴。构建者计划旨在加速生态系统的优化,以英特尔®成熟的数据中心技术,战略支持更多本地注:

  云技术和解决方案提供商崛起、成长和壮大。现在,AMAX将携升级后的解决方案与众多合作伙伴一起,继续加强交流与合作,共同推动创新,为激发中国数据中心市场的新一轮的发展和应用高潮共同努力。

  在性能检测过程中涉及的软件及其性能只有在英特尔微处理器的架构下方能得到优化。诸如 SYSmark 和 MobileMark 等测试均系基于特定计算机系统、硬件、软件、操作系统及功能,上述任何要素的变动都有可能导致测试结果的变化。请参考其他信息及性能测试(包括结合其他产品使用时的运行性能)以对目标产品进行全面评估。

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。
0
相关文章