服务器 频道

从“芯”出发 英特尔以全能实力提供澎湃智能动力

  近年来,数字化技术的崛起,正在重塑产业格局,引领创新趋势,加速数字经济蓬勃发展。2020年春,万众一心共同抗“疫”的过程,更进一步凸显了产业数字化转型升级的必要性和紧迫性。

  作为智能互联世界的中坚力量,英特尔坚持以数据为中心,跨越产业链供需两端,持续为行业用户提供领先而全面的产品组合与解决方案,为行业数字化转型打造坚实基石、提供强劲动力。与此同时,英特尔通过持续构建开放、融合、赋能的生态体系,与产业链上下游合作伙伴实现共享共赢,制胜智能变革。

  今天,“芯”存高远 智者更强——英特尔数据创新峰会暨新品发布会在线上召开。本次发布会,英特尔发布了一系列以数据为中心的全新产品组合,并携手一众行业用户和合作伙伴共同展示其最新产品、技术在诸多行业中丰富的实践应用案例,共享顶尖企业用户的成功转型经验。

  英特尔三大核心构筑AI基石

  英特尔的AI和分析产品组合主要围绕3大核心来构建:硬件,软件和生态系统。

  在硬件方面,几年来,英特尔一直在训练和推理中将AI加速功能引入至强,确保至强是运行AI的最佳CPU。英特尔认为,没有一种方法能够满足所有类型的AI要求和用例。

  英特尔拥有独特的优势,可提供在CPU,GPU,FPGA和专用加速器插槽中部署的标量,矢量,空间和矩阵架构的各种组合,使客户能够在需要的时间和地点使用最合适的计算类型。但是,拥有单一的产品是不够的,英特尔还认识到有必要将这些产品集成到一个通用平台中,从而使它们不只是其各个部分的总和,包括处理,内存,I/O,封装,内部和外部 IP,互连,安全性等。

  在软件方面,英特尔对客户常用的软件不断进行优化,包括流行的开源框架、定制拓扑结构等等,通过应用程序工程和支持开源社区,使AI开发人员能够在Intel平台上进行编程。英特尔正在通过oneAPI建立一个统一的编程模型,为开发人员提供统一的体验,同时使英特尔产品组合当中的所有AI产品的性能得以最大化。

  在生态系统方面,从公有云提供商到OEM平台以及英特尔的AI Builders社区(SI,ISV等),已经使用Intel AI技术建立了蓬勃发展的合作伙伴生态系统。同时,英特尔已经实现了在解决方案级别上交付,通过生态系统驱动的解决方案,客户用例POC和英特尔精选解决方案产品,使AI易于采用和部署。

  今天,英特尔推出了一系列新产品,作为面向AI和分析芯片&软件基础的一部分:

  在处理数据的部分

  英特尔一直致力于为至强处理器注入AI训练和AI推理功能。从第一代英特尔至强可扩展处理器开始,英特尔就加入了AVX-512,并优化了FP32。在2019年英特尔继续进行了相关改进,在第二代至强可扩展中引入了英特尔深度学习加速技术,从而显着提高了基于INT8推理的性能。随着第二代至强可扩展产品的推出,英特尔将至强拓扑优化的数量从24个增加到44个。

  bfloat16是一种紧凑的数字格式,可以提高处理速度,同时达到相似的模型精度。第三代英特尔至强可扩展处理器是业界首款具有内置bfloat16支持的主流服务器处理器,增强了我们现有的深度学习优化能力。硬件加速极大地受益于优化的软件。英特尔工程师已经使用支持bfloat16的AI框架和工具为AI生态系统做好了准备。

  诸多客户已经体验到了英特尔深度学习加速技术的优势。包括阿里云、蚂蚁金服集团、海鑫科金、东软、腾讯云等公司。能印证英特尔的价值的最好方式就是看到有越来越多的客户如今将他们的AI应用部署在英特尔至强平台之上。

  在今天Cooper Lake的发布之外,英特尔也将针对至强可扩展产品路线图给大家做一个快速更新。Ice Lake在今年晚些时候的发布计划中,同时,英特尔2021年代号为Sapphire rapids的至强可扩展处理器已经启动。它将包含一项全新的称为Advanced Matrix Extensions或AMX的AI功能。

  在数据存储的部分

  所有工作负载的一大共同点是需要数据,但是当今的内存/存储层次结构存在鸿沟,需要在容量,速度,成本和持久性之间进行取舍。在存储金字塔顶部,成本很高,容量很小;在底部,容量实际上是无限的,但是访问数据的速度很慢。

  英特尔一直在进行系统性地投资,以通过弥合内存和存储层级间的鸿沟来消除这些不得已的取舍。英特尔3D NAND技术在浮栅结构上进行设计,通过采用更小的单元尺寸和高效的存储阵列,实现更高容量的解决方案,具有高可靠性,对于电荷损失具有高保护性。

  英特尔傲腾技术是建立在独特架构上的全新技术,它实现了在密集、无晶体管、可堆栈式设计中对每个内存单元进行独立编址。这一创新在内存与存储金字塔中建立了新的层级,可提供多种外形规格的持久内存、非易失性内存以及持久存储。

  英特尔傲腾SSD通过快速缓存和存储加速应用程序,提升了每个服务器的规模,并减少延迟敏感工作负载的交易成本。与DRAM不同,英特尔傲腾持久内存技术可提供高性能智能,以更低的成本提供比DRAM高的容量,并且即使断电也可以保留其数据。

  傲腾持久内存自去年交付以来,发展势头十分强劲。据了解,已经有超过270项生产交易达成,英特尔的POC到销售的转化率超过85%,《财富》 500强公司中有200多个进行了傲腾持久内存的POC或部署。

  第三代至强可扩展处理器引入了英特尔傲腾持久内存200系列,可在四路系统中提供多达18TB的内存数据,非常适合应对最大的数据分析挑战。在意外断电的情况下,傲腾持久内存200系列提供的CPU对持久性数据的访问速度比主流NAND SSD读取数据快225倍以上。与DRAM不同,在计划或计划外重新启动后,数据不必重新加载到内存中。

  高性能的英特尔傲腾固态盘和高容量的英特尔3D NAND固态盘,支持人工智能和分析的密集IO需求。英特尔SSD D7-P5500和P5600固态盘建立在英特尔浮栅结构的3D NAND技术,实现了业内领先的96层TLC的面密度,在该面密度下具有领先的写入性能以及领先的数据保留能力。与上一代NVMe NAND相比,这些驱动器具有全新的PCIe控制器,固件,并且可部署第3代和第4代PCIe,可将延迟降低40%,并将性能提高33%。

  英特尔D7-P5500和P5600 SSD是英特尔3D NAND PCIe系列的扩展,已被所有主流OEM所采用。

  履行英特尔使AI和分析更易于采用和部署的战略,今天,英特尔与13个合作伙伴宣布了针对AI和分析的3个新的和4个经过修订的精选解决方案,为支持对远程工作和学习的需求,英特尔还宣布与VMware扩大合作伙伴关系,并在vSAN上提供适用于VMware Horizon VDI的新的精选解决方案,该解决方案可以以更低的单台成本支持多达87%的远程桌面。

  在软件&解决方案的部分

  英特尔oneAPI跨架构工具生态系统使开发人员能够为AI,HPC和其他计算密集型应用程序提供毫不妥协的性能和高效的开发。英特尔在oneAPI上的努力已经取得重大进展。

  英特尔OpenVINO发行版工具包是用于开发AI应用程序的软件工具集,其重点是加快对诸如计算机视觉,音频,语音等用例的推理。英特尔最近推出了该工具包的新的长期支持(LTS)版本,它提供了一致、稳定的版本,仅针对关键错误修复(为期一年)和安全补丁(为期两年)进行了更新。这对于哪些对代码稳定性有着极高要求的物联网客户而言尤其重要。

  不仅如此,英特尔还宣布了针对AI和Analytics的3个新精选解决方案和4个经过修订的精选解决方案。

  在FPGA的部分

  FPGA具有独特的定位,可以为快速创新的客户提供高性能的自定义工作负载。为了使这些创新者能够提供智能服务,英特尔开发了一种方法,使开发人员能够在我们包括FPGA在内的各种产品组合中快速部署AI解决方案。英特尔的芯片和软件产品组合(包括FPGA)可为客户提供从云到边缘的智能服务。

  为了使这些创新者能够提供智能服务,英特尔开发了一种方法,使开发人员能够在我们包括FPGA在内的各种产品组合中快速部署AI解决方案。例如,数据科学家可以利用OpenVINO在不了解FPGA的情况下利用我们的FPGA做推理。他们可以在Tensorflow,Caffe或mxnet等标准AI框架中进行训练,并通过OpenVINO进行一些函数调用,从而在几秒钟内部署该解决方案。

  如今的一大趋势是AI模型的大小和复杂性在不断增加。AI模型的复杂度每3.5个月会翻一倍或呈现一年10次翻倍的趋势。为应对这一新兴趋势,英特尔在其当前的FPGA架构上进行了创新,以实现性能的指数级提升。

  英特尔首款经过AI优化的FPGA英特尔Stratix 10 NX嵌入了一种新型的AI优化块,称为AI Tensor块。与当今用于人工智能推理工作负载的Stratix 10 MX相比,AI Tensor Block提供的INT8计算性能高出多达15倍。AI Tensor块针对AI中常见的矩阵-矩阵或矩阵-矢量乘法进行了调整,其功能旨在有效地处理小的和大的矩阵面积。

  Stratix 10 NX FPGA作为多功能加速器补充了英特尔至强处理器。它们专门针对需要硬件定制的应用程序,这些应用程序需要集成AI提供低延迟和实时功能。为提供这种数量级的性能,英特尔重新设计了当前的计算模块(DSP模块)。AI Tensor Block的设计专注于加速AI应用程序,使我们可以在相同的空间内容纳15倍的计算量。

  简而言之,Stratix 10 NX通过AI Tensor块,扩展了基于FPGA的,用于AI推理的高性能,让硬件定制化能力的优势得以进一步拓展。英特尔Stratix 10 NX FPGA为AI推理提供了多达15倍的性能提升。这是英特尔首款经过AI优化的FPGA,将于今年晚些时候上市。

  笔者看来,英特尔至强可扩展处理器是市面上唯一集成人工智能加速的主流服务器处理器,能够帮助企业轻松构建和部署AI应用。除CPU之外,英特尔还涉足GPU、FPGA、存储、软件等领域,打造了业界最庞大和完整的以数据为中心的产品组合,不仅能够帮助客户从云到网络,到边缘和端传输、存储和处理海量数据,并满足不同行业和应用场景多样化的工作负载需求,也充分体现了英特尔以数据为中心的转型策略。

  2020年是新十年的起点,数据释放,智变加速。英特尔作为数据时代的赋能者,坚持以数据为中心,释放数据价值,推动产业智能升级。今天,英特尔从“芯”出发,布局未来,以全能实力提供澎湃智能动力,为智者赋能,让智者更强。

0
相关文章