近日,英特尔公司在其举办的“Vision 2024”大会上正式发布了旨在加速企业生成式人工智能(GenAI)工作负载的Gaudi 3芯片,并公布了一系列促进GenAI采用的下一代产品和战略合作计划。
该公司的战略涵盖了从数据中心到边缘设备(包括支持人工智能的个人电脑)的所有硬件和云计算服务路线图。
英特尔公司首席执行官Pat Gelsinger在大会主题演讲中宣布人工智能时代已经到来,该公司在会上推出的新品包括将使用英特尔新一代酷睿超处理器的个人电脑(PC)。该公司预计,2024年用于AI PC的处理器出货量将达到4000万颗,2025年将达到1亿颗。
去年12月,英特尔公司宣布即将发布用于数据中心人工智能工作负载的Gaudi 3处理器,并预览了其第14代酷睿超“Meteor Lake”数据中心处理器和第5代至强可扩展CPU。英特尔公司最终在4月23日正式发布了这两款处理器。
英特尔公司还宣布,其下一代Granite Ridge和Sierra Forest处理器将被命名为“Xeon 6”,将取代采用代际术语进行营销的命名,例如“第五代Xeon可扩展”型号。
英特尔首席执行官Pat Gelsinger介绍即将发布的至强6处理器的晶圆
至强6处理器将集成对MXFP4数据格式的软件支持,与使用FP16的第四代至强处理器相比,至强6处理器将下一代令牌延迟减少6.5倍,能够运行700亿个参数的Llama-2大型语言模型。
在产品展示中,Gelsinger还提供了有关Gaudi 3 CPU架构和性能的更多细节,承诺英特尔将其快速推向市场,并表示许多新客户期待采用这款产品。Gelsinger列举了十几个使用Gaudi 3芯片的合作伙伴,其中包括Naver、Bosch、NielsenIQ和Seekr。
他表示,从历史上看,英伟达公司凭借其GPU(图形处理单元)和TPU(张量处理单元)引领了全球人工智能硬件市场,这两款产品是为大型语言模型和人工智能应用程序提供动力和训练而创建的。英特尔公司将Gaudi 3定位为Nvidia H100 GPU的直接竞争对手。
与NVIDIA H100相比,Gaudi 3的推理能力平均提高了50%,能效平均提高了40%。Gelsinger说,“Gaudi 3的运行成本只是NVIDIA H100的一小部分。Gaudi 3可以为使用BF16浮点格式的计算机内存系统提供Gaudi 24倍的人工智能计算能力,内存带宽是其1.5倍,还提供了两倍于Gaudi 2的网络带宽。”
英特尔公司采用台积电的5nm工艺制造了Gaudi 3芯片,这些芯片现在可供包括戴尔、HPE、联想和Supermicro在内的原始设备制造商用于人工智能数据中心市场。
英伟达占据了2023年数据中心芯片市场约83%的份额,谷歌占据了其余17%的份额。
宾夕法尼亚大学工程与应用科学学院教授Benjamin Lee表示,英特尔的发展轨迹并不如意,因为该公司面临着与英伟达公司在人工智能芯片市场激烈竞争的挑战。
Lee说,“英特尔长期主导高性能CPU的设计和制造,但目前面临的挑战反映了计算领域的根本变化。虽然数据中心将继续大量部署CPU来支持互联网服务和云计算,但越来越多地部署GPU来支持人工智能的仪态,英特尔一直在努力设计具有竞争力的GPU。”
英特尔的独特优势在于,该公司是唯一一家可能够在制造先进芯片方面与台积电竞争的美国芯片制造供应商。Lee表示,“这让它在与无晶圆厂的英伟达和AMD等竞争对手的竞争中占据上风。虽然英特尔尚未成功建立和发展像台积电这样的代工业务,但鉴于许多科技公司现在都在设计自己的高性能处理器,这对其未来发展至关重要。”
Lee表示,英特尔并没有跟上台积电在晶体管技术上的进步,也没有能力满足与台积电代工厂的精度和效率相匹配的要求,目前缺乏满足自身制造需求和更大客户群的制造能力。
他指出,英特尔公司官制定的路线图是明智的,但关键问题是,英特尔公司能否利用《芯片和科学法案》获得美国政府提供的资金以有效地执行这一路线图。
2022年8月,美国国会通过了《芯片和科学法案》,以解决新冠疫情带来的处理器短缺问题。美国商务部为此提供了527亿美元的资金,用于开发“美国芯片”计划下的一系列项目,以重振美国在半导体研究、开发和制造领域的地位。英特公司希望能够从中获得约85亿美元。
Gelsinger宣布,《芯片和科学法案》提供的资金将帮助英特尔公司去年在亚利桑那州钱德勒耗资200亿美元的Ocotillo芯片制造工厂生产出第一批芯片。
然而,该法案目前几乎没有为英伟达的GPU、苹果的NPU和谷歌的TPU等芯片设计和生产提供直接支持。
在“Vision 2024”大会上,英特尔公司还发布了涉及企业人工智能所有领域的下一代产品和服务的最新信息,包括可以运行检索增强生成流程(RAG)的新型英特尔至强6处理器。
检索增强生成流程(RAG)通过使用用户的专有数据和信息创建更定制和准确的GenAI模型,可以显著地减少已知的人工智能问题,例如错误输出和幻觉。
Gelsinger举例说明了GenAI使用从互联网上收集的未实时更新的数据是多么不可靠。
他说,“对于标准的大型语言模型(LLM)来说,也许只需要每周一次或每月一次更新和再训练……当将LLM与来自矢量数据库、流式非结构化数据库的实时数据结合起来,我们认为这将具有非常强大的能力。”
英特尔公司还表示,在今年第二季度将发布一个新品牌,是将用于数据中心、云计算和边缘应用的下一代处理器。与第二代英特尔至强处理器相比,具有高效内核的英特尔至强6处理器(E-core,以前的代号为Sierra Forest)每瓦性能将提高2.4倍,机架密度提高2.7倍。
他声称,英特尔在过去十年的创新有些平淡无奇,只是让PCIe运行更快速,逐步升级DDR内存,并为芯片增加了一些内核。
Gelsinger说,“虽然这些技术进步显得有些无聊,但人工智能的应用正在让这一切变得激动人心,这也是从自互联网以来最大的技术变革,它将重塑组织业务的各个方面。”
他表示,到2020年,全球芯片的潜在市场规模预计将从目前的6000亿美元增长到1万亿美元以上。
为此,Gelsinger还在会上宣布英特尔公司的下一代酷睿Ultra客户端处理器系列(代号为Lunar Lake)将于今年晚些时候推出。该系列处理器将具有每秒执行100多个TOPS和超过45个神经处理单元(NPU) TOPS,用于下一代人工智能个人电脑。
Gelsinger说,“英特尔的使命是让人工智能无处不在(AI everywhere),我对下一代产品的推出感到非常兴奋。在竞争对手推出第一代人工智能芯片之前,我们正在推出第二代——Lunar Lake,Lunar Lake的性能是竞争对手的三倍。并且我们正在设计和制造第三代AI芯片。”
Gelsinger将支持人工智能的个人电脑比作Wi-Fi。他表示,不具备人工智能功能的电脑将被视为过时产品的一天终将到来。他说,“Microsoft Copilot、AI developers、Zoom和Teams能够实现总结、翻译、情境化,每个应用程序都采用人工智能技术。因此,现在是人们更新电脑的时候了。”
英特尔还致力于为人工智能结构创建一个开放式以太网网络模型,并推出了一系列人工智能优化的以太网解决方案。该公司正在通过超以太网联盟(UEC)设计大规模扩展和向外扩展的人工智能结构。
英特尔公司在一份声明中表示:“这些创新使越来越大的人工智能模型能够进行训练和推理,每一代模型的规模都在以数量级的速度扩大。”
该公司为此推出了针对人工智能优化的产品组合,其中包括Intel AI NIC(网络接口卡)、集成到XPU的AI连接芯粒、基于Gaudi的系统,以及Intel Foundry的一系列软硬件参考AI互连设计。
相关链接:https://www.computerworld.com/article/2086979/intel-unveils-its-ai-roadmap-chips-to-rival-nvidia.html