服务器 频道

智能体的大考与英特尔的应答:看至强6+背后的数据中心变局

  如果说过去两年AI领域的核心叙事是大模型军备竞赛,那么进入2026年,聚光灯的焦点正在位移。行业共识正在形成:模型的智商固然重要,但能否以经济、高效且可规模化方式将这些智力转化为生产力,已成为决定AI下半场胜负的关键。

  在这个背景下,近日,英特尔在其至强6+处理器沟通会上抛出的一系列观点与产品蓝图。作为一家在数据中心CPU市场占据统治地位数十年的巨头,英特尔如何看待AI浪潮下的旧世界与新世界?其最新发布的至强6+处理器,如何应对智能体洪流?

  带着这些问题,我们梳理出一幅关于未来数据中心、关于CPU角色重塑的完整拼图。

  告别“独角戏”:智能体倒逼下的计算再平衡

  我们的认知可能要发生改变,其来自于英特尔对工作负载趋势的判断。我们早已习惯于CPU负责通用计算,GPU负责AI加速的二元叙事,但英特尔公司执行副总裁兼数据中心事业部(DCG)总经理Kevork Kechichian提出了一个更动态的视角。

  他指出,未来的工作负载并非简单的此消彼长,而是一种更复杂的共生关系。预计到2030年,传统的基础工作负载仍将占据数据中心近一半的份额,而这些负载几乎完全运行在x86架构之上。这意味着,即便在AI的冲击下,英特尔的基本盘依然稳固。

英特尔公司执行副总裁兼数据中心事业部(DCG)总经理 Kevork Kechichian

  然而,更具颠覆性的变化来自另一端。智能体的出现,正在从根本上改变CPU与GPU的配比逻辑。

  在过去的大模型训练时代,业界流行1:4甚至1:8的CPU与GPU配比,GPU是绝对的主角。但进入智能体时代,情况发生了逆转。一个典型的智能体任务不再是简单的提问和回答,而是一个多步骤、多阶段、涉及频繁工具调用、任务拆解和结果汇总的复杂流程。

  具体来说:

  编排压力陡增:CPU不再仅仅是喂数据的搬运工,而是整个AI管弦乐队的总指挥。它需要调度多个专家智能体、管理长期运行的上下文窗口、处理复杂的逻辑判断。

  Token经济学转变:智能体的多轮交互生成了指数级增长的Token,这使得每瓦特Token成本和首Token延迟成为了新的核心KPI。

  核心配比失衡:正如英特尔专家在问答环节所言,配比正从1:8走向1:4、1:2,甚至在强化学习场景中反过来。

  笔者认为,这是英特尔为自己乃至整个行业找到的新定位。在训练领域挑战英伟达的生态壁垒固然艰难,但在推理尤其是智能体推理的主战场,CPU重新回到了C位。英特尔并非在追赶,而是在定义一个新的计算范式。

  他们告诉市场:GPU是AI的肌肉,而CPU才是AI的大脑和神经系统。英特尔向业界发出了一个强烈信号:不要忽视CPU在AI时代的战略价值。

  至强6+:为“密度”与“能效”而生

  明确了CPU归来的战略方向,英特尔拿出了怎样的产品?答案就是基于Intel 18A制程的至强6+处理器(代号Clearwater Forest)。

  如果我们用一个词来概括至强6+的核心特质,那就是极端密度。

  单Socket最高288个能效核的设计,使其成为承载横向扩展和云原生负载的怪物级芯片。这种设计哲学直指智能体时代的第一痛点:高并发。

  英特尔工程团队通过Foveros Direct 3D封装技术,将4个计算单元堆叠在3个基底芯片之上,再通过EMIB互联,总共封装了多达29个组件。这种复杂的异构集成,目的只有一个:在有限的空间内塞进尽可能多的核心,同时保证核心与末级缓存之间的低延迟通信。

  在沟通中,英特尔工程专家透露,为解决堆叠架构可能带来的延迟不均问题,他们采用了哈希算法将核心对缓存的访问打散,确保所有核心获得均衡的性能。这种对一致性体验的苛求,正是服务于企业级客户最关心的SLA。

  最令人印象深刻的商业价值,来自于TCO的对比。英特尔表示,从第二代至强升级至至强6+,可以实现高达9:1的服务器整合比。这意味着客户可以用1台新服务器替换9台旧服务器,从而减少近80%的物理空间占用和73%的能源消耗。

  笔者认为,在制程工艺遭遇物理极限的今天,英特尔选择了先进封装与架构创新作为突破口。至强6+的堆核策略看似简单粗暴,实则是基于对云厂商和电信客户痛点的精准把握。

  当数据中心空间和电力成为稀缺资源,每瓦性能和每机架密度已成为比单纯峰值性能更重要的货币。至强6+标志着英特尔正式从卖核心转向了卖密度和卖能效。

  从以太网到GPU:英特尔的全栈布局

  CPU是核心,但不是全部。在沟通中,英特尔清晰地展示了其构建全栈AI解决方案的战略布局,尤其是在网络与GPU两大关键领域。

  网络:E835的“低功耗”杀招

  网络是分布式计算的命脉。随着CPU核心数暴增,数据进出通道必须足够宽阔。英特尔推出了全新的以太网解决方案E835,支持最高200 GbE速率。

  但它的杀手锏不在于速度,而在于能效。英特尔表示,在全双向200G线速运行时,E835的功耗比主要竞争对手低28%至47%,每瓦性能是其1.4至1.9倍。结合至强6+,英特尔正在构建一个高核心数+高带宽+极低能耗的闭环。

  GPU:Crescent Island的务实选择

  英特尔并未试图在顶配计算卡上与NVIDIA正面硬刚,而是推出了一款极具差异化的产品:代号Crescent Island的数据中心GPU。

  其最大亮点是高达480GB的LPDDR内存容量。在一个350W的低功耗、风冷兼容的PCIe卡形态下,提供超大容量内存,这在市场中独树一帜。

  笔者认为,Crescent Island的战略意图极其清晰,主攻长上下文推理与模型切换场景。对于运行Llama3或DeepSeek-V4这种千亿级大模型,利用4张卡就能在F8精度下装载模型,成本优势巨大。

  英特尔离开HBM,转而拥抱LPDDR,是一次精明的田忌赛马。它不追求单卡算力峰值,而是追求每美元Token产出,这正是当下成本敏感的AI企业所渴求的。在软件层面,英特尔强调对PyTorch、vLLM等开源框架的Day0支持,并依托oneAPI构建统一生态。

  笔者观察:英特尔的“主场”与“远征”

  回到文章开头的疑问,英特尔在AI时代是否掉队?看完您心中是否有了答案?

  在传统的通用计算领域,x86依然是坚不可摧的堡垒,至强6+通过极致的能效比和密度,进一步加深了护城河。这是在它的主场进行防守反击。

  在AI推理与智能体这个新兴领域,英特尔展开了一场雄心勃勃的远征。它不再试图用CPU去取代GPU,而是重新定义了CPU的角色,成为异构计算时代的操作系统级调度器。

  通过至强6+的高密度核心进行海量并发与任务编排,通过Crescent Island的大内存进行低成本推理,再通过E835的高能效网络进行数据吞吐,英特尔提供了一套覆盖计算-加速-互联全链路的AI基础设施蓝图。

  当然,蓝图不等于现实。英特尔代工的18A工艺能否稳定量产?Crescent Island的生态建设能否跟上?竞争对手也在快速迭代,这些都是悬而未决的问题。

  当AI从炫技走向应用,从炼丹走向干活,成本的敏感度和系统的稳定性将重新成为决策的第一要素。那时,英特尔打出的这张能效与密度之牌,或许将迎来最好的时代。而我们,正在见证这场变革的序章。

0
相关文章