当大模型从“生成式对话”迈向“智能体执行”,人工智能正经历一场深刻的能力跃迁。
2026年伊始,OpenClaw等智能体技术的爆发,让AI不再是会聊天的助手,而是能办事的数字生产力。其背后折射出一个清晰的信号:Agentic AI时代已经到来,算力需求正从训练主导转向推理与服务主导的新范式。
然而,算力的规模扩张并不等同于能力的线性释放。如何在复杂多变的行业场景中,让算力既“够用”又“好用”,既能支撑千亿参数的训练,也能在边缘端实现毫秒级响应,成为摆在所有产业参与者面前的共同课题。
针对上述挑战,在昇腾人工智能伙伴峰会2026上,昇腾AI给出了答案:通过构建覆盖“大中小”场景的系列化算力,硬件开放,软件开源,使能伙伴在行业数智化深水区实现差异化创新。
算力新范式:从“堆叠”走向“统一编址”
“唯有具备统一内存编址能力的超节点,才能真正实现算力的Scale-Up扩展,从容应对Agentic AI时代的算力挑战。”清华大学计算机系教授、昇腾荣誉顾问郑纬民一针见血地指出当前算力架构的关键转折点。
这一判断直击行业痛点。在传统服务器堆叠模式中,每台服务器独立编址,跨节点交互依赖以太网通信,数据拷贝、协议转换带来的性能损耗在智能体多轮迭代场景下被急剧放大。
昇腾384超节点的出现,改变了这一局面。48TB内存统一编址、共享内存容量较传统方式提升96倍,所有NPU之间的交互可通过Load&Store等内存语义直接操作,数据交互效率提升三倍。这不仅是性能的提升,更是算力架构从物理堆叠到逻辑统一的本质跃迁。
华为昇腾计算业务总裁 张迪煊
华为昇腾计算业务总裁张迪煊指出,超节点天然亲和Agent负载,是大规模推理的必选;而“内存统一编址”和“内存语义访问”则是判断超节点的核心标准。
正是基于这一判断,昇腾将目光投向2026年这一关键节点。随着Agent应用加速渗透、强化学习成为行业模型训练的必经之路,Tokens消耗正呈现指数级增长,算力效率已从技术指标转变为商业竞争力。
因此,2026年将成为强化学习与Agent应用规模落地的元年,Tokens将成为AI时代的新量纲,谁能以更高效率处理Tokens,谁就能在数智化浪潮中占据先机。
硬件开放:系列化算力让“大中小”场景都有合适底座
算力不应是“一刀切”的标准化产品,而应像工具箱一样,针对不同场景提供不同规格的产品。在峰会上昇腾系统阐述了大中小三大核心算力场景布局:
大算力场景,面向大模型预训练、强化学习后训练以及大规模推理服务。昇腾持续创新超节点架构,开放灵衢协议、部件及参考架构,使能伙伴打造超节点系统。这一层级的核心是极限性能与架构领先。
中算力场景,覆盖辅助医疗、智慧教学等主流行业应用。客户的核心诉求是“开箱即用”与“成本可控”的平衡。昇腾开放中心模组/刀片,伙伴可结合模型及软件生态,打造大模型应用一体机、高密服务器等产品,加速行业智能化升级。
小算力场景,聚焦工业质检、具身智能、科研教学等边端领域。这是潜力最大的海量市场,客户更关注灵活高效与成本控制。昇腾开放标准模组和板卡,使能伙伴打造多样化边缘算力设备。
这一“大中小”系列化布局的核心逻辑,是将算力能力与业务需求精准匹配,避免“大马拉小车”的资源浪费或“小马拉大车”的性能瓶颈。它不是简单的产品线延伸,而是一种“场景定义算力”的生态思维。
在这种思维下,伙伴不再是被动的产品使用者,而是可以根据自身行业Know-How,在昇腾提供的“算力积木”基础上,灵活搭建贴合行业需求的解决方案。
硬件开放的核心,是让伙伴能在昇腾底座上构建差异化竞争力。昇腾从2019年推出第一代集群、服务器、板卡、模组产品及软件栈至今,始终聚焦AI算力底座,使能伙伴创新。目前,围绕硬件、算子、加速库、模型、应用五大方向,昇腾已联合伙伴打造400多款硬件产品,开发560多个高性能算子,孵化50多个大模型和1100多个场景化应用,服务2700多家行业客户。
软件开源:从“易用”走向“好用”的生态跃迁
硬件开放解决了“用什么”的问题,软件开源则回答了“怎么用好”的问题。2025年8月,昇腾正式明确全量软件开源开放。截至目前,CANN等软件已完成架构解耦,安装包从8个拆分为29个,包大小从2G缩减至0.43G,特性加载时间从2分钟缩短至20秒,编译效率提升58%。
更值得注意的是,昇腾正在深度融入全球开源生态。从算子编程框架Triton到AI框架PyTorch,再到训推加速引擎FSDP、vLLM等,昇腾已累计支持50多个三方开源社区和项目,贡献650多个关键特性。
开源不是目的,使能伙伴自主创新才是。智谱基于昇腾三个月完成多模态大模型GLM-Image的训练,开源不到24小时登顶Hugging Face Trending榜第一,这一案例有力证明了在昇腾上可以训练出世界级领先的大模型。
行业落地:从“方案”到“场景”的价值闭环
算力底座与生态体系的最终检验标准,是能否真正深入行业核心场景。本次峰会,昇腾联合20家行业伙伴正式发布2026昇腾AI应用场景解决方案,覆盖金融、教育、医疗、检法司等多领域核心生产场景,已落地180多家客户。
这些方案的一个共同特点是“小而美”,轻量部署、快速落地、可规模复制。在金融领域,科大讯飞智能客服实现复杂意图理解毫秒级响应;先进数通智能信审方案将审批周期从5-10天压缩至1天内;安硕信息AI尽调报告方案精准破解信贷“三查”痛点。
在医疗领域,惠每医疗CDSS一体机45秒完成复杂病历分析;全诊医学AI医生助手节省医生75%的病历书写时间;润达医疗智慧医院解决方案覆盖13个核心医疗场景。
在教育领域,文华在线AI智慧教学方案平均为教师每节课节省2小时备课时间;容慧科技数智校园方案使教师批改作业效率提升50%。
这些落地成果背后,是昇腾“技术+商业”双轮驱动的生态策略。一方面通过技术使能,牵引伙伴向能力型发展;另一方面通过商业赋能,支持伙伴打造更匹配场景需求的产品和解决方案。
写在最后
从超节点的架构突破到规模商用落地;从大中小系列化算力布局,到AI开源生态的深度融入;从400多款硬件产品到1100多个场景化应用,昇腾与伙伴共同走过7年,见证了中国AI产业从探索起步到深耕细作、从单点突破到场景落地的快速发展。
在Agentic AI加速到来的今天,算力底座的价值已不仅是提供计算能力,更是支撑智能体感知、推理、执行全流程的神经系统。而生态体系的价值,则是让这一神经系统能够灵活适配千行万业的差异化需求。
当算力底座与生态共振,行业数智化的“高速公路”才能真正畅通。在这条路上,昇腾与伙伴共同铺就的,不仅是一条技术通道,更是一条通往产业新未来的价值路径。