服务器 频道

当万卡集群“瘦身”挤进一个展台,中国AI算力正在拆掉“围墙”

  走进昆山国际会展中心,最显眼的庞然大物不是概念汽车或巨型机械,而是一个真实的“算力猛兽”——中科曙光scaleX万卡超集群。令人惊讶的不仅是其澎湃的算力,更是它的“身材”:一个容纳万卡规模的AI算力集群,如今已能摆在展馆中间一隅,而非一整个展馆。

  这背后,是算力密度高达同类水平20倍以上的技术飞跃,更是开放架构带来的产业协作魔力。它直观地宣告了一个新时代的到来:中国AI计算产业走向生态共荣。

  近日,首届光合组织人工智能创新大会(HAIC2025)以“智算无界,光合共生”为主题,汇聚了全产业链超2500家企业代表。这不仅仅是一场年度盛会,更是一次在中国AI步入“人工智能+”关键阶段,对开放路线的集体宣言与成果检验。

  共识:为何必须开放?

  当高端算力供给的“性能墙”与软硬件适配的“生态墙”日益成为制约产业发展的双重瓶颈,“开放”已从可选项转变为产业突破困局的必由之路。HAIC2025如同一面多棱镜,折射出从芯片、整机、软件到应用的全产业链在开放架构下的思考、实践与期待。

  光合组织秘书长任京暘从平台视角阐释了开放的凝聚力:单一厂商举旗容易引来防备,第三方组织更能公正地汇聚产业力量。而光合组织通过建立供需对接平台与利益分享机制,让成员在贡献技术的同时也能获得商业回报,从而将开放理念落到实处。

  海光信息副总裁吴宗友同样指出,过去几年国产芯片快速发展,但种类繁多、接口各异,给用户适配带来巨大成本。开放架构的核心价值,正是通过建立统一标准与接口,帮助客户节省成本、提升优化效率,我们致力于提供一个确定性的选择。

  当前产业链条很长,但趋势需要紧耦合。如果每家都追求大而全,结果就是大家都没做好,还形成了众多割裂的小生态。中科曙光高级副总裁李斌道出了行业痛点。这种内卷与重复建设,不仅消耗企业资源,更让最终用户陷入选择困境。

  在此背景下,“开放”从可选项转变为产业突破瓶颈、实现可持续发展的行业共识。

  实践:开放架构下的硬核突破

  开放不是空谈,需要硬核成果支撑。

  本次大会最受瞩目的实物成果之一,是面向万亿参数大模型训练设计的中科曙光scaleX万卡超集群。该集群由16个scaleX640超节点通过全栈自研的RDMA高速网络互连而成,关键之处在于其硬件支持多品牌AI加速卡,软件兼容主流计算生态。

  李斌表示,在追求极致算力密度与能效的当下,超节点采用高度定制化、紧耦合的设计,牺牲了部分通用性与灵活性,换来了性能的飞跃。同时,曙光正通过推动CPU与GPU间总线互连协议的开放,力图让这种紧耦合系统不那么专用,兼容更多芯片。

  在整机与终端层面,开放生态同样催生了创新。

  紫光计算机产品中心总经理潘睿分享了其UltiStation 800H AI工作站的特色:前置可插拔硬盘仓。真正跑AI的用户不会用网络传输大量数据,拔硬盘永远是最快的方式。这一设计源于与生态伙伴及用户的深度交流。

  雷神科技路凯林则宣布,搭载海光芯片的电竞主机已正式发布,标志着国产芯开始进入对性能极为敏感的消费级市场,这是对国产计算生态边界的一次拓展。

  挑战:生态协同面临的三重门

  尽管前景光明,但走向开放协同的道路依然充满挑战。来自产业链各环节的受访者,不约而同地指出了当前面临的三大核心问题。

  第一重是“生态墙”。潘睿坦言,相比美国市场由少数巨头主导的集中式生态,中国的ICT市场是割裂的,充斥着多样的CPU、GPU架构和算法公司,导致效率损耗。路凯林则从整机厂商角度指出,制约体验的关键在于生态资源的丰富度。

  第二重是“软实力”。启元实验室王豪杰指出,国产算力生态想接近英伟达,仅靠复制硬件远远不够。英伟达的成功在于其构建了一个统一的软件栈接口,吸引了整个开源社区的贡献。为此,启元推出了“九元智算”软件栈平台,旨在屏蔽底层芯片的异构性,向上提供稳定统一的接口,让上层应用一套代码即可在不同国产芯片上运行。

  第三重是“存储与成本”。全球存储涨价周期与AI算力需求爆发叠加,给产业链带来巨大压力。潘睿预测,存储价格在高位徘徊的时间可能比预期更长。优刻得AI算力负责人丁振雷也表示,供应链压力巨大,企业采购策略被迫前置。与此同时,如何让AI算力更普惠、降低中小企业使用门槛,是光合组织等平台正在着力解决的关键问题。

  路径:从技术开放到价值闭环

  如何破解这些挑战?HAIC2025上,产业链各方给出了从技术到协作模式的多元化答案。

  技术层面,解耦与重构是关键。任京暘指出,开放计算的核心是将全产业链难点分层解耦,在每一层聚集多家优秀厂商共同突破,最后再形成面向用户的紧耦合系统。吴宗友强调,其AI开放架构并非以某一产品为中心,而是旨在让用户不关心底层CPU、GPU型号,都能在同一套体系中运行程序。

  协作层面,建立“竞争前研发”机制。任京暘认为,头部企业需真正坐下来,在竞争来临前进行联合研发与标准制定。30余家生态企业联合发起的“AI计算开放架构联合实验室”首批项目组协同创新计划已启动,下设多个工作组,具体推动芯片互连、底层软件等标准的开放共享。

  应用层面,以场景倒逼技术。路凯林认为,生态中不仅是技术服务于场景,场景也在倒逼技术升级。潘睿分享了从用户中总结的AI四大诉求:免费、随手可得、及时响应、真实可信,这些诉求正是产品迭代的灯塔。

  中科院高能物理所陈刚主任则提供了产学研合作的典范:通过与曙光、海光等光合组织合作伙伴深度合作,将高能物理计算软件移植到国产平台,既推动了国产硬件发展,也满足了前沿科研需求。

  笔者观察

  HAIC2025如同一场盛大的阅兵,展示了中国AI计算产业从“单兵突进”走向“兵团作战”的决心与能力。从海光、曙光的底层硬件开放,到启元实验室的软件栈桥接,再到紫光、雷神的终端创新,以及优刻得等平台赋能。一条光合组织托起的,基于开放架构的国产AI计算全生态图谱已然清晰。

  这条路并非坦途,生态割裂、软件短板、成本压力仍如高山横亘。然而,正如高能物理所陈刚所言:我不认为国外能一直卡住我们,这个时间不会太长。这种信心,源于对开放协同力量的认知,也源于对市场需求与产业规律的双重把握。

  当算力成为新时代的水与电,开放则决定了输水管网与电网的覆盖广度与运行效率。HAIC2025证明,中国AI计算产业正携手拆掉生态的墙,共同铺设一条通往智能时代的开放之路。这条路,注定通向共生共荣的未来。

0
相关文章