服务器 频道

从国内首个6万卡AI4S集群看中国科研计算路径

  当“人工智能+”上升为国家战略,如何将这场技术革命真正锚定在科学创新的深层土壤中,成为各界关注焦点。近日,在郑州,中科曙光提供的6万卡AI4S(AI for Science)计算集群投入使用,则给出了一个具象的答案。

  这不仅是国内目前最大的AI4S计算集群,更是一次从算力规模到应用生态的全方位压力测试。在与会专家看来,该集群的落成,标志着我国人工智能与科研创新的融合,正在从单点突破迈向系统化赋能的新阶段。

  算力拐点:AI4S为何需要“超智融合”?

  长期以来,科学计算与人工智能走的是两条不同的技术路径:前者追求全精度计算的极致性能,后者侧重低精度下的海量数据分析。然而,随着科研问题日益复杂,例如蛋白质折叠模拟、液态水分子动力学分析,单一计算架构已难以满足需求AI4S计算需求。

  “AI4S对算力的需求是全方位的。”国家高性能计算机工程技术研究中心副主任曹振南表示。他强调,这不仅仅是堆叠加速卡的数量,更需要一个强大的“超智融合”底座:既要能处理传统科学计算的高维函数,又要能支撑万亿参数大模型的训练与高通量推理。

  这一点在中科曙光的集群设计中得到了直接体现。该6万卡集群具备六大技术特征,其中尤为值得关注的是“全面精度”与“高速互连”。依托自主可控芯片,集群可支持8/16/32/64位宽的全精度计算,这意味着它能在同一套系统内兼顾传统数值模拟与AI神经网络计算。而通过国内首款类InfiniBand无损高速网络(scaleFabric)产品,集群解决了大规模并行计算中常见的“通信墙”问题。

中科曙光高级副总裁 李斌

  中科曙光高级副总裁李斌对此有一个形象的比喻:“同样的发动机和底盘,需要针对不同路况做调校。”他解释,面向AI4S的系统调校,核心在于“存算协同”与“灵活调度”。通过“超级隧道”技术和智能调度机制,系统能够避免存储I/O成为瓶颈,实现每秒超过万次的并发作业调度效率。

  效率革命:从“算得快”到“算得精”

  衡量一个计算集群的价值,传统视角往往聚焦于浮点运算次数(FLOPS)。但在AI4S语境下,真正的价值在于“科研效率”的提升。

  根据会上披露的数据,该集群在实际应用中已展现出惊人的加速比:在3万卡规模下,蛋白质折叠模拟较传统算法加速1000倍;在4.5万卡规模下,实现了万亿原子液态水分子动力学模拟,在打破世界纪录的同时,效率提升了三个数量级。

  这种量级的提升,本质上改变了科研的范式。兴业证券经济与金融研究院副院长、计算机行业首席分析师蒋佳霖从产业角度分析认为,AI4S的爆发基础非常扎实。“在数据端,科学计算每年产生的数据已达EB级别,为AI提供了数据土壤;在算法端,Transformer的注意力机制能有效捕捉分子间的长程相互作用,天然适配科学问题。”

  清华大学智能产业研究院(AIR)助理教授李琨则提醒,要警惕“AI鸿沟”的拉大。他指出,当前许多传统科研机构和企业面临两大难题:一是如何利用好新型混合异构算力;二是如何通过AI将“好钢用在刀刃上”,解决那些原本“不可能解”的问题。“AI4S不是简单的加速,而是让原本不能解的问题变成能解。”

  生态破局:降低门槛与“科学智能体”的落地

  算力再强,如果用户用不起来,也只是“空中楼阁”。在此次发布中,一个尤为值得关注的亮点是配套的软件生态,特别是国内首个科学大模型一站式开发平台OneScience及“超级科学计算智能体”。

  曹振南在发言中反复强调“降低门槛”的重要性。“任何一个东西,只有门槛低了,用户才会用起来。”他指出,超算互联网平台(scnet.cn)不仅仅是连接算力,更是要实现“数算模用”一体化。通过汇聚海量数据集、行业知识库和大模型工具,用户无需再面对繁琐的软件配置。

  具体来看,OneScience平台集成了数十个AI4S热点模型,覆盖地球科学、生物信息、流体仿真等领域。以往需要数周甚至数月的模型开发工作,现在被压缩到了“数小时”。而“超级科学计算智能体”则更进一步:用户只需通过自然语言提出需求,系统便能自动拆解任务、调用模型、调度算力,实现端到端交付。

  “未来可能不是碳基智能在搞科研,而是硅基智能在辅助甚至主导这个过程。”李斌认为,随着大模型底层能力的提升和智能体技术的发展,AI4S的工程化属性将极大释放科研生产力。AI4S作为“目标导向”极强的技术路径,其产业化前景,无论是生物医药、新能源电池还是半导体材料,都将是万亿级的市场。

  大国竞速:中国AI4S的机遇与挑战

  从全球视野来看,AI4S已超越纯科研范畴,成为大国科技博弈的前沿阵地。

  李琨在分享中列举了全球态势:美国、英国、欧盟、日本均在2025年后密集出台政策,将AI4S上升为国家战略工程。相比之下,中国虽已将AI4S写入“十五五”规划,并率先在北京发布地方性政策,但仍面临高端算力供给不足、科学数据标准缺失、复合型人才短缺等短板。

  “美国更多是以云服务形式主导,而中国则依靠国家超算体系与新型算力基础设施的结合。”李琨指出,这种差异决定了中国的AI4S路径必须走“超智融合”的自主创新之路。

  蒋佳霖则从市场潜力的角度给出了乐观判断。“中国在AI4S论文发表和应用创新数量上已是全球领先,加之举国体制的制度保障,以及庞大的科研与产业转化场景,产业链一旦形成闭环,后续动能非常强。”

  笔者观察:不仅是技术展示,更是生态宣言

  回到这场发布会本身。中科曙光在短短数月内,从2025年底发布scaleX万卡超集群,到2026年2月3万卡上线,再到如今的6万卡集群投入使用,这种“曙光速度”背后,折射出的是中国在AI基础设施领域的工程化能力跃迁。

  正如中国科学院院士、河南省科学院院长徐红星所言,这不仅是技术成果展示,更是我国人工智能技术与科研创新深度融合的里程碑。当算力、算法、数据与具体的科学问题深度咬合,一个属于“人工智能+科学技术”的规模化落地时代,正在到来。

0
相关文章