当DeepSeek、ChatGPT等生成式AI的“智力”以指数级跃升时,支撑这一切的底层算力中心,却正站在一道“物理极限”的悬崖边上。
过去两年,全球算力军备竞赛的核心逻辑是“堆芯片”。但随着单芯片功耗从300瓦飙升至1000瓦乃至更高,以及万卡、十万卡集群的普及,一个残酷的事实浮出水面:传统的风冷和供电架构已经“压不住”了。
行业普遍认为,风冷的极限大约在单机柜15千瓦左右,即便是当前主流的冷板式液冷,在面对下一代超大规模训练集群时也显得捉襟见肘。
针对上述挑战,曙光数创给出了答案:全球首个MW级相变浸没液冷整机柜及其基础设施整体解决方案——C8000 V3.0。这不仅是一次产品迭代,更是一场从“以服务器为中心”向“以基础设施为中心”的范式革命,宣告了智算中心正式迈入“兆瓦时代”。
从“补丁”到“重构”:MW级技术群的系统化突围
中国科学院院士、河南大学校长张锁江在会上明确指出:“在AI算力的强劲驱动下,智算中心的发展已不可逆转地迈入兆瓦级时代,这已非未来概率,而是正在发生的现实。”
在传统的语境下,数据中心的设计往往是头疼医头:芯片热了加风扇,风扇吵了换冷板。这种叠加式的修修补补,在面对单机柜900千瓦甚至更高功率时,彻底失效。曙光数创此次发布的C8000 V3.0,最大的价值在于其系统性重构。
所谓“MW级”,并非简单的数字游戏。方案通过核心技术突破,重新定义了智算基座的能力边界:
第一,突破物理散热的“天花板”。浸没式相变液冷换热技术将单机柜功率上限推高至900千瓦以上,散热能力超过200W/cm²。这不仅意味着同等面积下算力密度提升数倍,更关键的是,它采用了自研国产冷媒和首次规模化应用的金刚石铜导热材料。后者导热率提升80%,直接助力芯片性能提升10%。在芯片制程短期内难以追平的背景下,这无疑是一条极具中国特色的“以冷补芯”路径。
第二,重构供电的“主动脉”。传统供电架构在应对AI负载的瞬时剧烈波动时,常显得力不从心。C8000 V3.0引入的高压直流供电技术,实现了高压直流电直接入柜,系统效率超过96%,且响应速度极快。这不仅保障了供电的极致稳定,更从能源入口端为PUE降至1.04以下奠定了基础。
第三,从“卖硬件”到“卖服务”的逻辑转变。发布会上,曙光数创反复强调“液冷即服务”的理念。在沟通环节,曙光数创高级副总裁张鹏坦言,液冷作为新生事物,需要通过多环节优化以降低其部署、运维门槛。曙光数创组建专门的系统设计部,提供从设计、交付到运维的全生命周期服务,正是为了解决新技术落地的“最后一公里”难题。
曙光数创高级副总裁 张鹏
开放生态:中国液冷产业的“代差”机遇与隐忧
长期以来,在液冷领域存在一个争议:中国到底是不是“玩”得最好?面对这一问题,张鹏给出了冷静而客观的回应:“我不赞成。”
他指出,目前北美依然是最大的液冷市场,由于电力紧缺和芯片主导优势,他们在冷板技术上的设计理念依然领先。这种差距体现在系统工程的整合思维上,英伟达将芯片、存储、网络、供电、冷却视为“五层蛋糕”统一设计,而国内产业链长期处于割裂状态。
然而,差距的另一面是独特的赶超机遇。由于国内先进制程受限,国产AI芯片为了达到同等算力,往往需要更大的尺寸和更高的功耗,这反而倒逼国内的散热技术必须“超常规发展”。张鹏自信地表示:“毫不夸张地说,曙光在基础设施,供电、冷却、控制,这个层面,是领先英伟达至少三年的。”
为了将这种技术优势转化为生态优势,曙光数创在发布会上宣布成立“MW级浸没相变液冷基础设施开放实验室”。这一举措极具战略眼光:在英伟达主导的CUDA生态之外,硬件基础设施的开放联盟将为中国算力产业提供另一个维度的“护城河”。通过向芯片、服务器、集成商开放核心接口与测试环境,实验室旨在协同破解兼容性难题,将中国的先进工程实践沉淀为行业标准,从根本上降低国产先进智算基础设施的部署门槛。
兆瓦时代不仅是技术竞赛,更是系统工程与社会协作
通过这次发布,我们看到了液冷技术走向纵深时面临的几个深层思考。
首先是经济性的“临界点”问题。浸没式液冷虽然性能强悍,但并非全能。曙光数创明确指出,在15-30千瓦区间,风冷仍有成本优势;在30-200千瓦区间,冷板式液冷是更优解;只有当功率超过200千瓦,相变浸没的TCO优势才会真正显现。这意味着未来的智算中心将是“风、冷板、浸没”三分天下的混合架构,这对厂商的产品矩阵完整性提出了极高要求。
其次是关于“余热回收”的社会化难题。液冷排出的40-50度热水品位不高,如何利用?这是一个前瞻性的问题。随着AI耗电量占比预计从当前的3%向未来的30%增长,如何“变废为宝”成为关键。张鹏指出行业已有“算热联产”的概念,比如将数据中心建在污水处理厂旁,利用余热为生物反应加热;或者服务于大棚种植、皮革烘干。但这需要政策层面的顶层设计,比如对实施余热利用的数据中心给予电价优惠。这不仅是一家企业能解决的,而是需要全社会协同的“减碳”工程。
最后是关于“根技术”的焦虑。尽管C8000 V3.0在散热和供电上取得了代差优势,但依然无法回避“卡脖子”问题,高纯度材料、先进制程等依然是绕不开的坎。目前的热管理都是在芯片“外围”做文章,芯片封装内部的热阻问题仍有待妥善解决。
写在最后
曙光数创此次发布会,不仅展示了单机柜MW级的硬核参数,更展示了在面对全球AI浪潮时的系统性思考能力。从2011年提前布局液冷,到如今定义兆瓦级标准,曙光数创证明了在基础设施领域,通过长期主义的技术深耕,完全可以实现“代差”超越。
正如发布会主题所言,“从MW级,到∞可能”。当算力突破物理空间的限制,当绿色的“冷”液驱动最“热”的智能,中国智算产业正在为全球数字经济注入一股强劲、持久且冷静的动力。