本文为《液冷服务器选型指南》系列选题文章之一,笔者通过对话一线液冷服务器专家,帮助用户了解液冷服务器选型的重要性和方法,提供液冷服务器选型的关键因素和考虑要点,通过对不同液冷技术的对比与评估,用户可以了解各种技术在性能、能效、成本等方面的差异。
在日前举办的2023年开放计算社区中国峰会(OCP China Day 2023)上,史陶比尔(杭州)精密技术有限公司快速接头产品技术主管李鹏发表了《严控流体连接安全,推动液冷系统长效运行》的主题演讲,分享了关于安全可靠的快速连接器对于数据中心液冷系统长效运行的重要性。
▲史陶比尔(杭州)精密技术有限公司快速接头产品技术主管 李鹏
1892年,以纺织机械起家的史陶比尔集团在瑞士成立。1980年,史陶比尔开发液冷业务,在铁路、航空航天、核电、医疗设备等领域批量使用液冷镜头。
史陶比尔于1997年在杭州成立全资子公司,主要为中国市场提供产品和服务。随着国内经营范围的不断扩大,杭州公司除了现有的翔龙园区基地以外,新建的银海园区生产基地也已经正式投入运营。
史陶比尔是流体连接器、工业机器人、电连接器和纺织机械领域机电一体化解决方案的全球专业供应商,旨在为客户提高工业生产力,确保生产的高质量、可靠性和安全性。
芯片散热挑战和液冷
自从去年以来,ChatGPT成为备受瞩目的技术创新,引发互联网人工智能时代新浪潮,AI大模型争相涌现,而AIGC模型训练和应用需要数据中心提供强大的算力支持。
伴随着算力的增长,单卡散热设计功耗也在不断升高,而温度稳定性则是设备能最 佳工作的关键条件。传统数据中心散热以风冷为主,散热损耗大,因而对高效冷却的需求也愈发迫切。
液冷是当前能够实现高效冷却的最 佳选择,这里有三个主要的原因:一、现有的风冷结构下,空气对流散热能力已经达到了瓶颈,液冷散热能力更强,可以显著降低芯片的壳体温度。
二、液冷无论是从传热效率、导热能力、降低噪音、节省电量等方面都是明显优于风冷的。三、液冷技术大幅降低数据中心运行PUE,推动碳达峰、碳中和等国家政策落地,节能减排。
因此,数据中心未来的趋势是从100%风冷转变为液冷+风冷的混合模式。
当前主流冷板式液冷系统的模块化部署示意图。我们可以看到整个液冷循环系统是由室外机组、水力系统、CDU、液冷机柜组成。
快速连接器作为连接服务器节点和Manifold之间的关键组件,能实现快速连接和断开回路的功能,在液冷系统性能和可靠性方面发挥了不可或缺的作用。
确保液冷快速连接器安全可靠的关键因素
对于服务器设计师和数据中心运维人员来说,维持液冷系统高可靠性的基本办法就是当主要的部件失效时,可以快速的使用剩余部件或者冗余设备来维持整个系统的正常运行。这个过程离不开快速连接器的使用,然而液冷系统中的单个快速连接器也是一个潜在的失效点。
失效的连接器所引发的泄漏可能会使整个服务器机架失效,更有可能造成人员的伤害。因此,快速接头的设计、结构以及质量的好坏,对整个液冷系统来说至关重要。
为服务器和高性能计算机做液冷设计而选择快速连接器时,为了确保其安全可靠性,要考虑以下5个主要因素:坚固的结构和设计、“干式断开”能力、金属材质兼容性、密封圈兼容性、操作简便。
坚固的结构和设计
当液冷系统选择快速连接器时,要寻求那些专门用于低压应用并且结构坚固的连接器,显而易见的是,采用金属材质的快速接头组件比塑料组件更可靠持久。因为金属组件拥有更高的连接次数(≥1000次),高耐压能力(16bar),机械适应性(耐振动/冲击),气候适应性(冷热冲击/温湿度循环)。
快速连接器是数据中心液冷系统中的一个重要环节,而不是廉价的“耗材”;我们必须考虑合理组件在使用时间内的总拥有成本,而不仅仅是考虑购买价格。
“干式断开”能力
快速接头两端必须要配置截止阀,在断开时能够自动切断液冷回路,避免冷却液漏到敏感电子产品上。常见的快速接头有两种内置阀门结构:非平面阀门结构和平面阀门结构。
非平面阀门结构(如针阀)的快速接头在阀芯关闭时,会形成封闭容腔,完全断开后,会有残余液体滴落,从而给周边的电子产品带来安全隐患。
平面阀门的快速连接器采用了无滴漏设计,断开时只在阀端表面残留薄液膜,避免形成液滴漏到重要电子部件上,这种平面结构是液冷的理想选择。
金属材质兼容性
考虑到可靠耐用,快速连接器通常会采用金属材质作为主体结构。但是,不合理的液冷金属组件搭配可能会引发生锈问题,从而导致快接堵塞,泄露甚至断裂等故障。所以,为液冷系统选择不同的金属组件和冷却流体时,除了要考虑性能和成本以外,还要考虑材质兼容性的问题。
从预防化学腐蚀角度来看,大部分金属都可以与主流冷却液兼容,如水乙二醇/氟化液。但如果是特殊的冷却液,例如去离子水,我们就需要格外注意。
去离子水的电导率越低(离子越少),发生化学腐蚀的几率越高。所以,建议当电导率接近或者低于5μS/cm时,就必须要选择高电势材质,比如不锈钢。
电偶腐蚀发生的充分必要条件:在同一个液冷系统中,存在不同电势的材质;不同的电势材质存在导电连接;导电流体和不同电势材质相接触。只有当这三个条件同时具备时,才会发生电偶腐蚀现象。
因此,为避免电偶腐蚀发生,我们可以采取的措施是尽可能选择相同或者相近电势的材质组合,或者在不同金属之间用绝缘材料连接(如橡胶管),或者采用绝缘的冷却流体(如氟化液)来做物理隔绝。
密封圈兼容性
快速接头中的密封圈可以使连接器在连接和断开状态下保持防水密封性,以确保没有冷却液滴落或泄露。因此,密封圈必须要和冷却液兼容,以防止出现密封圈溶胀、侵蚀、断裂或弯曲等各种故障。
从这张表可以看出,乙丙橡胶和氟硅橡胶能和大部分冷却液兼容,而氟化液只和乙丙橡胶兼容。
氟硅橡胶适合室外低温环境,它的材质较软。乙丙橡胶适合室内常温环境,它的材质较硬。因此,从兼容性,耐侯性,以及机械强度来看,乙丙橡胶是数据中心液冷系统的第一选择。
操作简便
好的快速连接器不仅需要结构耐用和防水密封,操作简便性同样重要。快速接头的易操作性简化了现场维护,也保证了安全可用性。
快速接头需要具备的人体工学设计包括颜色编码、对接导向、锁紧装置、连接力四个方面。
液冷全场景快速连接器解决方案
得益于强大的研发创新和质量管控能力,史陶比尔快速接头完全满足液冷数据中心安全可靠的要求。李鹏表示,“安全可靠已经成为我们品牌的标志。”
在涉及到安全可靠的技术指标上,史陶比尔产品性能优于行业标准,具备更小的断开泄漏量,以及更小的连接力。
在生产环节,史陶比尔所有的零部件会在ISO 8等级的清洁室环境中进行装配和测试,最大限度地减少人为污染。同时,实体上刻有专属批次号,确保全生命中周期可追溯。
在质检环节,史陶比尔对所有产品进行单独的质量管控测试,包括气密性检测、功能性测试、客户定制化测试等。
在包装环节,单体配备防尘帽,确保接头完整直至最终使用。批量产品采用吸塑盘和薄膜包装,保证清洁度。
史陶比尔不断地设计开发液冷快速连接器,产品完全覆盖数据中心液冷系统全场景的应用,无论是服务器节点侧、Manifold进侧、CDU侧,史陶比尔均可以提供成熟可靠的快接产品。
根据液冷系统不同的设计需求,目前主要有两种不同的平头无泄漏快速连接器类型:手动快接和盲插快接。
上图是史陶比尔的产品系列,手动快接系列包括SCG、DAG、UQD、CGB、TDU24、TCB25~100。水泵停机会导致液冷系统失压停止工作,通过盲插实现故障件的快速切换。盲插快接系列包括CGD、DDG、BCD。
液冷应用经验及案例分享
史陶比尔在液冷行业有着超过30年的丰富经验。在航天航空行业,史陶比尔根据应用场景,提供定制化解决方案,其液冷接头广泛用于机载、舰载、车载等设备的雷达温度控制回路。
在铁路行业,包括电力机车、高铁、地铁、有轨电车等均有丰富应用,代表客户有中国中车、铁科院、阿尔斯通、庞巴迪、西门子、东芝。在最极端的条件下,史陶比尔也能确保可靠性和安全性。
在数据中心领域,史陶比尔和全球的IT公司(超算/数据中心/5G)展开合作并提供质量稳定可靠、结构紧凑的快速连接器。
第一个案例是谷歌1代/2代机架服务器液冷项目,根据实际的应用工矿和设计要求,最终为客户推荐的是SCG03不锈钢快速连接器系列,该项目从2018年开始累计使用了20万对,运行至今,没有出现明显的质量故障。
第二个案例是日本富岳超算刀片式服务器液冷项目,根据实际的工矿和设计要求,用户最终选择的是CGD03不锈钢盲插快接系列,最终实现了高效液冷。整个项目从2019年开始运行至今,已经使用了16.5万对。
写在最后
史陶比尔在液冷领域拥有超过30年的丰富应用经验,业务覆盖航空航天、铁路、核电、医疗设备等多个行业,自2010年进入数据中心液冷后,已先后在通用服务器、超算、5G基站、充电桩等领域实现了批量应用。
此外,史陶比尔在全球28个国家设有子公司,并在欧洲、北美和中国设有生产基地,能够为全球客户提供及时、高效的本地化服务,也期望通过与全球伙伴的交流合作,持续推动液冷快速连接器技术创新,共同助力绿色数据中心建设。