- 超节点迈入普及阶段:中科曙光发布革新性超节点
中科曙光3月26日在中关村论坛现场发布了世界首个无线缆箱式超节点scaleX40,并同步开启全渠道预售。这款产品的意义,并不只在于性能提升,而在于它试图回答一个关键问题——如何让超节点从“少数人的能力”,变成“多数人的标配”。
陶然 · 2026-03-26 15:36 - Arm AGI CPU重磅发布:构筑代理式AI云时代的芯片基石
Arm 今日正式发布 Arm AGI CPU,该产品是基于 Arm Neoverse 平台打造的全新量产级芯片,旨在为下一代人工智能 (AI) 基础设施提供核心算力支撑。
陶然 · 2026-03-25 10:26 - OpenClaw处理流程链路解析
OpenClaw作为一款开源的AI智能体(Autonomous Agent)框架,自2026年1月开源以来迅速成为AI领域的现象级产品。它的核心价值在于将大语言模型的推理能力与本地系统操作深度结合,实现了从"对话式AI"到"行动式AI"的跨越。本文将深入解析OpenClaw的处理流程链路,揭示其背后的技术架构和工作原理。
陶然 · 2026-03-23 17:22 - 华为云发布FlexNPU,打造弹性伸缩的“算力金箍棒”
华为云中小企业AI解决方案发布会上推出了一项算力黑科技——柔性智算操作系统FlexNPU,将Token消耗“吞金兽”有效控制在企业预算范围内,打造面向Agentic时代的极致Token性价比,为企业级智能体的普及突破算力瓶颈。
陶然 · 2026-03-21 20:26 - “伙伴+华为”:共筑AI时代数智新基建,跃升AI新价值
今日,以“因聚而升 融智有为”为主题的华为中国合作伙伴大会2026在深圳继续举行。继大会首日系统阐述了战略创新、体系升级、政策变化后,今日华为进一步解读了如何以“伙伴+华为”体系为核心,与伙伴共筑AI时代数智新基建,抓住AI时代机遇,跃升“行业+AI”价值。
陶然 · 2026-03-21 20:15 - 因聚而升 融智有为:华为中国合作伙伴大会2026成功启幕
今日,华为中国合作伙伴大会2026在深圳隆重举行。大会以“因聚而升 融智有为”为主题,旨在通过“伙伴+华为”在战略、能力、价值的全面融合、协同共进,实现高质量服务客户数智化升级,共创千行百业数智化的价值跃升。
陶然 · 2026-03-19 20:22 - Agent/Skills/Teams 架构演进过程及技术选型之道
随着Agent技术的不断成熟和发展,Agent的建设正在从“凭感觉调优”转向“系统工程”。无论是Google论文里的实验数据,还是Anthropic博客里的优秀实践,再结合我们在云小二Aivis中走过的踩坑经验,都指向同一个真理:Agent架构的复杂度必须与问题的复杂度相匹配。
陶然 · 2026-03-17 09:38 - 从业务开发视角聊聊可观测体系建设
当分布式架构渐成主流,可观测性(Observability)在行业内也越来越受到重视。可观测性是指系统可以由其外部输出,来推断其内部状态,系统的可观测性越强,我们对系统的可控制性就越强。现如今如何提升整体系统的可观测性,应用可观测工具达成业务保障可用性目标,成为了每个SRE与业务开发都必须思考的课题。
陶然 · 2026-03-16 10:19 - 中科曙光scaleFabric首发:中国高端RDMA迈入自研时代
3月12日,中科曙光宣布实现国产高端原生RDMA技术重大突破,正式发布首款全栈自研400G无损高速网络——scaleFabric。该产品基于原生RDMA架构,从底层的112G SerDes IP、硬件设备到上层的管理软件实现100%%自主研发,填补了国内数据中心高速网络领域的空白,以比肩国际顶尖同类产品的性能表现,为超大规模智算集群铺就了一条高带宽、低时延、真无损、超可靠的“算力大动脉”。
陶然 · 2026-03-12 20:28 - 搜索C++引擎回归能力建设:从自测到工程化准出
在搜索系统中, C++ 引擎长期扮演着底层核心基础设施的角色:性能敏感、逻辑复杂、变更频繁,同时承载着大规模线上流量的稳定运行。随着业务持续发展和技术架构不断演进,我们逐步意识到:在高频迭代背景下,回归能力也需要同步升级。本文将介绍这次能力升级的背景思考、核心设计思路以及落地实践。
陶然 · 2026-03-10 09:41 - PUE已成过去式,CUE才是未来标杆?
当整个行业还在为PUE值降到1.2而沾沾自喜时,一个更加严苛的评估体系正在悄然兴起——CUE。这让我想起前不久参加的一个行业研讨会,几位来自头部云服务商的架构师都不约而同地提到了同一个观点:单纯追求PUE优化已经进入瓶颈期,真正的绿色数据中心必须从碳排放的全生命周期角度来重新审视。
陶然 · 2026-03-09 14:55 - 基于Spark的配置化离线反作弊系统
本文介绍了基于spark 的离线反作弊挖掘框架,围绕解决的基本问题、工程设计亮点等展开。通过特征计算和配置化管理,提升了反作弊系统的检测效率和稳定性。展望未来,离线反作弊挖掘框架将持续演进,与更多智能算法、大模型和业务系统深度融合,不断完善检测能力和可用性。
陶然 · 2026-03-09 10:46 - 快手广告商品智能理解系统详解
为什么有些短视频广告总能“刚好”出现?你刚搜完露营装备,立刻刷到户外电源广告——这并非巧合,也不只是简单的关键词匹配。在你看到广告之前,一套高度复杂的AI系统早已在幕后运转。它不再盲目推送素材,而是深入理解商品本身。今天,我们就拆解快手广告商品智能理解系统,看看那些“懂你”的广告,是如何炼成的。
陶然 · 2026-03-05 13:41 - 得物社区搜推公式融合调参框架实战
近年来,搜索/推荐/广告系统在粗排与精排阶段的模型训练中,呈现出一个明确的趋势:从单目标优化转向多目标建模 + 多目标融合。模型目标多、融合公式复杂,给工程维护、算法迭代效率都带来了挑战。为了明文化直白展示公式全景、方便决策调参方向,直接配公式、线上自动算(既支持精排预估目标融合、也支持业务条件boost)。
陶然 · 2026-03-05 10:00 - 日均千亿PV日志系统架构升级之路
面对百度APP日均数千亿PV、超百PB数据规模带来的巨大挑战,我们完成了数据仓库的系统性升级。本文详细阐述了通过"两步走"策略解决资源压力、处理延迟和架构瓶颈的全过程:第一阶段聚焦日志清洗环节的稳定性与成本优化,第二阶段实现实时离线链路解耦、核心数据隔离及计算框架容错能力提升。
陶然 · 2026-03-04 09:47 - 浸没式液冷模块化设计:让部署不再是"噩梦"
技术的发展总是螺旋式上升的,当我们以为风冷已经足够应对数据中心散热需求时,AI浪潮的汹涌澎湃彻底打破了这个平衡。据IDC最新报告显示,到2025年,单机柜功率密度将普遍超过30kW,部分AI训练集群甚至达到100kW以上。传统风冷系统在这种功率密度下,不仅能耗惊人,更面临着物理极限的挑战。
陶然 · 2026-03-03 09:17 - 全球化数据中心网络设计:三层架构破解跨洲延迟难题
全球化数据中心网络设计是个复杂的系统工程,需要综合考虑技术、成本、合规等多个因素。随着5G、边缘计算等新技术的发展,网络架构还会持续演进。关键是要建立灵活可扩展的架构基础,为未来的业务发展留出足够的空间。
陶然 · 2026-03-03 08:55 - 第四届北京人工智能产业创新发展大会成功举办
以“融合 效能 安全——让AI‘+’出新活力”为主题的第四届北京人工智能产业创新发展大会在国家会议中心二期举办。本届大会由北京市科学技术委员会、中关村科技园区管理委员会,北京市经济和信息化局,北京市广播电视局,北京市政务服务和数据管理局,北京市门头沟区人民政府,华为技术有限公司联合主办。
陶然 · 2026-03-01 19:40 - ABACI内核缺陷智能体:让模糊测试真正“自动化”
传统的测试手段,如单元测试、静态分析和人工代码审查,面对Linux内核这样千万行级别的庞大代码库时显得力不从心。尤其是在新内核版本频繁迭代的背景下,它们要么覆盖率不足,难以触及深层路径;要么误报率高,消耗大量人力进行验证。如何在短时间内高效、系统地发现和处理缺陷,成为内核研发团队面临的核心挑战。
陶然 · 2026-02-27 13:53