SACC2026
SACC2026
2025技术卓越奖获奖榜单上线
DTCC2025专题报道
DeepSeek破局:探索六大领域的变革密码
联想凌拓9月11日

这篇文章由三个部分构成,希望可以从看自己、看行业、看世界三个视角,讲一讲我的思考,以及在这巨变的时代,不变的本质是什么。第一部分,我会从一名 AI 产品 Agent 工程师的视角,聊聊我亲身经历的一些变化,以及在这些变化里我越来越确信的一件事:有些东西一直在变,但也有些东西几乎没怎么变过...

当整个行业还在为PUE值降到1.2而沾沾自喜时,一个更加严苛的评估体系正在悄然兴起——CUE(Carbon Usage Effectiveness,碳使用效率)。这让我想起前不久参加的一个行业研讨会,几位来自头部云服务商的架构师都不约而同地提到了同一个观点...

这篇文章由三个部分构成,希望可以从看自己、看行业、看世界三个视角,讲一讲我的思考,以及在这巨变的时代,不变的本质是什么。

  
分享到:
做AI产品三年复盘,我看到的变与不变

3月12日,中科曙光宣布实现国产高端原生RDMA技术重大突破,正式发布首款全栈自研400G无损高速网络——scaleFabric。该产品基于原生RDMA架构,从底层的112G SerDes IP、硬件设备到上层的管理软件实现100%自主研发,填补了国内数据中心高速网络领域的空白,以比肩国际顶尖同类产品的性能表现,为超大规模智算集群铺就了一条高带宽、低时延、真无损、超可靠的“算力大动脉”。

  
分享到:
中科曙光scaleFabric首发:中国高端RDMA迈入自研时代

在搜索系统中, C++ 引擎长期扮演着底层核心基础设施的角色:性能敏感、逻辑复杂、变更频繁,同时承载着大规模线上流量的稳定运行。随着业务持续发展和技术架构不断演进,我们逐步意识到:在高频迭代背景下,回归能力也需要同步升级。本文将介绍这次能力升级的背景思考、核心设计思路以及落地实践。

  
分享到:
搜索C++引擎回归能力建设:从自测到工程化准出

当整个行业还在为PUE值降到1.2而沾沾自喜时,一个更加严苛的评估体系正在悄然兴起——CUE。这让我想起前不久参加的一个行业研讨会,几位来自头部云服务商的架构师都不约而同地提到了同一个观点:单纯追求PUE优化已经进入瓶颈期,真正的绿色数据中心必须从碳排放的全生命周期角度来重新审视。

  
分享到:
PUE已成过去式,CUE才是未来标杆?

本文介绍了基于spark 的离线反作弊挖掘框架,围绕解决的基本问题、工程设计亮点等展开。通过特征计算和配置化管理,提升了反作弊系统的检测效率和稳定性。展望未来,离线反作弊挖掘框架将持续演进,与更多智能算法、大模型和业务系统深度融合,不断完善检测能力和可用性。

  
分享到:
基于Spark的配置化离线反作弊系统

北京时间3月6日凌晨,OpenAI正式发布了下一代旗舰模型——GPT-5.4。这次不再是挤牙膏式的微调,而是一次真正的“代际跨越”。面对谷歌Gemini 3.1 Pro和Anthropic Claude Opus 4.6的步步紧逼,OpenAI用一款集推理、编程、原生电脑操控于一体的全能模型,宣告了谁才是真正的山顶玩家。

  
分享到:
打工人危!GPT-5.4 首次原生操控电脑,这根本不是AI,是数字打工人啊!

为什么有些短视频广告总能“刚好”出现?你刚搜完露营装备,立刻刷到户外电源广告——这并非巧合,也不只是简单的关键词匹配。在你看到广告之前,一套高度复杂的AI系统早已在幕后运转。它不再盲目推送素材,而是深入理解商品本身。今天,我们就拆解快手广告商品智能理解系统,看看那些“懂你”的广告,是如何炼成的。

  
分享到:
快手广告商品智能理解系统详解

近年来,搜索/推荐/广告系统在粗排与精排阶段的模型训练中,呈现出一个明确的趋势:从单目标优化转向多目标建模 + 多目标融合。模型目标多、融合公式复杂,给工程维护、算法迭代效率都带来了挑战。为了明文化直白展示公式全景、方便决策调参方向,直接配公式、线上自动算(既支持精排预估目标融合、也支持业务条件boost)。

  
分享到:
得物社区搜推公式融合调参框架实战

面对百度APP日均数千亿PV、超百PB数据规模带来的巨大挑战,我们完成了数据仓库的系统性升级。本文详细阐述了通过"两步走"策略解决资源压力、处理延迟和架构瓶颈的全过程:第一阶段聚焦日志清洗环节的稳定性与成本优化,第二阶段实现实时离线链路解耦、核心数据隔离及计算框架容错能力提升。

  
分享到:
日均千亿PV日志系统架构升级之路

技术的发展总是螺旋式上升的,当我们以为风冷已经足够应对数据中心散热需求时,AI浪潮的汹涌澎湃彻底打破了这个平衡。据IDC最新报告显示,到2025年,单机柜功率密度将普遍超过30kW,部分AI训练集群甚至达到100kW以上。传统风冷系统在这种功率密度下,不仅能耗惊人,更面临着物理极限的挑战。

  
分享到:
浸没式液冷模块化设计:让部署不再是

全球化数据中心网络设计是个复杂的系统工程,需要综合考虑技术、成本、合规等多个因素。随着5G、边缘计算等新技术的发展,网络架构还会持续演进。关键是要建立灵活可扩展的架构基础,为未来的业务发展留出足够的空间。

  
分享到:
全球化数据中心网络设计:三层架构破解跨洲延迟难题

以“融合 效能 安全——让AI‘+’出新活力”为主题的第四届北京人工智能产业创新发展大会在国家会议中心二期举办。本届大会由北京市科学技术委员会、中关村科技园区管理委员会,北京市经济和信息化局,北京市广播电视局,北京市政务服务和数据管理局,北京市门头沟区人民政府,华为技术有限公司联合主办。

  
分享到:
第四届北京人工智能产业创新发展大会成功举办

传统的测试手段,如单元测试、静态分析和人工代码审查,面对Linux内核这样千万行级别的庞大代码库时显得力不从心。尤其是在新内核版本频繁迭代的背景下,它们要么覆盖率不足,难以触及深层路径;要么误报率高,消耗大量人力进行验证。如何在短时间内高效、系统地发现和处理缺陷,成为内核研发团队面临的核心挑战。

  
分享到:
ABACI内核缺陷智能体:让模糊测试真正“自动化”

本系列文章基于 Lynxe 作者沈询的实战经验,深入浅出解析 ReAct Agent 的核心原理与工程价值,帮助开发者快速掌握从“写流程”到“造智能体”的关键跃迁。

  
分享到:
Agent vs 传统编程 vs Workflow 的本质区别

想象一下——周五晚上,你点击 Netflix 的播放按钮,后台数百个容器在几秒钟内迅速响应你的请求。对 Netflix 而言,高效扩展容器对于为全球数百万会员提供流畅的流媒体体验至关重要。为了应对如此庞大的规模,我们对容器运行时进行了现代化改造,却意外地遇到了一个瓶颈:CPU架构。

  
分享到:
Netflix的CPU架构瓶颈排查与修复实践