- 百度网盘防雪崩架构实践
大模型在研发效能领域代码生成方面发挥了越来越大的作用,而大模型的预训练依赖大量的精标代码,这些精标数据必须是比较好的工程实践代码,这些比较好的工程实践代码,需要大量的技术沉淀,包括工程架构,代码架构等多纬度,涉及性能、可用性、扩展性、安全等方向,百度网盘有不少比较好的工程实践,本文主要是介绍百度网盘工程架构中的防雪崩架构。
陶然 · 2025-02-20 13:59 - 货拉拉 API 异常流量检测实践
API(应用程序编程接口)在企业信息流通以及应用程序和系统之间的连接中扮演着重要的角色,随着企业业务的不断拓展,越来越多的攻击者通过攻击 API 来达到破坏信息系统和窃取数据的目的,API 逐渐成为一个巨大的风险敞口来源之一。本文将从流量分析角度切入,简要阐述 API 异常流量检测的实践过程。
陶然 · 2025-02-18 17:30 - 数据中心空气冷却系统的能效指标ECR
数据中心空气冷却系统能效指标ECR的提出,该指标完善了机房环境-制冷系统-数据中心的能效评价体系,对数据中心的可持续发展具有重要的指导意义,具备广泛的推广和应用潜力。
陶然 · 2025-02-17 16:19 - 货拉拉资损防控智能化平台建设实践
资损防控是业务稳定性保障的重要一环,资损防控治理主要分为增量场景和存量场景。在存量场景中,业务研发从现有业务场景入手,进行各业务模块的资损场景的梳理,将可能出现资损的场景梳理出来。
陶然 · 2025-02-14 15:45 - 爱奇艺的接口治理与自动化测试一体化解决方案实践
随着云原生和微服务架构的普及,公司许多服务也转向了微服务模式,以满足业务的高速发展和高流量调用需求。然而,微服务的拆分导致API数量的爆发式增长,使得接口管理和接口质量保障的问题更加凸显,具体体现在以下几个方面:
陶然 · 2025-02-14 09:57 - 快手Java透明协程:实现零代码修改提升30%%QPS
对于开发者而言,传统线程模型逻辑直观但性能受限,而异步模型虽性能高却复杂性大。协程以“同步编程,异步执行”平衡两者,成为现代语言标配。结合自身业务需求,快手基于社区开源版本自研了Java17透明协程技术,实现对业务无侵入的同时,吞吐能力提升30%%以上。本文将深入剖析快手协程技术的背后原理与架构演进。
陶然 · 2025-02-13 10:09 - 以抖音集团信息流推荐场景为例|如何做复杂的AB实验设计?
本文将以短视频平台的信息流推荐场景为例,结合相关团队在推荐场景开展A/B测试的实践经验,详解其复杂原理,并重点聚焦双边效应、网络效应问题,分享其对应的双边实验、社区分流实验设计思路。
陶然 · 2025-02-13 09:34 - DeepSeek-V3 高效训练关键技术分析
本文从模型架构、并行策略、通信优化和显存优化四个方面展开,深入分析了DeepSeek-V3高效训练的关键技术,探讨其如何以仅5%%的算力实现对标GPT-4o的性能。
陶然 · 2025-02-11 14:05 - S型智能增长曲线:从Deepseek R1看Scaling Law的未来
本文后面打算用S型智能增长曲线来解释我们目前看到的Scaling Law的一些现象。其实智能发展应该遵循S型曲线,这不是新观点,LLM最大的反对派Lecun和第二大反对派马库斯,去年在Twitter上就反复提过这个观点,以此作为否定LLM未来发展的重要依据。
陶然 · 2025-02-11 09:57 - 网易实践:用Apache Kyuubi构建云原生Spark网关
本文基于网易数帆软件工程师、Apache Kyuubi/Zeppelin PMC 成员潘成老师的分享整理汇总。通过本文,可以从网易在 Spark 服务化的经验中,学习如何使用 Apache Kyuubi 构建统一的 Spark 网关,既满足业务团队多样的 Spark 使用方式,又可以适配不同基础设施环境中多样的 Spark 部署方式。
陶然 · 2025-02-10 14:06 - 大白话说清楚DeepSeek的蒸馏技术到底是什么?
DeepSeek R1火了之后,模型蒸馏这个词儿也跟着火了。一方面,OpenAI暗戳戳的(其实已经算明指了)表示DeepSeek就是用GPT的数据来做的蒸馏(别人说你起诉啊,OpenAI又说不);另一方面,的确真有很多知名的公司利用R1版模型蒸馏出更多小模型,有基于Llama的,也有基于Qwen的,效果都不错。
陶然 · 2025-02-10 10:12 - 专有云ABC Stack面向企业级智算平台的GPU提效实践
从「建好」到「用好」,企业级智算平台借助专有云 ABC Stack 的 GPU 提效服务,应对大模型业务挑战,唤醒 AI 算力,加速 AI 原生业务的落地。
陶然 · 2025-02-07 15:16 - B站自研的第二代视频连麦系统(上)
本系列文章将从客户端、服务器以及音视频编码优化三个层面,介绍如何基于WebRTC构建视频连麦系统。希望通过这一系列的讲解,帮助开发者更全面地了解 WebRTC 的核心技术与实践应用。
陶然 · 2025-02-07 13:58 - 十亿级订单系统的数据库查询性能优化之路
系统概要:BIP采购系统用于京东采销部门向供应商采购商品,并且提供了多种创建采购单的方式以及采购单审批、回告、下传回传等业务功能。系统价值:向供应商采购商品增加库存,满足库存周转及客户订单的销售,供应链最重要的第一环节
陶然 · 2025-02-05 16:22 - 提示词工程的十大认知误区
在系统学习了大量提示词教程并进行不断实践后,我发现很多人对提示词工程的认知存在诸多误解。本文将列举一些提示工程认知和创作方面的认知误区,并分享我的一些见解,希望能够为读者提供启发。
陶然 · 2025-02-05 10:16 - 视频 CDN 融合资源的调度策略探索落地
随着 B 站直播常量用户带宽需求增多,结合自身的直播流模型,进一步推动了 CDN 边缘节点的基建工作,这些节点具有很大的异构性,能力差距大,价格不一,计费方式不同。如何利用这些异构资源,在保障稳定性的前提下,在成本和质量之间做好动态平衡,是我们需要解决的问题。
陶然 · 2025-01-24 16:37