- DeepSeek-V3 高效训练关键技术分析
本文从模型架构、并行策略、通信优化和显存优化四个方面展开,深入分析了DeepSeek-V3高效训练的关键技术,探讨其如何以仅5%%的算力实现对标GPT-4o的性能。
陶然 · 2025-02-11 14:05 - S型智能增长曲线:从Deepseek R1看Scaling Law的未来
本文后面打算用S型智能增长曲线来解释我们目前看到的Scaling Law的一些现象。其实智能发展应该遵循S型曲线,这不是新观点,LLM最大的反对派Lecun和第二大反对派马库斯,去年在Twitter上就反复提过这个观点,以此作为否定LLM未来发展的重要依据。
陶然 · 2025-02-11 09:57 - 网易实践:用Apache Kyuubi构建云原生Spark网关
本文基于网易数帆软件工程师、Apache Kyuubi/Zeppelin PMC 成员潘成老师的分享整理汇总。通过本文,可以从网易在 Spark 服务化的经验中,学习如何使用 Apache Kyuubi 构建统一的 Spark 网关,既满足业务团队多样的 Spark 使用方式,又可以适配不同基础设施环境中多样的 Spark 部署方式。
陶然 · 2025-02-10 14:06 - 大白话说清楚DeepSeek的蒸馏技术到底是什么?
DeepSeek R1火了之后,模型蒸馏这个词儿也跟着火了。一方面,OpenAI暗戳戳的(其实已经算明指了)表示DeepSeek就是用GPT的数据来做的蒸馏(别人说你起诉啊,OpenAI又说不);另一方面,的确真有很多知名的公司利用R1版模型蒸馏出更多小模型,有基于Llama的,也有基于Qwen的,效果都不错。
陶然 · 2025-02-10 10:12 - 专有云ABC Stack面向企业级智算平台的GPU提效实践
从「建好」到「用好」,企业级智算平台借助专有云 ABC Stack 的 GPU 提效服务,应对大模型业务挑战,唤醒 AI 算力,加速 AI 原生业务的落地。
陶然 · 2025-02-07 15:16 - B站自研的第二代视频连麦系统(上)
本系列文章将从客户端、服务器以及音视频编码优化三个层面,介绍如何基于WebRTC构建视频连麦系统。希望通过这一系列的讲解,帮助开发者更全面地了解 WebRTC 的核心技术与实践应用。
陶然 · 2025-02-07 13:58 - 十亿级订单系统的数据库查询性能优化之路
系统概要:BIP采购系统用于京东采销部门向供应商采购商品,并且提供了多种创建采购单的方式以及采购单审批、回告、下传回传等业务功能。系统价值:向供应商采购商品增加库存,满足库存周转及客户订单的销售,供应链最重要的第一环节
陶然 · 2025-02-05 16:22 - 提示词工程的十大认知误区
在系统学习了大量提示词教程并进行不断实践后,我发现很多人对提示词工程的认知存在诸多误解。本文将列举一些提示工程认知和创作方面的认知误区,并分享我的一些见解,希望能够为读者提供启发。
陶然 · 2025-02-05 10:16 - 视频 CDN 融合资源的调度策略探索落地
随着 B 站直播常量用户带宽需求增多,结合自身的直播流模型,进一步推动了 CDN 边缘节点的基建工作,这些节点具有很大的异构性,能力差距大,价格不一,计费方式不同。如何利用这些异构资源,在保障稳定性的前提下,在成本和质量之间做好动态平衡,是我们需要解决的问题。
陶然 · 2025-01-24 16:37 - 存储创新+可持续发展,勾勒2025年人工智能发展新蓝图
2024年见证了数字化力量的觉醒和壮大,2025年将会以怎样的方式展开呢?如果说2024年是数据应用处处生花的一年,那么2025年,受人工智能(AI)和相关技术应用的加速普及以及数据跨行业应用的激增,将是数智时代走向成熟稳健的关键一年。基于对数字经济技术变革以及发展趋势等方面的深刻理解,希捷对2025年的数据存储市场做出如下展望。
陶然 · 2025-01-24 12:47 - 货拉拉H5页面性能测试实践
H5开发因其跨平台兼容性而备受青睐,为了支持业务的快速发展,H5页面在应用程序中的使用比例不断增加。随着应用不断丰富的功能,H5页面的复杂度也随之提升,这对应用的性能以及质量保障工作提出了更高的要求。
陶然 · 2025-01-24 10:28 - 云数仓ByteHouse的湖仓一体设计与实践
本文将聚焦湖仓一体主题,在简单介绍ByteHouse产品基础上,详解当代分析平台的挑战与ByteHouse一体化理念、ByteHouse湖仓一体的核心能力及优秀实践。
陶然 · 2025-01-24 09:48 - 某大型制造集团的Power BI国产化替换实践
为探索中国企业在国产BI工具替换过程中的有效策略与实践路径,小编转载了意臣科技近期发布的一篇关于国产BI产品成功替换的案例。希望通过这一实例,能够为正在考虑或正在进行国产化数据分析工具选型的企业提供宝贵的参考和启示。
陶然 · 2025-01-23 14:17 - 货运AI安全防控——违规载人治理
如何有效提升货运安全性成为了行业亟待解决的问题。随着人工智能技术的不断进步,AI为货运安全防控提供了新的解决思路。接下来将详细介绍货运安全防控的挑战和解决思路。
陶然 · 2025-01-23 10:18 - 高并发场景下的库存管理,理论与实战能否兼得?
随着互联网业务的不断发展,选择在网上购物的人群不断增加,这种情况下,会衍生出一些促销活动,类似抢购场景或者热销热卖场景,在高峰时段的下单数量会非常大,也意味着对数据库中畅销商品的库存操作十分频繁,需要频繁查库存和更新库存。
陶然 · 2025-01-22 15:44 - B站评论系统背后的多级存储架构,原来流畅是这样炼成的
评论系统对缓存命中率要求非常高,一旦发生缓存失效,大量请求会直接访问 TiDB,如果 TiDB 出现问题,将导致评论服务不可用。所以评论需要构建一套可靠的容灾系统,并具备自动降级能力,以提升评论服务的整体稳定性。
陶然 · 2025-01-22 10:02