- Apache Gravitino 在B站的优秀实践
随着数据湖大规模应用、AI 数据大量增长、数据安全与数据治理被更加被重视,我们难以基于原有的架构或组件实现一套统一的元数据管理系统,进而解决数据孤岛、统一权限,多维度数据治理等问题。因此,在 B 站 我们引入了 Gravitino,本次分享将介绍 Gravitino 在 b 站的优秀实践。
陶然 · 2024-12-17 14:00 - AIAPI - 转向AI原生检索
在RAG场景下,提出了一个既要又要的问题:一方面希望能够利用百度检索排序的优质策略,保证数据的高相关、高时效和多样性,为大模型提供完整的全文结构化内容;另一方面又希望用更低的检索成本、更高的时延要求给大模型的内容精细化组织预留足够的空间。
陶然 · 2024-12-17 09:54 - B站评论系统的多级存储架构
评论是 B站生态的重要组成部分,涵盖了 UP 主与用户的互动、平台内容的推荐与优化、社区文化建设以及用户情感满足。B站的评论区不仅是用户互动的核心场所,也是平台运营和用户粘性的关键因素之一,尤其是在与弹幕结合的情况下,成为平台的标志性特色。
陶然 · 2024-12-13 19:32 - 聚焦沟通:货拉拉自研客服IM系统实践
在快速变化的商业环境中,我们迫切需要高效的即时通讯工具来满足日益增长的沟通需求。尽管传统的第三方IM系统提供了基本的沟通功能,但其在灵活性和可定制性方面往往无法满足我们的特定要求。因此,我们自主研发了一款客服IM系统,经过三年的稳定运行,显著提升了沟通协作效率,更好地支持了业务发展。
陶然 · 2024-12-13 19:18 - 智简融媒 创新视听|华为助力传媒行业发展新质生产力
华为与传媒行业相关媒体一同走进“江苏有线广电光网络建设示范点”进行参观交流,感受华为技术在传媒行业的数智化创新应用。同期,华为中国政企互联网传媒行业总经理李腾、华为中国政企CMO邱恒与媒体进行了深入交流,介绍了华为在传媒行业的战略布局、技术创新及数智化应用成果,同时分享了华为对传媒及各行业激发新质生产力,实现高质量发展的深刻理解与实践经验。
陶然 · 2024-12-13 18:58 - 商业化大前端在性能优化领域的探索与实践
在业务飞速发展的过程中,用户体验是必不可少的一个环节,而页面性能是直接影响用户体验的重要因素。当页面加载时间过长、交互操作不流畅时,意味着业务可能会出现转化率降低、用户流失等业务问题。
陶然 · 2024-12-12 20:10 - MQ消息乱序问题解析与实战解决方案
在分布式系统中,消息队列(MQ)是实现系统解耦、异步通信的重要工具。然而,MQ消费时出现的消息乱序问题,经常会对业务逻辑的正确执行和系统稳定性产生不良影响。本文将详细探讨MQ消息乱序问题的根源,并提供一系列在实际应用中可行的解决方案。
陶然 · 2024-12-11 14:23 - 火山引擎ByteHouse:湖仓一体架构的创新与实践
ByteHouse 作为数据仓库关系数据库技术流派的代表,正是顺应了这一趋势。在接下来的讨论中,将更深入地探讨 ByteHouse 在湖仓一体方面的核心能力,以及在抖音集团内部的实践应用。
陶然 · 2024-12-11 09:44 - 云认证的可观测性体系建设
可观测性最早源于控制理论,是衡量一个系统从其外部输出中推断系统内部状态的一种度量,后被引申到计算机领域,用于表达系统故障的可观测性。一般来说, 可观测性有三大支柱:日志、链路和指标,这三部分各有侧重,相互交叉但又相对独立,它们一起组成了可观测性的基石。
陶然 · 2024-12-10 16:19 - B站大数据平台故障自愈实践
面对超大规模的集群、复杂的服务管理和异构环境,尤其是在任务运行时需要跨越多台乃至成百上千台机器的情况下,故障的及时发现与处理变得困难,这对系统的稳定性和效率构成了挑战。本文将具体讲述如何借助BMR智能运维平台中的故障自愈系统来迎接这一挑战。
陶然 · 2024-12-10 13:59 - 海量数据下的存算分离设计与实践
得物作为全球领先的潮流网购社区,日益增长的用户和数据带来了巨大的技术挑战。当前,得物的可观测性平台每天生成数PB级Trace数据和数万亿条Span记录,要求平台具备高效的实时处理能力和低成本的数据存储解决方案。
陶然 · 2024-12-09 09:30 - 基于集成网络的离线到在线强化学习
强化学习有两种基础的训练范式:在线强化学习和离线强化学习。在线强化学习需要让智能体和环境进行交互,利用收集到的数据同步进行训练,但在环境中进行探索的开销很大;离线强化学习不需要和环境交互,直接利用已有的离线数据进行训练,但这种范式训练的智能体会受限于离线数据的质量和覆盖范围。
陶然 · 2024-12-09 09:22 - 快手电商智能巡检平台的实践与探索
随着科技的飞速发展,人工智能(AI)已经成为推动各行各业创新的重要力量。特别是在用户体验方面,AI 技术的应用不仅解决了许多传统问题,还带来了全新的交互方式和更高的用户满意度。本文将从快手电商B端用户体验现状,快手电商提升体验的探索之路,未来展望3个方面,探讨 AI 在提升用户体验方面的巨大潜力及探索实践。
陶然 · 2024-12-04 10:56 - 商业银行对象存储的多中心多活架构设计
随着云计算、大数据和移动互联网技术的迅猛发展,数据已成为企业核心资产。确保数据的安全性和可靠性成为企业关注的重点问题。对象存储技术以其高可用性、良好的扩展性和成本效益,逐渐成为企业数据存储的首选。然而,面对硬件故障、自然灾害等潜在风险,对象存储的数据安全面临挑战。
陶然 · 2024-12-03 23:22 - WASM助力WebCodecs:填补解封装能力的空白
在B站Web投稿页中,封面、分区、标签的推荐功能都需要使用到视频截帧能力。历史上我们通过WebAssembly + FFmpeg来实现视频截帧。从去年开始,开始引入WebCodecs进行高性能截帧,截帧性能有显著提升,从而给用户带来更快速的推荐体验。
陶然 · 2024-12-03 23:16 - B站创作端接入自研剪辑引擎
B站创作端承载了稿件生产的职能,而创作工具是稿件生产的首个环节,承担了Up主最重要的丰富视频内容、提高视频质量的职责,创端提供了基础剪辑能力、智能成片、AI玩法、视频模板等生产工具,适用于不同剪辑场景,服务于不同创作能力的Up主,帮助Up主锦上添花,并持续提升有消费价值的稿件量。
陶然 · 2024-12-02 15:23 - 京东零售推荐系统可解释能力详解
本文将介绍可解释能力在京东零售推荐系统中的应用实践。主要内容包括以下几大部分:推荐系统可解释定义、系统架构、排序可解释、模型可解释、流量可解释。
陶然 · 2024-12-02 09:58 - OCR在货拉拉业务场景中的探索与实践
OCR不仅能够识别票据和证件上的关键信息,还能准确识别车辆上的车牌号,实现数据的自动化录入和管理,从而大幅提升工作效率。这种技术的应用让企业能够更加灵活和高效地处理大量信息,减少了人工干预的必要性。
陶然 · 2024-11-28 14:47 - 抖音集团大数据血缘演进与深度应用
数据资产管理平台是抖音集团在复杂业务场景中思考的新方向,本文将简单介绍“抖音集团数据资产管理平台”全貌,启发大家对于元数据以及数据资的全新思考,让大家以更宏观视角认识血缘,并对于建设好数据血缘,提供一些建设性思路。
陶然 · 2024-11-28 10:14 - 11.11大促背后的技术保障:SLA与SLO的深度解析与实践案例
又到一年的11.11大促日,最近很多团队邮件上下游确认SLA,你是不是还没搞明白服务质量SLA、SLO等概念?本文通过理论知识以及基于SLO告警治理的实践经验分享。详细介绍如何设置SLO、有效的告警泛滥治理、以及如何根据SLO的指标来优化服务性能和可靠性。
陶然 · 2024-11-27 10:41