服务器 频道
  • 异常检测算法在可观测性平台的落地和实践

    在稳定性保证中,重要的一个环节就是故障管理体系建设,故障管理体系的四大核心功能——故障发现、故障触达、故障定位和故障恢复,其中故障发现作为故障管理的第一步至关重要,包含了指标预测、异常检测和故障预测等方面,主要目标是能及时、准确地发现故障。

    陶然 · 2024-07-22 13:59
  • 大语言模型在推荐系统中的探索与应用

    来自华为诺亚方舟实验室的王奕超老师今天给我们带来了关于大语言模型在推荐系统中的探索与应用的分享,将从数据、模型和流程三个层面展开,介绍华为在推荐系统领域的两个重要项目,并回答关于用户推理知识构造、特征交叉和在线服务流程的具体问题。通过这些前瞻性的探索和应用,推荐系统的性能和用户体验有望得到显著提升。

    陶然 · 2024-07-22 09:55
  • 广告营销多智能体架构落地全攻略

    在AI Native时代,广告营销平台经历了根本性的变革,这些变化不仅提升了广告的效率和精准度,还重塑了广告行业的整体运作方式。其中,强大的广告营销智能体是下一代商业广告平台面向客户交付商业价值的首要载体。进一步,生成式AI又是广告营销智能体的内核及灵魂,真正达成让客户放开说、简单用、都搞定的极致体验。

    陶然 · 2024-07-19 14:14
  • B站一站式大数据集群管理平台(BMR)初窥

    大数据服务是数据平台建设的基座,随着B站业务的快速发展,其大数据的规模和复杂度也突飞猛进,技术的追求也同样不会有止境。B站一站式大数据集群管理平台(BMR),在千呼万唤中孕育而生。本文简单介绍BMR的由来、面临的主要矛盾以及如何在变化中求得生存与发展。

    陶然 · 2024-07-19 13:51
  • 转转上门履约服务拆分库表迁移实践

    随着业务不断发展,一个服务中部分功能模块适合沉淀下来作为通用的基础能力。作为通用的基础能力,对提供的服务可用性和稳定性有较高的要求,因此把该部分功能模块拆分出来,单独一个服务是比较好的选择。为了更好的与业务服务物理隔离,不仅需要从代码层面拆分,数据库层面也需要拆分。

    陶然 · 2024-07-18 09:50
  • 图技术在金融反欺诈中的应用

    在金融信贷领域,随着黑产的欺诈能力不断升级,黑产的欺诈方式已经从早期的个体欺诈发展到了聚集性欺诈,并且从早先的单一欺诈模式演化出各种复杂多变的欺诈模式,形成了完整的黑色产业链,严重扰乱了正常金融秩序,给反欺诈风控造成了极大的压力。

    陶然 · 2024-07-17 09:56
  • 字节跳动基于TrafficRoute DNS的超千亿级调度解析优化实践

    在直播CDN、静态CDN和动态CDN等泛CDN边缘接入场景中,通常采用DNS来作为边缘第一层的接入调度。由于边缘接入点分布广泛且容易受到外部环境的影响,导致接入点频繁变动,因此,在泛CDN环境中,DNS的基础调度功能显得尤为关键。

    陶然 · 2024-07-16 10:29
  • 百度智能云网络故障定位的智能运维实践

    近期,更是将大模型成功引入物理网络的故障定位中。相比过去传统的定位分析方法,大模型给网络故障定位的能力建设带来了很多改变。接下来我们将简单介绍百度智能云在物理网络故障定位的发展历程,然后详细分享如何基于大模型进行故障定位的最新实践。

    陶然 · 2024-07-16 10:11
  • 聚焦电商场景,详解抖音集团埋点及归因分析方案

    本文将聚焦电商场景,介绍抖音集团埋点历程、电商场景解决方案、归因实践及其收益等模块,旨在为数据技术人员在埋点后数据加工过程中所遇到的问题提供有益思路。

    陶然 · 2024-07-15 14:56
  • 研发视角浅谈R2流量回放测试

    测试小伙伴们在2023年保障了团队线上系统0问题,这简直就是一项了不起的壮举!这得益于咱们测试组同事对工作的细致投入、风险把控、以及严格遵循流程规范进行测试用例评审、自动化建设、联调推动、回归验证、常态化压测、大促高保真压测、引流回放等多重保险策略工作。

    陶然 · 2024-07-15 10:25
  • 指标归因在互联网平台的应用

    大家在工作中经常会看很多的报表,在查看报表的过程中会发现指标并不是稳定不变的,而是可能会有各种各样的变化,比如下降、上升或者突变。指标的波动其实反映的是业务的实际波动。

    陶然 · 2024-07-15 09:40
  • 3个企业级优秀实践,教你ByteHouse云数仓这么用

    随着各业务场景各行业数字化转型加快,数据量呈爆炸式增长。在拥有庞大数据的同时,业务也在分析、查询与响应层面,对数据库系统性能提出了更高要求。云原生技术推动了分布式数据库系统的迭代升级,对云数仓技术而言,“写入能力、高性能查询、高并发、架构精简、成本控制”的一系列挑战,是其在发展中亟待解决的难题。

    陶然 · 2024-07-12 10:32
  • 性能炸裂的ClickHouse,入坑后会遇到哪些难题?

    ClickHouse是一款开源的列式数据库管理系统,适用于在线分析处理(OLAP)场景,本文通过介绍ClickHouse,帮助读者今后快速地处理大规模数据,并获得实时的分析结果,为业务提供有力支持。

    陶然 · 2024-07-11 13:44
  • 彻底解决网络哈希冲突,百度百舸的高性能网络HPN落地实践

    GPU 的通信性能对于大模型的训练有着至关重要的影响。在 HPN 网络工程实践中,我们的核心关注点是如何充分利用网络硬件资源的能力,将通信性能最大化,从而提升大模型端到端的训练性能。

    陶然 · 2024-07-11 10:05
  • 新一代云数仓必不可少的五大核心能力

    从数据库领域的发展历程来看,分析型数据库已有40多年的发展历史,与数据库基本同时代。从OLTP和OLAP的分支来看,分析型数据库支持了海量数据规模下的聚合性分析。随着移动互联网甚至AI等领域的发展,用户画像行为分析的重要性日益凸显,而这些都离不开分析型数据库的支撑。

    陶然 · 2024-07-10 14:11
  • AI绘图实践:用人工智能生图助力618大促

    现在各种AI大模型大行其道,前有GhatGPT颠覆了我们对对话型AI的原有印象,后有Sora文生视频,让我们看到了利用AI进行创意创作的无限可能性。如今各大公司和团队都争相提出自己的大模型,各种网页端和软件应用也极大地降低了我们使用AI作为生产力的门槛。

    陶然 · 2024-07-10 09:48
  • 点播CDN回源标准化策略

    回源标准化的过程持续了大半年,虽然遇到了各种各样的问题,方案也在逐步演进,好在方案得以初步实现,向着符合预期的方向前进,总体上完成了大部分的功能,接下来我们将会继续站在资源运营的角度上优化各类资源,让点播的CDN业务更加稳定可靠。

    陶然 · 2024-07-09 16:12
  • 百度Feed业务数仓建模实践

    Feed,即个性化推荐信息流,是百度 App 上承载各种类型内容(如文章、视频、图集等)的重要 topic。本文概要讲述了随着业务发展,移动生态数据研发部在 Feed 数据宽表建模上的演进过程以及一些实践:整合流量、内容、用户等数据,建设多版本宽表,实现 feed 数仓的一致性,简化数仓取数逻辑,降低成本提升效率。

    陶然 · 2024-07-09 10:45
  • 大模型微调方案设计和能力整合

    在构建大型模型应用时,技术架构的规划至关重要。整体架构可被划分为四个层次:基础设施层、模型工具层、模型引擎层及大模型应用层。基础设施层:涵盖了数据服务、云平台及开源社区等多个方面,为应用开发提供坚实的基础。

    陶然 · 2024-07-08 11:12
  • Instagram如何扩展支撑25亿用户的基础架构?

    本文概述Instagram如何扩展其基础设施,主要基于笔者研究,可能与实际实践情况有所差异。从前,两位斯坦福大学毕业生决定制作一款实现位置签到功能的应用程序。然而,他们注意到,该应用中使用最频繁的功能是“照片共享”,所以他们转而创建了一款照片分享应用,并将其命名为Instagram。

    陶然 · 2024-07-08 09:55