服务器 频道
  • 腾讯数据治理技术实践

    个人理解的数据治理是整个数据相关组织架构以及各种活动能力的集合,因此,数据治理并不是单一组织或者系统能够完成的事情。数据治理和数据管理是分不开的,数据治理的职能是指导其他数据管理职能的执行,数据治理是在高层上执行的数据管理。

    陶然 · 2023-02-01 16:04
  • 哔哩哔哩⼤数据建设之路——实时DQC篇

    数据质量是基于大数据衍生的应用有效与否的重要的前提和保障之一。B站现在高速发展的业务需求以及未来能够依靠大数据孵化出更有深度和竞争力应用的愿景,都要求我们数据平台能够提供实时的、准确的、可以被各个业务方所信赖的数据。可以说,可信赖的数据,是大数据平台核心竞争力的体现。

    陶然 · 2023-02-01 11:08
  • 字节跳动数据湖在实时数仓中的实践

    本节我们讨论的是字节实时数仓场景的初探以及遇到的问题和解决方案。坦白地讲,在最初落地时大家对数据湖能支持线上生产的态度都是存疑的,我们开始的方案也就比较保守。我们首先挑选一些对比现有解决方案,数据湖具有凸显的优势的场景,针对其中的一些痛点问题尝试小规模的落地。

    陶然 · 2023-02-01 10:17
  • 谈谈创建有效数据质量规则特别关注的5大要素

    根据 Gartner 的数据质量市场调查,低质量数据每年使公司损失约 1500 万美元,那么如何通过创建有效的数据质量规则来提高数据质量呢。

    陶然 · 2023-01-31 14:20
  • 一次 Keepalived 高可用的事故,让我重学了一遍它

    上次我们遇到了一个 MySQL 故障的事故,这次我又遇到了另外一个奇葩的问题:Keepalived 高可用组件的虚拟 IP 持续漂移,导致 MySQL 主从不断切换,进而导致 MySQL 主从数据同步失败。

    陶然 · 2023-01-31 11:10
  • 领域知识增强的预训练语言模型在药电商搜索领域的实践

    本文将分享领域知识增强的预训练语言模型在药电商搜索领域的实践。包括以下三大部分:1. 业务背景;2. 技术背景;3. 方法介绍。

    陶然 · 2023-01-31 10:43
  • 数字化转型:从业财融合到业业融合

    近年来在数字化浪潮下,业财一体化本身也发生了很大变化,如BCG Platinion董事总经理陈果所说“从传统的横向维度实现业务交易和会计记账的整合,到实现纵向的交易与分析的整合”,在这个过程中,企业业财一体化的需求在变、面临的困难与挑战也在变。

    陶然 · 2023-01-30 15:48
  • 众安百亿级数据集成服务的架构实践

    本文介绍众安百亿级数据集成服务的架构实践,主要包括三个方面:数据集成及常见的技术;众安数据集成服务业务支持的情况;众安数据集成服务技术演进的路线。

    陶然 · 2023-01-30 11:03
  • 京东零售在电商搜索场景下的数据科学实践

    电商场景数据量大、业务复杂,搜索场景作为其中最为核心的流量分发与转化场域,更面临着诸多数据科学领域的问题与挑战。本文将分享京东零售搜索数据科学团队在电商搜索场景下的数据科学实践,主要介绍:1. 电商搜索场景的特点;2. 实验科学和因果推断实践;3. 观测指标设计和业务分析。

    陶然 · 2023-01-30 10:00
  • 数字化转型失败? CIO应当吸取的十大经验教训

    尽管很少有项目是完全失败,但只有少数IT和技术主导的转型项目能够完全实现其预期的价值。其中一些项目可能没有产生预期的回报,也有可能是一些项目没能满足用户需求,还有一些项目没有实现全部预期的功能。有多重相互关联的因素经常会导致IT项目无法实现其目标。以下是CIO在实施系统过程中常见的10个问题。

    陶然 · 2023-01-29 14:17
  • 深度召回在飞猪旅行推荐系统中的探索和实践

    大家好,我是来自飞猪推荐算法团队的里熙,今天给大家分享的是本团队在飞猪首页猜你喜欢推荐 Feeds 流的召回阶段做的一些优化工作。今天的分享主要包括三个部分:第一部分是相关的一些背景介绍,第二部分是目前飞猪首猜线上主流的一些召回方法,第三部分是本团队在飞猪首猜向量召回上做的一些实践和优化点。

    陶然 · 2023-01-29 11:00
  • 难住了,微服务之间的调用方式哪种更优?

    在微服务架构中,需要调用很多服务才能完成一项功能。服务之间如何互相调用就变成微服务架构中的一个关键问题。服务调用有两种方式,一种是RPC方式,另一种是事件驱动(Event-driven)方式,也就是发消息方式。消息方式是松耦合方式,比紧耦合的RPC方式要优越,但RPC方式如果用在适合的场景也有它的一席之地。我们总在谈耦合,那么耦合到底意味着什么呢?

    陶然 · 2023-01-29 10:04
  • 京东零售基于NLP的风控算法模型构建实践

    本团队主要负责京东零售领域的风控算法模型构建,针对京东零售风控方面,业务要求不断地更新、模型失效快、更新迭代慢以及成本高昂等情况,我们提出了自己设计研发的 NLP 预训练架构模型和用户行为预训练模型,并进行预训练模型的平台化,方便一键部署开发,快速迭代,简单易用,推理速度提升等,有效解决了业务问题,并在公开数据集上也得到了很好的效果。

    陶然 · 2023-01-28 14:23
  • 一文详解BI平台——火山引擎DataWind架构和实践

    DataWind覆盖的人群非常广泛,几乎支持字节跳动内部所有业务线,覆盖绝大多数员工使用需求,每天运行20万张以上活跃的仪表盘,支持超过500万次巨大数据量的查询,每天有超过5万人在使用 DataWind。

    陶然 · 2023-01-28 10:53
  • 创业之路的故事|如何设计一个用户系统

    总结一下前边的模型,简化下来就是下图的关系,登录名就是标识,系统用来判定实际是谁在注册,用登录名登录后,可以选择一个身份在系统中操作,可以是卖家(经营店铺),也可以是买家(逛店+购物),还可以是客服(负责与买家沟通,处理异常订单)。

    陶然 · 2023-01-28 09:55
  • 达达快送小程序性能优化实践

    达达集团是中国领先的本地即时零售与配送平台,达达快送小程序作为公司重要的 ToC 业务入口,对外提供帮取帮送、跑腿帮买、帮排队等服务,承担了 ToC 业务较高部分的订单量。对于小程序而言,性能至关重要。

    陶然 · 2023-01-19 15:33
  • 小红书社区反作弊探索与实践

    导读:本文主题是小红书社区反作弊探索与实践,主要讨论业务风控工作落地的解题思路。今天的分享会围绕下面四点展开:社区反作弊的意义;社区黑灰产生态;作弊防控策略;社区反作弊实践。

    陶然 · 2023-01-19 11:18
  • RTA如何做用户粒度的运营|得物技术

    在刚过去不久的双十一和即将到来的双十二大促期间,都是电商圈买量最热闹的时候,买量的疯狂,卖量的也奔放,广告人为了迎接一年一度的预算高峰,纷纷拼了命地在各家APP里堆满了广告。得物的RTA业务已经覆盖了市场主流的十多家广告平台,那么得物是如何通过RTA的方式进行精细化投放和用户粒度的运营呢?

    陶然 · 2023-01-19 11:01
  • 10亿月活用户下,快手基于CNCF Dragonfly的超大规模镜像分发实践

    快手容器云平台旨在为快手不断增长、不断变化和多样化的业务,提供基于容器化部署的超大规模基础设施服务。为了实现这一目标,快手工程师需要解决弹性、稳定性、效率和无服务器架构等挑战,在这些挑战中,镜像分发的稳定性和效率也是最棘手的问题之一。

    陶然 · 2023-01-18 16:02
  • 网易云音乐全链路埋点管理平台建设

    在文章云音乐曙光埋点:还原数据理想国中,我们介绍了曙光埋点项目方案,该方案基于多端一致埋点对象树建设管理,实现了统一自动化埋点和链路追踪,方案高度还原了大前端埋点的理想状态、具备较强通用性和扩展性。我们围绕这套埋点方案研发了配套的埋点管理系统,以承载及埋点规则数据管理、埋点设计、埋点研发、埋点测试、埋点上线等功能,本文主要介绍该平台功能及建设思路。

    陶然 · 2023-01-18 15:21