DTCC
DTCC
2022技术卓越奖评选
进化·智能·算赋新生 新华三智慧计算新品发布会
Amazon Redshift简化数据管道背后的技术逻辑
名人堂

关于性能方面,就像建筑设计成抗震9度需要额外的成本一样,高性能软件系统也意味着更高的实现成本,有时候与其他质量属性甚至

据调查,56%的组织面临至少四种不同类型的数据质量问题,而71%的组织面临至少三种不同类型的问题。组织在设计数据质量框架和解决数据质量问题时花费了大量时间和资源。但要获得良好的结果,了解这些问题的确切性质并首先确定它们如何最终出现在系统中是很重要的。

  
分享到:
谈谈12个最常见的数据质量问题及其来源

随着行业的快速发展和业务的高速迭代,数据量也呈爆炸式增长,传统的大数据架构在资源利用、高效运维、可观测性等方面存在诸多不足,已经越来越无法适应当下的发展需求。具体来讲,传统大数据架构主要存在以下几方面的问题

  
分享到:
一文了解——云原生大数据知识地图

关于性能方面,就像建筑设计成抗震9度需要额外的成本一样,高性能软件系统也意味着更高的实现成本,有时候与其他质量属性甚至会冲突,比如安全性、可扩展性、可观测性等等。大部分时候我们需要的是:在业务遇到瓶颈之前,利用常见的技术手段将系统优化到预期水平。

  
分享到:
CTO偷偷传我的系统性能优化十大绝招(万字干货)

个人理解的数据治理是整个数据相关组织架构以及各种活动能力的集合,因此,数据治理并不是单一组织或者系统能够完成的事情。数据治理和数据管理是分不开的,数据治理的职能是指导其他数据管理职能的执行,数据治理是在高层上执行的数据管理。

  
分享到:
腾讯数据治理技术实践

数据质量是基于大数据衍生的应用有效与否的重要的前提和保障之一。B站现在高速发展的业务需求以及未来能够依靠大数据孵化出更有深度和竞争力应用的愿景,都要求我们数据平台能够提供实时的、准确的、可以被各个业务方所信赖的数据。可以说,可信赖的数据,是大数据平台核心竞争力的体现。

  
分享到:
哔哩哔哩⼤数据建设之路——实时DQC篇

本节我们讨论的是字节实时数仓场景的初探以及遇到的问题和解决方案。坦白地讲,在最初落地时大家对数据湖能支持线上生产的态度都是存疑的,我们开始的方案也就比较保守。我们首先挑选一些对比现有解决方案,数据湖具有凸显的优势的场景,针对其中的一些痛点问题尝试小规模的落地。

  
分享到:
字节跳动数据湖在实时数仓中的实践

数字化转型趋势下,各行业领域的信息数据呈爆发式增长。随着人工智能、云计算、物联网、大数据等前端科技的不断发展和延伸,各科技产业呈现良好发展态势。基于此,IT168企业计算领域为大家奉上每月精选服务器、存储、数据中心等热点事件。接下来让我们看看2023年1月企业计算领域都发生了哪些新鲜事儿。

  
分享到:
一月一盘点:1月,那些您错过的服务器领域新鲜事儿

根据 Gartner 的数据质量市场调查,低质量数据每年使公司损失约 1500 万美元,那么如何通过创建有效的数据质量规则来提高数据质量呢。

  
分享到:
谈谈创建有效数据质量规则特别关注的5大要素

上次我们遇到了一个 MySQL 故障的事故,这次我又遇到了另外一个奇葩的问题:Keepalived 高可用组件的虚拟 IP 持续漂移,导致 MySQL 主从不断切换,进而导致 MySQL 主从数据同步失败。

  
分享到:
一次 Keepalived 高可用的事故,让我重学了一遍它

本文将分享领域知识增强的预训练语言模型在药电商搜索领域的实践。包括以下三大部分:1. 业务背景;2. 技术背景;3. 方法介绍。

  
分享到:
领域知识增强的预训练语言模型在药电商搜索领域的实践

近年来在数字化浪潮下,业财一体化本身也发生了很大变化,如BCG Platinion董事总经理陈果所说“从传统的横向维度实现业务交易和会计记账的整合,到实现纵向的交易与分析的整合”,在这个过程中,企业业财一体化的需求在变、面临的困难与挑战也在变。

  
分享到:
数字化转型:从业财融合到业业融合

本文介绍众安百亿级数据集成服务的架构实践,主要包括三个方面:数据集成及常见的技术;众安数据集成服务业务支持的情况;众安数据集成服务技术演进的路线。

  
分享到:
众安百亿级数据集成服务的架构实践

电商场景数据量大、业务复杂,搜索场景作为其中最为核心的流量分发与转化场域,更面临着诸多数据科学领域的问题与挑战。本文将分享京东零售搜索数据科学团队在电商搜索场景下的数据科学实践,主要介绍:1. 电商搜索场景的特点;2. 实验科学和因果推断实践;3. 观测指标设计和业务分析。

  
分享到:
京东零售在电商搜索场景下的数据科学实践

尽管很少有项目是完全失败,但只有少数IT和技术主导的转型项目能够完全实现其预期的价值。其中一些项目可能没有产生预期的回报,也有可能是一些项目没能满足用户需求,还有一些项目没有实现全部预期的功能。有多重相互关联的因素经常会导致IT项目无法实现其目标。以下是CIO在实施系统过程中常见的10个问题。

  
分享到:
数字化转型失败? CIO应当吸取的十大经验教训

大家好,我是来自飞猪推荐算法团队的里熙,今天给大家分享的是本团队在飞猪首页猜你喜欢推荐 Feeds 流的召回阶段做的一些优化工作。今天的分享主要包括三个部分:第一部分是相关的一些背景介绍,第二部分是目前飞猪首猜线上主流的一些召回方法,第三部分是本团队在飞猪首猜向量召回上做的一些实践和优化点。

  
分享到:
深度召回在飞猪旅行推荐系统中的探索和实践