一、背景
货拉拉是一家专注于货运行业的科技公司,主要业务是提供在线货运服务,包括同城/跨城货运、企业版物流搬家、零担等。货拉拉每天需要处理大量的业务数据,以便更好地理解用户需求,优化服务,提高运营效率。
二、目标
基于上述背景,货拉拉大数据团队自研了指标库平台。通过指标库可以帮助公司管理、分析和应用核心业务指标,从而为决策提供支持。构建指标库的目标主要有以下几点:
1. 数据驱动决策:在数字化时代,数据已经成为企业决策的重要依据。通过搭建指标库,货拉拉可以更好地利用数据,进行数据驱动的决策。
2. 提高运营效率:通过指标库,货拉拉可以实时监控业务运行情况,及时发现问题,快速做出调整,提高运营效率。
3. 优化服务:通过分析指标库中的数据,货拉拉可以了解用户的需求和行为,从而优化服务,提高用户满意度。
4. 支持业务发展:指标库可以帮助货拉拉了解业务发展情况,支持业务战略的制定和执行。因此,构建指标库是货拉拉在数据驱动战略下的重要举措。
三、系统概述
指标库是一个系统化、结构化的指标元信息管理平台,它包含了一组用于度量和评估业务性能、进度、结果等各个方面的指标。这些指标可以是原子指标,也可以是由一个或多个原子指标经过特定计算和处理得到的应用指标。指标库的主要目的是为业务决策提供数据支持和依据。通过对指标库中的指标进行分析和比较,可以了解和评估业务的状况和发展趋势,发现业务的问题和机会,制定和调整业务策略和计划。指标库平台通常包含以下几个核心概念:
1. 指标定义:包括指标的名称、含义、计算公式、数据源等信息。
2. 指标分类:根据指标的性质和用途,将指标分为不同的类别,如财务指标、营销指标、生产指标等。
3. 指标数据:包括指标的历史数据和当前数据,用于计算和分析指标。
4. 指标分析:包括对指标数据的分析结果和报告,用于解释和评估指标。
四、指标定义
应用指标是由原子指标或者其他应用指标经过一定的计算和处理得到的,用于满足特定业务需求和分析目标的指标。应用指标的组成通常包括以下几个部分:
原子指标
原子指标是构建应用指标的基石,是基本、最核心的业务数据度量,直接反映了业务的基本情况和趋势。它们具有直观的展示业务基本状况、组合性和可计算性,通过组合和计算,可以构建出更复杂、更高级的复合指标,为业务决策提供更丰富、更精准的数据支持。因此,原子指标对于业务决策和策略制定具有重要的参考价值。
修饰词
修饰词用于限定业务活动的范围,如时间范围、地域范围、业务范围等。例如,可以用来描述指标的地域范围,如“全国”、“地区”、“城市”等,这样可以帮助我们更具体地理解和解释指标在不同地域的表现和差异。总的来说,修饰词可以帮助我们更准确、更具体地理解和解释指标的含义和用途,使指标更具有针对性和实用性,更能满足不同的业务需求和分析目标。
统计周期
统计周期是用于计算和分析应用指标的数据的时间范围,它是数据分析的重要组成部分。统计周期可以是日、周、月、季度、年等不同的时间单位,也可以是特定的业务周期,如产品生命周期、项目周期等。这种时间范围的设定,对于应用指标的计算结果和业务分析具有重要的影响。选择合适的统计周期,可以帮助我们更准确地理解和解释应用指标的变化和趋势。例如,如果我们选择的是日统计周期,那么我们可以更清晰地看到业务在每天的变化;如果我们选择的是月统计周期,那么我们可以更明显地看到业务在每个月的表现和趋势。因此,选择合适的统计周期,既要考虑到应用指标的计算需求,也要考虑到业务分析的需求,以确保我们能够准确地理解和解释应用指标的变化和趋势,从而做出正确的业务决策。
指标元信息
指标元信息是一种用于解释和说明应用指标的工具,它包括指标的含义、用途、计算方法等信息。这些属性为我们理解和使用应用指标提供了重要的参考。首先,指标元信息可以解释和说明应用指标的含义。例如,销售额指标的含义是公司在一定时间内的销售收入总额。通过理解指标的含义,我们可以更准确地理解和解释指标的数据。其次,指标元信息可以解释和说明应用指标的用途。例如,销售额指标的用途可能是用来评估公司的销售业绩,或者用来比较不同时间、不同地区、不同产品的销售情况。通过理解指标的用途,我们可以更有效地使用指标来支持业务决策。最后,指标元信息可以解释和说明应用指标的计算方法。例如,销售额指标的计算方法可能是将所有销售订单的金额相加。通过理解指标的计算方法,我们可以更准确地计算和分析指标的数据。通过这些组成部分,应用指标可以提供更具体、更详细、更深入的业务数据分析和决策支持。
五、应用场景
AB-Test 实验报告
1. 项目背景:在当前的数据驱动时代,我们通过数据能力建设,成功地打通了指标库,从而赋能了 AB 实验报告的生成。这一创新性的做法使得我们能够实现 AB 实验报告的自动化产出,大大提高了工作效率和准确性。我们的目标是通过这种方式,将数据分析的精准性和效率提升到一个全新的水平。
2. 项目收益:通过这一系列的改进,我们的 AB 实验指标体系已经能够覆盖货运约 80%的实验报告自动化。这意味着,我们可以在短时间内,对大量的实验数据进行快速、准确的分析,从而为决策提供有力的数据支持。此外,我们的系统还覆盖了访问使用转化率约 45%,以及深度使用转化率约 25%。这些数据的覆盖,使我们能够从多个角度对实验结果进行全面的评估和决策。这一切都得益于我们的数据能力建设,它使我们能够更好地理解和利用数据,从而提高我们的工作效率和决策质量。
3. 技术链路
3.1. 实验数据整体链路(数仓侧+工程侧)
3.2. 工程侧数据整合链路
3.3 指标看板产出
指标百科
指标库接入飞书词典,实现指标百科:在飞书文档及聊天界面可快速查看指标定义、口径等信息,跳转指标库白皮书 在飞书聊天界面、在线文档等场景,已实现入库指标快速查看指标元信息。例:客诉率
多因素归因
支持数据链路诊断、相关性诊断、杜邦分析诊断,可通过上述诊断追溯分析各级链路的数据影响面
1. 数据链路诊断,通过检查数据链路的完整性和稳定性,确保数据在传输过程中的准确性和安全性。分析数据链路的运行情况,找出可能存在的问题,从而提前进行预防和修复
2. 相关性诊断,分析数据之间的关联性,理解数据的业务联系,从而诊断指标间相互影响的程度
3. 杜邦分析诊断,通过拆解衍生指标,诊断每个派生指标的影响程度
六、成果和规划
成果
1. 覆盖率高:在库指标已覆盖 80%以上的核心指标
2. 通用性强:10+维度及 200+指标覆盖常用分析场景,核心报表已接入指标体系
3. 应用性广:指标库已赋能数据分析、指标预警、异动归因等应用场景
规划
1. 高效稳定:我们的目标是构建一个高效稳定的指标库系统,即使在处理大量数据的情况下也能保持流畅的运行状态。我们将采用先进的数据处理技术和算法,确保系统不会因为数据量的增加而出现崩溃或运行缓慢的情况,从而保证用户在使用过程中的顺畅体验。
2. 数据安全:数据安全是我们非常重视的一点。我们将采用严格的数据管理和保护措施,确保用户的数据不会被非法获取或篡改。我们将引入最新的数据加密技术,对用户的数据进行全方位的保护,让用户在使用我们的系统时,能够感到安心。
3. 用户友好:我们希望提供一个用户友好的系统,让用户在使用过程中感到轻松愉快。我们将设计简洁明了的用户界面,使操作变得简单易懂。我们也将提供详细的用户指南,帮助用户快速上手。
4. 功能丰富:我们期望提供一个功能丰富的系统,满足用户的各种需求。除了基本的数据分析功能,我们还将提供数据可视化、数据预测等高级功能,帮助用户更好地理解和利用数据。