智能分析最佳实践——指标逻辑树

378 篇文章 71 订阅
订阅专栏

所有业务都会面对“为什么涨、为什么降、原因是什么?”这种简单粗暴又不易定位的业务问题。为了找出数据发生异动的原因,业务人员会通过使用多维查询、dashboard等数据产品锁定问题,再辅助人工分析查找问题原因,这个过程通常需要一天时间。几乎每种业务角色的用户都在做相似的分析,但在业务方分析人员发生工作变动时,分析方法难以得到较好传承。因此我们需要一款自动给出分析结论的智能化数据产品来解决上面的问题,产品的基本功能如图1所示。 arch

图1 产品架构图

由上图可知,指标逻辑树就是我们抽象出来的智能异动分析数据产品的最佳实践。它将固定的分析方法和业务场景抽象出来,套用灵活的数据源(包含Kylin、MySQL、Elasticsearch、Druid等),自动生成符合各类用户的异动分析报告;它能够直接给出分析结论进而快速落实业务行动,降低分析成本和决策周期。选定两个时间周期,指定指标顺序,通过指标逻辑树就可找出导致核心指标发生异动的关键指标,同时可对单一指标进行细分维度拆分,锁定细分维度对整体的影响。

指标逻辑树作为一款支持酒旅各业务线的异动分析数据产品,面临的挑战如下:

  • 基础指标多、维度多,且来自于不同的数据源。

  • 支持多种异动分析算法。

  • 自定义计算指标。

针对上面的挑战,我们给出如下的解决方案。

体系架构

arch

图2 指标逻辑树体系架构

如图2所示: 1. 指标计算,用于解决基础指标多、维度多,且来自于不同数据源的问题以及自定义计算指标的问题; 2. 分析算法,用于支持多种异动分析算法; 3. 计算服务,采用master-work的方式解决查询性能的问题。

具体方案

指标计算

指标计算包含指标漏斗、基础指标序列、指标分类,它们之间的关系如图3所示。 yg-datasources

图3 指标计算

如图3所示,指标漏斗为用户自定义的有序指标序列,包含基础指标和计算指标(如,B=(L+H)*Y) ;基础指标序列,是将指标漏斗中的计算指标按照顺序拆分之后的指标序列;指标分类采取大圣魔方(可以参考大圣魔方:https://tech.meituan.com/dsmf.html )配置的规则对基础指标进行分类。

分析算法

目前指标逻辑树支持两种异动分析算法,后续可以根据需要进行扩展。 * 生成瀑布分析图的连环迭代分析法。 * 根据指标下钻维度方案,生成单个指标解释度的基尼系数算法。

下面分别介绍这两种算法在指标逻辑树中的运用。

连环迭代分析法

连环迭代分析法,用于从用户自定义的有序指标列表中找出导致核心指标发生异动的关键指标,如图4可知,本期结果指标E产生的波动,主要由于A指标的波动影响。

图4 瀑布分析图

图5 指标漏斗

如图5所示,意向UV、访购率、人均单量、连带率、SKU单价等几个指标中的任意一个发生数据波动,都可能引起支付GMV的波动。采用连环迭代分析法,可以确定某个具体指标在本期支付GMV的波动中产生的影响最大。算法公式,支付GMV=意向UV*访购率*人均单量*连带率*SKU单价。

基尼系数

基尼系数A/(A+B),用于计算各下钻维度方案对单个指标波动的影响程度,横轴用特征分组基期累计占比,纵轴用波动值累计占比(可以为负值),基尼系数越大说明该特征对波动的解释效果越好。

图6 基尼系数计算

如图6所示,指标计算,用于获取层级下钻维度中各个维度的基础数据,如各个城市等级的本期、基期值等信息;分析算法,根据维度基础数据计算出排序因子,利用排序之后的排序因子计算各特征分组的基期累积占比及波动值累计占比,进而获取到基尼系数;最终选取基尼系数最大的特征作为最终解释。

计算服务

随着业务分析需求的增加,分析用户自行配置的指标序列以及针对单个指标的下钻维度方案将会急剧增加,随之带来的影响就是单个请求需要支持大量的查询任务,因而提升并行计算能力是提升系统性能的一个关键因素。如图7所示,计算服务包括任务拆分、并行计算和结果合并。

图7 计算服务

任务拆分

任务拆分分为如下几个步骤: * 将指标漏斗中的计算指标拆分成基础指标。 * 填充基础指标的细化维度方案,记录指标的各个维度方案及各方案下的层级下钻维度。 * 对基础指标按照数据模型和维度方案进行分类。

并行计算

并行计算提供分布式计算功能,主要处理的是任务拆分之后的细粒度查询任务。

查询任务主要有以下两类: * 按照数据模型分类之后的指标序列查询任务,需要分别查询本期和基期值,查询量相对较少。 * 按照数据模型和维度方案分类之后的查询任务,需要分别查询本期和基期值,涉及到细化维度,查询量比较大。

结果合并

结果合并主要是针对计算指标来说的,计算指标是分析用户自定义的针对基础指标的一组计算公式。并行查询的结果是针对基础指标的,需要合并基础指标的查询结果数据,生成符合计算公式的指标数据。结果合并模块需要做两部分的工作,一是解析计算公式,二是根据已有的数据,按照计算公式生成新的数据。

系统中用到数据组装的模块主要有如下: * 如图8所示,根据拆分之后的基础指标数据,生成满足计算公式的计算指标数据。 * 如图9所示,根据拆分之后的下钻维度基础数据,分别计算出各个维度的数据,生成符合计算公式的下钻维度数据。

图8 计算指标数据组装

图9 指标下钻维度数据组装

指标逻辑树在美团点评酒店旅游各业务线中已经得到了一定的应用,并收获了大量好评。本文只是指标逻辑树的一个总纲,目前产品尚处于初级阶段,后续还有很多功能需要完善。

最后插播一个招聘广告,有对数据产品工具开发感兴趣的可以发邮件给 fuyishan@meituan.com。

企业级大数据处理实践——基于 Apache Flink
程序员光剑
08-01 1833
大数据领域正在经历一个百花齐放、草木皆兵的阶段,而Apache Flink作为当下最热门的开源大数据计算框架正在吸引越来越多的企业用户,帮助他们快速构建大数据平台,提升效率和价值。本文将从基础知识出发,通过Flink平台的实践案例,帮助读者搭建起真正可用的企业级大数据平台,并理解其内部运行机制,进而运用到实际工作场景中,有效提升公司效率和产出。
内部运营方面KPI指标
03-29
内部运营方面KPI指标
【数据应用案例】异动分析——指标逻辑
数据产品笔记
07-18 8252
案例来源:@美团技术博客 案例地址:https://zhuanlan.zhihu.com/p/31676443   1. 目标:在BI实践中,快速定位到使某个业务指标发生异动的因素,并对该因素进行细分维度拆分,锁定细分维度对整体的影响   2. 框架   3. 过程     1)指标计算:将基础指标、自定义指标进行拆分,从数据源获取数据     2)分析算法:       ...
关于指标体系的那些事儿
最新发布
神策数据
08-20 999
对于企业来说,数据分析离不开对关键指标的追踪。每个行业都有自己独特的关键指标:餐厅的关键指标是翻台率,投资者的关键指标是投资回报率,媒体网站的关键指标是广告点击率……那么,什么是好的、可指导业务的关键指标?如何构建能够推动业务增长的指标体系?一、什么是指标指标体系指标是评估业务目标表现或效果的量化参数,最直观的作用就是将业务量化。麦克卢尔将公司最需要关注的指标分为五大类:获取用户(Acquisi...
数据指标体系建设
微信搜:import_bigdata,大数据领域硬核原创作者
03-08 1830
大数据技术与架构点击右侧关注,大数据开发领域最强公众号!暴走大数据点击右侧关注,暴走大数据!一、数据数据是指未经过处理的原始记录。数据的本质是利用数学观察、记录、理解世界;数据分析的过程...
指标分解:清晰展示层级关系,实现精细管理
明月说数据
07-19 946
在业务层面,指标分解成为业务管理团队的得力助手,帮助他们清晰了解业务环节情况,并发现潜在改进空间,从而提升管理效率。指标分解是一种层次化的可视化图形方法,通过逐层分解数据,形成一个清晰的状结构,让复杂指标的层级关系和影响因素一目了然,能够清晰地展示指标及其具体维度的关系。在分解后,图表顶部将显示每个级别的维度导航条,以及展示当前继续分解的维度值。这些图表虽然能直观地显示数据的分布和变化趋势,通过钻取也能跟踪问题的根因,但它们无法清晰展示数据的层级关系和影响因素。在这里,我们选用“订单主题”数据模型。
数据分析——逻辑模式
llliual的博客
04-18 836
异常指标分析——逻辑思维 逻辑是根据指标之间的逻辑关系进行拆解,将难以验证的主问题,拆分为【数据号获取,与业务有直接关联】的子问题。 例题:GMV同比下降20%,用逻辑思维模式如何分析。 Step1:拆指标 GMV = 访客数(nv)* 订单转化率(cr)* 单均价 或者 GMV = 订单量 * 单均价 Step2:提出假设 GMV的同比下降受到访客数、转化率、单均价的影响 Step3:验证假设 验证第一个假设,访客数的影响。 作出去年3月和今年3月的访客数量的对比图 (摘自阿狸和小兔) 若对比图
2018年技术合辑
03-14
美团点评在人工智能与大数据领域也有所涉猎和实践。例如,通过大数据分析来优化商业决策和用户行为预测。美团点评在人工智能领域的工作包括了算法的优化和模型的训练,以及在机器学习和深度学习方向的应用探索。通过...
BI数据分析师技能培训与实践——掌握数据分析核心技能,实现企业业务价值的最佳实践
weixin_43727334的博客
05-16 1814
掌握BI数据分析师的必备技能,从BI概述到实践案例全方位培训,快速提高数据分析能力!本篇文章详尽介绍了BI在企业中的应用、数据分析基础、SQL语言及数据库管理、数据仓库、数据可视化、BI报表设计、数据挖掘、BI实践案例和BI数据分析师能力评估等多个方面,是BI数据分析技能培训的必读资料。
人工智能-项目实践-逻辑回归-基于逻辑回归的癌症预测案例-【癌症分类预测-良/恶性乳腺癌肿瘤预测】
05-21
在这个名为“人工智能-项目实践-逻辑回归-基于逻辑回归的癌症预测案例-【癌症分类预测-良/恶性乳腺癌肿瘤预测】”的项目中,我们主要关注的是如何利用逻辑回归算法进行癌症预测,特别是针对良性和恶性乳腺癌肿瘤的...
Golang微服务实践——用Golang开发一个商品推荐系统
程序员光剑
08-07 1154
本文将会通过构建一个基于Golang开发的商品推荐系统,深入阐述Golang微服务化开发模式及相关技术方案。我们在本系列教程中,只从工程角度进行讨论,主要关注Golang提供的各种优秀特性及编程模式,以及这些特性和模式如何帮助我们更加高效地开发出可靠、可伸缩、可扩展的微服务应用。因此,读者需要对Go语言有一定了解,对容器、云原生等概念有基本了解。随着互联网的快速发展,网站流量越来越多,用户行为也在不断变化。作为电商网站的忠实用户,每一次交易都意味着一笔交易金额。
KPI指标
weixin_30532973的博客
08-03 692
仓库区域选择,配送中心与前置仓(快消品仓) 转载于:https://www.cnblogs.com/zhuispeed/archive/2011/08/03/2126097.html
数据指标体系建设方法!
SeizeeveryDay的博客
03-31 738
01数据数据是指未经过处理的原始记录。数据的本质是利用数学观察、记录、理解世界;数据分析的过程就是人类从定性到定量、模糊到精准过程。大家都喜欢看数据,而不是通过一堆的文字、现象进行决策判断。02指标指标=数据+业务场景,能够指导业务制定下一步行动方案。例如:【体重】是一个数据,120KG不代表胖,60KG也不代表瘦,这个数字的或大或小并不能从说明什么问题,因为还有身高的因...
什么是指标拆解指标拆解怎么做数据分析
Foolforuuu的博客
06-15 1457
我们先使用自定义拆解,本例中支持在地区省份城市三个维度中任意选择。依次选择地区省份城市对销售额指标进行拆解,效果如下图所示:节点过多展示不下时,可以单击箭头进行翻页:指标拆解支持对节点大小、层级间距、高亮颜色,以及字体等进行配置:SugarBI支持免费试用,欢迎大家前来体验。
几种常见统计指标算法
nodie的专栏
04-21 2997
<br />几种常见统计指标算法<br />市场调研 2011-01-05 11:04:54 阅读1447 评论3  字号:大中小 订阅做咱们这行,这个要懂的:<br /> 指标图解:基本指标分类:  更多详细请点击(不知道是哪位牛X做的,从技术上看,思路和方法很清晰:http://chem-eng.utoronto.ca/~datamining/dmc/data_mining_map.htm
逻辑与视觉
fs的专栏
11-24 1844
转自:WPF的逻辑与视觉(1)基本概念 一.摘要 逻辑与视觉属于WPF的基本概念,学过WPF或者Silverlight的朋友一定会对其有所耳闻,这篇文章将来探讨逻辑与视觉的特质以及两者的区别 二.本文提纲 WPF Inspector工具介绍观察逻辑与视觉与ASP.NET服务器控件比较(控件为逻辑,HTML为视觉)与JavaScript客户端控件比较(
技术指标逻辑描述-1
李逸波(PMP)
06-05 5399
3.1 主线图3.1.1 主线图形3.1.1.1 K线图(蜡烛图)K线图:K线图又称蜡烛图、阴阳线、棒线等。它是以每个交易日(或每个交易周期)的开盘价、最高价、最低价和收盘价绘制而成,K线的结构可分为上影线、下影线及中间实体三部分。上影线的顶部表示最高价,下影线的底部表示最低价,实体的上下边缘表示开盘价和收盘价。K线的绘制方法如下:若收盘价 > 开盘价,实体部分为红色,上下影线均为红色,称为阳
数据分析思维(五)|逻辑思维
二哥为啥不像程序员?
02-08 1067
在很多数据分析场景中我们需要梳理分析逻辑,需要进行指标从大到小的拆分,这时候我们可以顺着影响分析结果的因素进行层层溯源,从而抓住问题的核心。逻辑使用层级的结构将每个大问题的所有子问题进行罗列,然后再将子问题的子问题进行罗列,以此类推,当问题不能够被拆分时形成一个完整的逻辑。议题是最简单的逻辑,议题通过逐层细分的方式将模糊不清的问题分成无数个具体的小问题。由于细分的原因,议题的子和叶子都很多,从议题上我们可以推断出所有的可能情况,但是构建的速度很慢。
数据可视化与分析:下钻、上卷与转轴操作详解
热门推荐
击水三千里的专栏
08-30 1万+
本文详细解释了数据可视化中的下钻、上钻和转轴操作,通过XMind、豌豆BI和Tableau等工具的实际应用案例,展示了如何聚焦特定数据分支、分析数据关联性以及转换数据布局,以优化数据分析过程。 下钻:从当前数据往下展开下一层数据。例如:(某数据的分类下面分为品名)从分类列表展开到品名列表。 上钻、下钻统称钻取。 切片:展现同一层面的数据。如上述的产品。 转轴:这些应该属于查询、展现范畴
写文章

热门文章

  • 支付系统-对账系统 19198
  • java程序员的必用的9款开发工具 11710
  • 架构师的主要职责是什么? 11456
  • 【深度揭秘】百度、阿里、腾讯内部岗位级别和薪资结构,附带求职建议! 10333
  • 支付系统-概念与架构 10220

分类专栏

  • 美团技术 378篇
  • CTO 2篇
  • 架构设计 11篇
  • 分布式
  • 求职跳槽
  • 负载均衡 1篇
  • 分布式系统 4篇
  • 消息中间件 7篇
  • 职业规划 4篇
  • 分布式缓存 1篇
  • 数据库设计
  • 分布式文件
  • 数据库 2篇
  • 求职简历 3篇
  • Kafka 1篇
  • Spring-Boot 79篇
  • 网赚技术 1篇
  • Spring-Cloud 112篇
  • 架构师 18篇
  • Java多线程 16篇
  • Java学习路线 1篇
  • 面试题 26篇
  • 阿里Java面试题 21篇
  • Redis 10篇
  • Java面试题及答案 11篇
  • Java数据结构与算法 2篇
  • 面试经验 7篇
  • 求职 4篇
  • bat薪资岗位 1篇
  • 阿里P7要求 1篇
  • 学习资料 4篇
  • 技术总监 1篇
  • 产品技术 3篇
  • RPC 5篇
  • JVM 7篇
  • Java 7篇
  • 开发书籍 5篇
  • Netty 1篇
  • Java设计模式 1篇
  • Dubbo 2篇
  • MySQL 6篇
  • Docker 2篇
  • Java集合 1篇
  • 架构师职责 1篇
  • SpringCloud 1篇
  • Java NIO 1篇
  • 中间件 2篇
  • Java基础 1篇
  • Java进阶 12篇
  • 性能优化 8篇
  • 架构技能 16篇
  • 微服务 11篇
  • 支付体系 6篇
  • DevOps 1篇

最新评论

  • java程序员学习路线以及我的学习经验

    飞羽疾驰: 可以的,我学的另一个Java路线和资料,5个月后拿了多个满意Offer:https://knife.blog.csdn.net/article/details/132629361

  • 支付系统-对账系统

    lliiqiang: 支付系统数据有是否成功或者取消和是否需要对账状态,本地从第三方获得唯一标志产生数据是成功并且需要对账,然后和第三方对账,第三方产生成功数据,本地数据为已经对账,如果失败就取消本地数据,外界推送数据本地是未成功数据,直到数据成功。定时对账需要对账的数据,不得使用未成功的数据或者注销含有未成功或者需要对账的数据的账号。

  • 美团酒店直连产品数据一致性演进

    2301_81232141: 您好,想要做API接口对接,所以怎么取得您的联系?

  • 最强京东Java面试题(共现场4面)

    zhouhui001: 现在一个小厂都比这个问的难了

  • 支付系统-会计核心

    idogirl: 不对吧,现在网联已将所有银行收敛到它那儿,结算款是它最后总体轧差后结算给备付金,只需要记一个网联的渠道款就可以。

大家在看

  • java+vue计算机毕设电影网站系统【源码+开题+论文+程序】 252
  • mysqli_fetch_object() 和 mysqli_fetch_array() 函数的区别 299
  • 《黑神话:悟空》游戏闪退弹窗:找不到DuiLib.dll文件的处理方法
  • python基于Hadoop的用户网站浏览分析的设计与实现
  • MFC -文件类控件

最新文章

  • Spring Boot中使用Swagger2构建强大的RESTful API文档
  • Spring boot中使用log4j记录日志
  • Spring Boot中使用RabbitMQ
2020年790篇
2019年26篇

目录

目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

天下网标王西藏网站优化特点优化自己网站的代码网站如何提高seo优化网站优化推广服务内容宝安网站关键词优化费用织金县分类网站优化沈阳网站排名优化服务网站托管优化对公司有什么好处服装行业网站优化获客商丘网站优化推广费用江西网站关键词排名优化番禺网站关键词优化费用深圳企业网站关键词优化优化网站软件窗云速捷省钱网站优化四大要素网站加优化代码新网站和旧网站优化有什么区别开封百度网站快速排名优化贵阳市网站优化平台庆阳网站优化推广电话企业门户网站优化seo网站优化有名的公司南沙公司网站优化推广教程西安网站优化效果平顶山网站推广优化哪里好网站推广优化团队网站优化比较好搜索引擎优化网站链接深圳小企业网站优化公司哪个好网站站外优化香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声卫健委通报少年有偿捐血浆16次猝死汪小菲曝离婚始末何赛飞追着代拍打雅江山火三名扑火人员牺牲系谣言男子被猫抓伤后确诊“猫抓病”周杰伦一审败诉网易中国拥有亿元资产的家庭达13.3万户315晚会后胖东来又人满为患了高校汽车撞人致3死16伤 司机系学生张家界的山上“长”满了韩国人?张立群任西安交通大学校长手机成瘾是影响睡眠质量重要因素网友洛杉矶偶遇贾玲“重生之我在北大当嫡校长”单亲妈妈陷入热恋 14岁儿子报警倪萍分享减重40斤方法杨倩无缘巴黎奥运考生莫言也上北大硕士复试名单了许家印被限制高消费奥巴马现身唐宁街 黑色着装引猜测专访95后高颜值猪保姆男孩8年未见母亲被告知被遗忘七年后宇文玥被薅头发捞上岸郑州一火锅店爆改成麻辣烫店西双版纳热带植物园回应蜉蝣大爆发沉迷短剧的人就像掉进了杀猪盘当地回应沈阳致3死车祸车主疑毒驾开除党籍5年后 原水城县长再被查凯特王妃现身!外出购物视频曝光初中生遭15人围殴自卫刺伤3人判无罪事业单位女子向同事水杯投不明物质男子被流浪猫绊倒 投喂者赔24万外国人感慨凌晨的中国很安全路边卖淀粉肠阿姨主动出示声明书胖东来员工每周单休无小长假王树国卸任西安交大校长 师生送别小米汽车超级工厂正式揭幕黑马情侣提车了妈妈回应孩子在校撞护栏坠楼校方回应护栏损坏小学生课间坠楼房客欠租失踪 房东直发愁专家建议不必谈骨泥色变老人退休金被冒领16年 金额超20万西藏招商引资投资者子女可当地高考特朗普无法缴纳4.54亿美元罚金浙江一高校内汽车冲撞行人 多人受伤

天下网标王 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化