数据分析指标篇——指标解读
发布于 2021-09-22 08:37
欢迎投稿(技术、经验、读书、职位)
最近职位(数据分析、数据开发)比较多,看机会的朋友欢迎加小编交流。
【推荐职位】
数据分析师 (Base:深圳)
资深数据分析专家(base 上海)
聚水潭招运营数据分析师(base 上海)
数据分析岗(base 广州)
数据挖掘岗(base 深圳 平安银行)
数据分析师(base 上海)
指标解读,大家第一感觉就是对于指标的数据进行波动汇报,认为不需要训练能直接上手,并且在短期之内还感觉解读的不错。但是长远下来会进入到一些误区当中,这里列举三种误区。
第一种是会发现自己解读的数据,跟让听众自己去看数据效果差不多,解读的内容带不来听众任何惊喜感。其本质原因是,解读的方式,是“观察式解读”,缺少对于指标背后业务本质的理解。
第二种是没有弄清楚相关关系和因果关系,这种解读极易引发大家的逻辑争议,甚至会引导出错误的决策判断,属于数据分析里面所谓的dangerous areas。
第三种是指标解读的节奏,抓不住重点。往往全盘解读,有点低效,个别解读,又害怕漏了重点。
以下我们便针对这三个数据解读的误区进行详细的说明。
走出“观察式解读”误区
所谓观察式解读,是指只从指标的表面信息去分析指标的情况和定位指标的问题,看起来很合理,也很高效,但是其实并没有get到指标背后真实的情况,这种解读方式,是数据分析中最常见的数据分析误区。以下讲述一个模拟的案例来帮助大家走出这个误区。
背景介绍:用户在严选下单后,严选会从仓库打包好包裹发送给用户,我们会针对不同的线路,不同的订单类型,进行承运商的选择,我们的承运商主要是三种:顺丰,京东和中通,三种承运商报价不一样,服务水平不一样,因此单量占比也不一样。
基于以下的数据,解读为什么单均运费从8.7元下降到了8.2元?
备注:
1.本文的数据皆为杜撰信息,请勿传播和使用;
2.报价10+2表示包裹3kg以内都是10元,每续重1kg增加2元。
单均运费,跟单量占比有关,也跟报价有关。读到这里,大家可以先尝试解读一下试试。
我猜测,有不少的人会有如下的解读解读:
“单均运费从9月8.7元下降至10月8.2元,原因是价格相对比较便宜的中通的单量占比上涨5%,京东单量上涨10%,以及京东的续费价打9折”
这种解读很常见,就是标准的“观察式解读”,一般数据分析新手很容易陷入到这种解读习惯中。这种解读有如下几个问题:
中通单量上涨或者顺丰单量下降的原因没有说清楚;
京东单量上涨和打折其实是一个原因,因为系统会基于报价情况来选择更低价格的配送商;
几个原因之间的影响没有量化;
是否存在数据外的影响因素没有评估。
这里直接给出更精准且有效的解读方式:
第一句:“10月单均运费从8.7元下降至8.2元,表现向好”
——说明现象
第二句:“原因是淘系活动带来渠道单量比例上涨6%,渠道70%发中通,引起中通整体的单量占比上涨5%,”
——中通变化的原因
第三句:“渠道发中通引起的客诉问题可控”
——对于业务的影响
第四句:“这部分影响0.4元”
——量化影响
第五句:“京东续费打折,选仓选配优先级提升”
——另外的原因
第六句:“以及业务主动调整江浙沪京东比例”
——所给的数据范围外的原因
第七句:京东单量上涨10%,影响0.1元”
——量化影响
这种解读方式,也是听众,特别是业务方高层更愿意听到的信息,以及基于这些信息,可以做进一步的决策升级等。
简单的总结一下,非“观察式解读”的要点:
先说明指标现象
研究透指标变化的【本质】原因
原因的影响进行量化
其他影响的说明
到这个层面之后,可以再加上针对这个指标未来的规划,那么就很完整了。
理清相关关系和因果关系
我们在解读数据时,往往需要理清楚事情背后的真实原因,我们需要的是指标现象和原因之间的“因果关系”,但是太容易出现解读出的“原因”是“相关关系”了。
举例1:如上面的那个案例,“单均运费变高的原因是京东和中通的单量占比增加”
“单均运费变高” 和 “京东和中通的单量占比增加” 其实都是现象,后者并不是前者的“因”
举例2:“上周GMV的增加是因为人均arpu值增加”
举例3:“昨日新进人数增加是因为曝光转换率增加”
举例4:“30日留存比较高的那一批用户,发现他们的特点是7日留存比较高”
相信很多人都能看出这些解读,其实很多都是指标之间的相关性影响,并没有给出背后的本质原因。其实当我们真的花时间多琢磨一下,这些背后的原因其实都是不难被挖出来的。那么如何能够避免出现这种情况呢?我觉得主要在于解读习惯。
这里我分享一下我是如何避免陷入这个坑的:解读时,不断问自己为什么?问到不能再问的时候,就是最终的答案了。
我们拿上面的案例2来举例:为什么GMV增加了?我们可以通过杜邦分析定位到是人均arpu值涨了。
那么下一步就是问自己,为什么人均arpu值涨了?答案是用户购买商品的件数增加了?
继续问自己,为什么购买商品件数增加了?发现是因为对xx商品新加了满赠的营销活动。
似乎是问到底了,其实不然,我们可以分析一下这个活动的影响,是不是对全局影响的主要原因,那么我们可以继续发问,为什么这个活动没有造成付费人数的上涨?
然后发现活动里面有限制,必须是超过一定购买金额,才有这个优惠。因此还是只有少部分的用户参与了这次活动。这样结论和数据表现,就能够完全对应上了。
当然有的人还会问,为什么要上这个活动?嗯嗯,这个就问业务方好了,可能这个问题,听众比我们分析人员更清楚~
指标解读的节奏
这一部分,我们需要重点解决一个问题:在什么时候,解决什么指标?
当只负责单一指标的时候,日常观察指标的波动就好了。我们可以定义一个预警条件,比如说收入波动超过10%就需要去解读分析一下,或者达成率不足99%的时候去分析原因。或者距离目标值完成的很好,或者很不好的时候,可以去复盘一下原因。
以供应链为例,我们分为促前、促中和促后。
促前:缺货风险,到货及时率,逾期率,仓库存储风险,分仓平衡性等
促中:生产及时率,配送及时率,配送时效等
促后:退货率,客诉率
除了大促,日常也可以有规律的、阶段性的去解读一些核心指标,比如库存情况,成本情况,客诉情况,等等。当然,如果遇到很重要的指标,需要做突破或者深入的分析,可以启动指标的专项分析,这个后续再介绍。
总结
指标解读是做好数据分析的第一步。同样的指标数据,在不同的人眼里,会呈现完成不一样的意义和价值。我们传颂啤酒与尿布的故事,谷歌基于关键词预测流感的故事,这些事情的基础就是深入理解指标。
如何能做到更高效的吸收数据知识,这个需要不断的训练和沉淀方法。希望人人都是分析师,这个时代下数据量级爆发的同时,数据价值也能爆发。祝好~
九饼,网易严选数据分析师,数据爱好者,认为数据可以改变世界。现负责严选主站和供应链的分析工作。
Python机器学习案例-使用集成学习进行客户流失预测
浅谈用户画像
业务分析模型,该怎么搭建
别拿BI不当产品---BI的AI化
数据产品经理基础技能:数据需求说明文档怎么写?
浅谈如何建设指标监控体系
一文掌握开发利器:正则表达式
产品经理日常数据分析工作
MySQL 深入学习总结
选择职业发展方向,我们需要考虑哪些因素呢?
AB测试平台的那些事
本文来自网络或网友投稿,如有侵犯您的权益,请发邮件至:aisoutu@outlook.com 我们将第一时间删除。
相关素材