数据分析因子评分学习

当多个因素影响一个结果时,我们需要综合考虑这些因素分别对结果德影响。因子评分就是用于比较其对结果德影响程度。

文章目录


前言

数据分析师的日常工作中,经常会遇到这样的问题,分析某个指标的下降/上升原因,且这个指标并不是受单一因素影响,这时就要求我们综合考虑分析。本文分享数据分析因子评分的学习案例,供各位小伙伴参考。

案例来源:【分析方法】指标下降如何分析?分享一种"因子评分法",帮你快速定位原因​​,案例中数据标准化公式可能为原作者笔误,本人做部分修改。


一、案例背景

如下图所示,某新兴打车软件公司,2018年7月渠道引流新用户ROI环比大幅下降,需要排查异常渠道,为业务指明方向。

名词释义:
投资回报率(ROI)=(税前年利润/投资总额)*100% 。是指企业从一项投资性商业活动的投资中得到的经济回报,是衡量一个企业盈利状况所使用的比率,也是衡量一个企业经营成果和效率的一项综合性指标。本案例ROI=收入/费用)

二、解决方案

(一)分析思路

由于ROI受收入和费用两个因子影响,单看各渠道ROI无法准确定位到重点异常渠道。可使用因子评分,综合结果得到结论。

(二)剔除无关数据

虽然整体ROI下降近25%,但快手渠道的ROI却上升,分析下降原因时,应先将其剔除。

(三)求变化值

将剩余4各渠道的收入和费用进行差值计算,由于ROI=收入/费用,当收入和费用同时增加时,两者对ROI贡献的影响程度相反。求出"收入变化-费用变化"值,用于判断各渠道对ROI下降的影响。

(四)求收入评分

1. 数据标准化

这里使用其中一种计算方式(极差标准化法),将最大值定为1,最小值定为0 ,把所有值到压缩到0和1之间,常用于统一数据量级。计算公式为:(x-x最小值)/(x最大值-x最小值),如该案例中,抖音的收入变化计算过程为:(-12540-(-21347))/(720-(-21347))=0.399102733

2. 缩放

在ROI的的计算中,收入作为分子,分子下降越多,ROI值则下降越多,需要将其进行缩放倒数

缩放到0.1~0.9之间,计算公式为:(0.9-0.1)*x+0.1,如该案例中,抖音的缩放计算过程为:(0.9-0.1)*0.399102733+0.1=0.419282186

3. 倒数

倒数,使其与评分正相关("收入变化"越大,评分越高),计算公式为:1/x

(五)求费用评分

在ROI的计算中,费用作为分母,"费用变化"越大,评分越高。所以不必进行缩放倒数,直接标准化。

(六)计算综合评分

将收入评分与费用评分相加,可以看出,对ROI大幅下降的影响程度:抖音>今日头条>百度>爱奇艺。


总结

以上案例的因子评分,其实分别分析收入和费用两个因子的变化情况,最后综合考虑才得出结论。假设不综合考虑,如下图所示:

  1. 如果单纯看ROI环比,变化幅度是:抖音>百度>今日头条>爱奇艺;
  2. 如果单纯看收入变化,影响程度是:今日头条>抖音>百度>爱奇艺;
  3. 如果单纯看费用变化,影响程度是:抖音>百度>爱奇艺,今日头条费用减少,不会导致ROI下降

从单一角度考虑,都无法得出较准确的结论。所有可以参考上文,从以下几步分析:

  1. 剔除无关数据
  2. 求变化值
  3. 利用数据标准化,求各因子评分(评分旨在达到评分项变化越大,分数越高的效果)
  4. 综合评分得出结论


相关推荐
极客数模1 天前
【浅析赛题,一等奖水平】思路模型数据相关资料!2025 年“大湾区杯”粤港澳金融数学建模竞赛B 题 稳定币的综合评价与发展分析~
大数据·算法·数学建模·金融·数据挖掘·图论·1024程序员节
StarPrayers.1 天前
Binary Classification& sigmoid 函数的逻辑回归&Decision Boundary
人工智能·分类·数据挖掘
spssau1 天前
SPSSAU「质量控制」模块:从可视化监控到过程优化,一站式搞定质量难题
信息可视化·数据挖掘·数据分析
深蓝电商API1 天前
从爬虫到平台:如何把你的爬虫项目做成一个技术产品?
爬虫·信息可视化·数据挖掘
hweiyu001 天前
数据挖掘 miRNA调节网络的构建(视频教程)
人工智能·数据挖掘
明月说数据1 天前
Smartbi 10 月版本亮点:AIChat对话能力提升,国产化部署更安全
ai·数据分析·版本更新
@小红花1 天前
Tableau 从零到精通:系统教学文档(自学版)
信息可视化·数据挖掘·数据分析
我是小邵1 天前
主流数据分析工具全景对比:Excel / Python / R / Power BI / Tableau / Qlik / Snowflake
python·数据分析·excel
北数云2 天前
北数云|利用Limix模型对tabular-benchmark数据集实现分类和回归任务
分类·数据挖掘·回归·gpu算力
慧都小项2 天前
数据驱动的架构设计:通过Enterprise Architect实现基于UML的架构治理
数据分析·数据架构·sparx ea