数据分析因子评分学习

当多个因素影响一个结果时,我们需要综合考虑这些因素分别对结果德影响。因子评分就是用于比较其对结果德影响程度。

文章目录


前言

数据分析师的日常工作中,经常会遇到这样的问题,分析某个指标的下降/上升原因,且这个指标并不是受单一因素影响,这时就要求我们综合考虑分析。本文分享数据分析因子评分的学习案例,供各位小伙伴参考。

案例来源:【分析方法】指标下降如何分析?分享一种"因子评分法",帮你快速定位原因​​,案例中数据标准化公式可能为原作者笔误,本人做部分修改。


一、案例背景

如下图所示,某新兴打车软件公司,2018年7月渠道引流新用户ROI环比大幅下降,需要排查异常渠道,为业务指明方向。

名词释义:
投资回报率(ROI)=(税前年利润/投资总额)*100% 。是指企业从一项投资性商业活动的投资中得到的经济回报,是衡量一个企业盈利状况所使用的比率,也是衡量一个企业经营成果和效率的一项综合性指标。本案例ROI=收入/费用)

二、解决方案

(一)分析思路

由于ROI受收入和费用两个因子影响,单看各渠道ROI无法准确定位到重点异常渠道。可使用因子评分,综合结果得到结论。

(二)剔除无关数据

虽然整体ROI下降近25%,但快手渠道的ROI却上升,分析下降原因时,应先将其剔除。

(三)求变化值

将剩余4各渠道的收入和费用进行差值计算,由于ROI=收入/费用,当收入和费用同时增加时,两者对ROI贡献的影响程度相反。求出"收入变化-费用变化"值,用于判断各渠道对ROI下降的影响。

(四)求收入评分

1. 数据标准化

这里使用其中一种计算方式(极差标准化法),将最大值定为1,最小值定为0 ,把所有值到压缩到0和1之间,常用于统一数据量级。计算公式为:(x-x最小值)/(x最大值-x最小值),如该案例中,抖音的收入变化计算过程为:(-12540-(-21347))/(720-(-21347))=0.399102733

2. 缩放

在ROI的的计算中,收入作为分子,分子下降越多,ROI值则下降越多,需要将其进行缩放倒数

缩放到0.1~0.9之间,计算公式为:(0.9-0.1)*x+0.1,如该案例中,抖音的缩放计算过程为:(0.9-0.1)*0.399102733+0.1=0.419282186

3. 倒数

倒数,使其与评分正相关("收入变化"越大,评分越高),计算公式为:1/x

(五)求费用评分

在ROI的计算中,费用作为分母,"费用变化"越大,评分越高。所以不必进行缩放倒数,直接标准化。

(六)计算综合评分

将收入评分与费用评分相加,可以看出,对ROI大幅下降的影响程度:抖音>今日头条>百度>爱奇艺。


总结

以上案例的因子评分,其实分别分析收入和费用两个因子的变化情况,最后综合考虑才得出结论。假设不综合考虑,如下图所示:

  1. 如果单纯看ROI环比,变化幅度是:抖音>百度>今日头条>爱奇艺;
  2. 如果单纯看收入变化,影响程度是:今日头条>抖音>百度>爱奇艺;
  3. 如果单纯看费用变化,影响程度是:抖音>百度>爱奇艺,今日头条费用减少,不会导致ROI下降

从单一角度考虑,都无法得出较准确的结论。所有可以参考上文,从以下几步分析:

  1. 剔除无关数据
  2. 求变化值
  3. 利用数据标准化,求各因子评分(评分旨在达到评分项变化越大,分数越高的效果)
  4. 综合评分得出结论


相关推荐
赵钰老师10 分钟前
【Deepseek、ChatGPT】智能气候前沿:AI Agent结合机器学习与深度学习在全球气候变化驱动因素预测中的应用
人工智能·python·深度学习·机器学习·数据分析
大美B端工场-B端系统美颜师41 分钟前
定制化管理系统与通用管理系统,谁更胜一筹?
人工智能·信息可视化·数据挖掘·数据分析
jinan8861 小时前
企业的移动终端安全怎么管理?
大数据·网络·安全·数据分析·开源软件
胖子君1 小时前
商业智能工具综合评估报告(2025年)
数据分析
西柚小萌新3 小时前
【深度学习:进阶篇】--2.1.多分类与TensorFlow
分类·数据挖掘·tensorflow
dundunmm14 小时前
【论文阅读】Self-Correcting Clustering
论文阅读·深度学习·数据挖掘·聚类
SelectDB17 小时前
拉卡拉 x Apache Doris:统一金融场景 OLAP 引擎,查询提速 15 倍,资源直降 52%
大数据·数据库·数据分析
冷月半明17 小时前
《Pandas 性能优化:向量化操作 vs. Swifter 加速,谁才是大数据处理的救星?》
python·数据分析·pandas
alicia232217 小时前
一文揭秘AI如何像庖丁解牛一样拆解复杂查询
数据分析