描述性统计:分析数据的分布情况:中位数和平均数

1、数学定义和业务含义

中位数和平均数是用于对一组数据进行描述的统计量。

中位数是指将一组数据按照大小顺序排列后,中间位置上的数值,即一半数据大于它,一半数据小于它。如果数据的个数是偶数,则中位数是中间两个数的平均数。

平均数是指将一组数据的所有数值相加,然后除以数据的个数得到的值。平均数也被称为算术平均数或均值。

中位数和平均数都是描述数据集中趋势的指标。对于正态分布的数据,中位数和平均数是相等的,但对于非正态分布的数据,它们的值可能会存在差异。选择使用哪个统计量取决于具体情况,例如数据的分布情况,样本容量等。

2、使用指南

中位数和平均数通常结合起来使用,通过比较中位数和平均数的大小关系来判断数据的分布是偏大还是偏小。对于同一组数据,如果:

■平均数>中位数:整体数据中偏大的居多,或有大值的影响,抬高了整体的均值

■平均数<中位数:整体数据中偏小的居多,或有小值的影响,降低了整体的均值。

3、应用场景

(1)电商销售分析:两组产品每日销量的比较

(2)渠道获客流量分析:三个渠道每日新增用户数的比较,渠道获客能力的强弱、是否投放拉新活动和资源等

相关推荐
火花怪怪7 小时前
Origin分析外量子效率(EQE, External Quantum Efficiency)数据处理-EQE计算带隙
算法·数据分析
Aloudata7 小时前
构建全场景指标服务:基于 NoETL 语义编织与开放 API/JDBC 生态的实践
大数据·数据分析·agent·指标平台
赵钰老师8 小时前
CLM陆面过程模式技术应用
数据分析
2601_952196369 小时前
经济学专业学习数据分析的价值
学习·数据挖掘·数据分析
谙弆悕博士1 天前
【附Python源码】基于决策树的信用卡欺诈检测实战
python·学习·算法·决策树·机器学习·数据分析·scikit-learn
AI职业加油站1 天前
从“取数工具人”到“数据决策者”:传统数据分析师的技能跃迁之路
大数据·人工智能·数据分析
赵钰老师1 天前
R语言在生态环境领域中的应用
开发语言·数据分析·r语言
Aloudata1 天前
从 BI Copilot 到业务 Agent:指标服务如何成为统一数据接口?
大数据·人工智能·数据分析·copilot·agent·指标平台
流年viv1 天前
投稿_电价预测优化实践
python·数据分析·ai编程
Navicat中国1 天前
如何通过数据分析功能解锁数据深度洞察?
数据库·数据挖掘·数据分析·navicat