描述性统计:分析数据的分布情况:中位数和平均数

1、数学定义和业务含义

中位数和平均数是用于对一组数据进行描述的统计量。

中位数是指将一组数据按照大小顺序排列后,中间位置上的数值,即一半数据大于它,一半数据小于它。如果数据的个数是偶数,则中位数是中间两个数的平均数。

平均数是指将一组数据的所有数值相加,然后除以数据的个数得到的值。平均数也被称为算术平均数或均值。

中位数和平均数都是描述数据集中趋势的指标。对于正态分布的数据,中位数和平均数是相等的,但对于非正态分布的数据,它们的值可能会存在差异。选择使用哪个统计量取决于具体情况,例如数据的分布情况,样本容量等。

2、使用指南

中位数和平均数通常结合起来使用,通过比较中位数和平均数的大小关系来判断数据的分布是偏大还是偏小。对于同一组数据,如果:

■平均数>中位数:整体数据中偏大的居多,或有大值的影响,抬高了整体的均值

■平均数<中位数:整体数据中偏小的居多,或有小值的影响,降低了整体的均值。

3、应用场景

(1)电商销售分析:两组产品每日销量的比较

(2)渠道获客流量分析:三个渠道每日新增用户数的比较,渠道获客能力的强弱、是否投放拉新活动和资源等

相关推荐
RE-190115 小时前
Excel基础知识 - 导图笔记
数据分析·学习笔记·excel·思维导图·基础知识·函数应用
eqwaak017 小时前
数据预处理与可视化流水线:Pandas Profiling + Altair 实战指南
开发语言·python·信息可视化·数据挖掘·数据分析·pandas
生物小卡拉1 天前
R脚本——Deseq2差异表达分析--v1.0
windows·经验分享·笔记·学习·信息可视化·数据分析
韩立学长2 天前
【开题答辩实录分享】以《基于python的奶茶店分布数据分析与可视化》为例进行答辩实录分享
开发语言·python·数据分析
B站_计算机毕业设计之家2 天前
python汽车数据分析可视化系统 爬虫 懂车帝 毕业设计 Django框架 vue框架 大数据✅
爬虫·python·数据分析·django·汽车·推荐算法·懂车帝
MoRanzhi12032 天前
12. Pandas 数据合并与拼接(concat 与 merge)
数据库·人工智能·python·数学建模·矩阵·数据分析·pandas
CappuccinoRose2 天前
MATLAB学习文档(二十三)
matlab·信息可视化·数据挖掘·数据分析
你好~每一天3 天前
2025 中小企业 AI 转型:核心岗技能 “怎么证、怎么用”?
人工智能·百度·数据挖掘·数据分析·职业·转行
YangYang9YangYan3 天前
金融分析师技能提升路径与学习资源指南
金融·数据分析
weixin_525936333 天前
金融大数据处理与分析
hadoop·python·hdfs·金融·数据分析·spark·matplotlib