描述性统计:分析数据的分布情况:中位数和平均数

1、数学定义和业务含义

中位数和平均数是用于对一组数据进行描述的统计量。

中位数是指将一组数据按照大小顺序排列后,中间位置上的数值,即一半数据大于它,一半数据小于它。如果数据的个数是偶数,则中位数是中间两个数的平均数。

平均数是指将一组数据的所有数值相加,然后除以数据的个数得到的值。平均数也被称为算术平均数或均值。

中位数和平均数都是描述数据集中趋势的指标。对于正态分布的数据,中位数和平均数是相等的,但对于非正态分布的数据,它们的值可能会存在差异。选择使用哪个统计量取决于具体情况,例如数据的分布情况,样本容量等。

2、使用指南

中位数和平均数通常结合起来使用,通过比较中位数和平均数的大小关系来判断数据的分布是偏大还是偏小。对于同一组数据,如果:

■平均数>中位数:整体数据中偏大的居多,或有大值的影响,抬高了整体的均值

■平均数<中位数:整体数据中偏小的居多,或有小值的影响,降低了整体的均值。

3、应用场景

(1)电商销售分析:两组产品每日销量的比较

(2)渠道获客流量分析:三个渠道每日新增用户数的比较,渠道获客能力的强弱、是否投放拉新活动和资源等

相关推荐
学掌门4 分钟前
用Python做数据分析之数据表清洗
数据挖掘·数据分析
人大博士的交易之路4 小时前
今日行情明日机会——20251104
大数据·数据挖掘·数据分析·缠论·涨停回马枪·道琼斯结构
hweiyu0018 小时前
Hive 技术深度解析与 P7 数据分析架构师多行业全场景实战课程合集(视频教程)
hive·数据分析
sensen_kiss1 天前
INT303 Big Data Analysis 大数据分析 Pt.3 数据挖掘(Data Mining)
大数据·数据挖掘·数据分析
B站计算机毕业设计之家1 天前
Python招聘数据分析可视化系统 Boss直聘数据 selenium爬虫 Flask框架 数据清洗(附源码)✅
爬虫·python·selenium·机器学习·数据分析·flask
雪碧聊技术1 天前
爬虫是什么?
大数据·爬虫·python·数据分析
没有梦想的咸鱼185-1037-16631 天前
【生命周期评价(LCA)】基于OpenLCA、GREET、R语言的生命周期评价方法、模型构建
开发语言·数据分析·r语言
TwoAnts&DingJoy1 天前
数据分析-数据沙箱
人工智能·python·安全·数据分析·数据沙箱
Hello.Reader1 天前
用 Spark Shell 做交互式数据分析从入门到自包含应用
大数据·数据分析·spark
Bony-1 天前
生活方式与肥胖风险:多维度数据分析与预测模型研究
数据挖掘·数据分析·生活