描述性统计:分析数据的分布情况:中位数和平均数

1、数学定义和业务含义

中位数和平均数是用于对一组数据进行描述的统计量。

中位数是指将一组数据按照大小顺序排列后,中间位置上的数值,即一半数据大于它,一半数据小于它。如果数据的个数是偶数,则中位数是中间两个数的平均数。

平均数是指将一组数据的所有数值相加,然后除以数据的个数得到的值。平均数也被称为算术平均数或均值。

中位数和平均数都是描述数据集中趋势的指标。对于正态分布的数据,中位数和平均数是相等的,但对于非正态分布的数据,它们的值可能会存在差异。选择使用哪个统计量取决于具体情况,例如数据的分布情况,样本容量等。

2、使用指南

中位数和平均数通常结合起来使用,通过比较中位数和平均数的大小关系来判断数据的分布是偏大还是偏小。对于同一组数据,如果:

■平均数>中位数:整体数据中偏大的居多,或有大值的影响,抬高了整体的均值

■平均数<中位数:整体数据中偏小的居多,或有小值的影响,降低了整体的均值。

3、应用场景

(1)电商销售分析:两组产品每日销量的比较

(2)渠道获客流量分析:三个渠道每日新增用户数的比较,渠道获客能力的强弱、是否投放拉新活动和资源等

相关推荐
数据蜂巢5 小时前
中国地面资料V3数据集
数据分析
乔江seven9 小时前
【python 数据分析】 Numpy、pandas、matplotlib
数据分析·numpy·pandas
wayz119 小时前
Momentum:CTI(相关趋势指标)技术指标详解
算法·金融·数据分析·量化交易·特征工程
码界筑梦坊1 天前
282-基于Python的豆瓣音乐可视化分析推荐系统
开发语言·python·信息可视化·数据分析·flask·vue
汽车仪器仪表相关领域1 天前
Kvaser Hybrid CAN/LIN 单通道三合一总线分析仪:高性价比CAN FD/LIN集成测试利器
运维·服务器·网络·数据挖掘·数据分析·单元测试·集成测试
KaMeidebaby1 天前
卡梅德生物技术快报|基因测序技术在 46,XY 性发育障碍变异筛查中的流程与数据分析
服务器·前端·数据库·人工智能·算法·数据挖掘·数据分析
wayz111 天前
Momentum:CFO(钱德预测震荡指标)技术指标详解
金融·数据分析·量化交易·特征工程
追风少年ii1 天前
分子对接--3维构象定量关系(3D-QSAR)
数据分析·分子动力学·分子对接
Quincy_Freak2 天前
银河麒麟aarch64如何高效做数据分析?分享一款内网离线数据分析利器
大数据·数据库·数据挖掘·数据分析·aarch64
Aloudata2 天前
AI 黑盒生成 vs 原子语义组合:企业指标生产路径深度对比
大数据·人工智能·数据分析·指标平台·语义层