【R基础】一组数据计算均值、方差与标准差方法及意义

【R基础】一组数据计算均值、方差与标准差方法及意义

均值、方差与标准差是用来描述数据分布情况

均值:用来衡量一组数据整体情况。

数据离散程度度量标准:

方差(均方,s^2,总体参数,离均差平方和):衡量数据集内样本间分散程度。单位是平方,没具体意义,故使用标准差。

总体方差

s2=[(x1-x)2 +...(xn-x)^2]/n

标准差(又称:均方差):是方差的算术平方根,单位与总体一致。

s=sqrt(s^2)

描述数据的离散程度,反映数据与其均值间的偏离程度,绝对值越大,数据越分散,数据间差异性越大,代表大部分数值和其平均值之间差异较大。较小的标准差,代表这些数值较接近平均值,数据集中。

平均数相同的两组数据,标准差未必相同。

变异系数CV=标准差/均值 *100%

平均值+标准差:

假设一组数据完全符合状态分布,那么这个数据集中 均值± 标准差可以快速了解数据集的整体变动情况。样本值落入-σ 到+σ即±σ区间的概率为68.3%;落入±2σ和±3σ区间的概率分别为95.4%和99.7%

标准误: 也称标准误差,,是描述对应的样本统计量抽样分布的离散程度及衡量对应样本统计量抽样误差大小的尺度。样本容量越大,标准误越小,那么抽样误差就越小,就表明所抽取的样本能够较好地代表总体。



R语言实操

javascript 复制代码
> # 创建一个样本数据
> data <- c(1:15)
> # 均值
> m<-mean(data)
> #计算标准差SD
> s<-sd(data)
> # 样本容量
> n<-length(data)
> #计算标准误
> se<-s/sqrt(n)
> m
[1] 8
> s
[1] 4.472136
> n
[1] 15
> se
[1] 1.154701
m
[1] 8
> s
[1] 4.472136
> n
[1] 15
> se
[1] 1.154701
相关推荐
threelab1 分钟前
three案例 Three.js波纹效果演示
开发语言·javascript·ecmascript
黎明smaly14 分钟前
【排序】插入排序
c语言·开发语言·数据结构·c++·算法·排序算法
辣辣y30 分钟前
python基础day08
开发语言·python
Json____1 小时前
使用python的 FastApi框架开发图书管理系统-前后端分离项目分享
开发语言·python·fastapi·图书管理系统·图书·项目练习
人生在勤,不索何获-白大侠1 小时前
day16——Java集合进阶(Collection、List、Set)
java·开发语言
LIN-JUN-WEI2 小时前
[ESP32]VSCODE+ESP-IDF环境搭建及blink例程尝试(win10 win11均配置成功)
c语言·开发语言·ide·vscode·单片机·学习·编辑器
望获linux2 小时前
【Linux基础知识系列】第四十三篇 - 基础正则表达式与 grep/sed
linux·运维·服务器·开发语言·前端·操作系统·嵌入式软件
留不住丨晚霞3 小时前
说说SpringBoot常用的注解?
java·开发语言
hardStudy_h3 小时前
C++——内联函数与Lambda表达式
开发语言·jvm·c++
艾莉丝努力练剑4 小时前
【C语言】学习过程教训与经验杂谈:思想准备、知识回顾(三)
c语言·开发语言·数据结构·学习·算法