文章目录
一、什么是标准差?
在统计学中,标准差(Standard Deviation)是用于衡量变量值围绕其平均值变化程度的指标。低标准差表示这些值通常接近平均值(也称为期望值),而高标准差则表示这些值分布在更广的范围内。标准差常用于确定哪些值是异常值,哪些不是。
标准差其实就是方差 (variance)的平方根。方差是数据集中每个数值与平均值之间差异的平方的平均值,而标准差则提供了一个与原始数据相同单位的度量,便于理解数据的离散程度。
二、公式
假设,我们有一组数据: X = [ x 1 , x 2 , ... , x N ] X=[x_{1},x_{2}, \dots, x_{N}] X=[x1,x2,...,xN],且每个值都有相同的概率,则标准差公式为:
σ = 1 N Σ i = 1 N ( x i − μ ) 2 \sigma = \sqrt{\frac{1}{N}\Sigma^{N}{i=1}(x{i}-\mu)^{2}} σ=N1Σi=1N(xi−μ)2
其中, μ \mu μ代表均值,公式为:
μ = 1 N Σ i = 1 N x i \mu = \frac{1}{N}\Sigma^{N}{i=1}x{i} μ=N1Σi=1Nxi
三、举个例子🌰
体重总体标准差
要计算总体标准差,首先需要找出每个人体重与平均体重的差值,然后将这些差值平方,接着计算这些平方差值的平均数,最后对这个平均数开平方。以下是这5份体重数据(单位为千克):
X = [ 50 , 55 , 50 , 60 , 50 ] X=[50, 55, 50, 60, 50] X=[50,55,50,60,50]
体重的均值为: μ = 50 + 55 + 50 + 60 + 50 5 = 53 \mu = \frac{50+55+50+60+50}{5}=53 μ=550+55+50+60+50=53
接着,我们计算方差(Variance):
σ 2 = 1 N Σ i = 1 N ( x i − μ ) 2 \sigma^{2}=\frac{1}{N} \Sigma^{N}{i=1}(x{i}-\mu)^{2} σ2=N1Σi=1N(xi−μ)2
套入上述公式,我们可以得到:
( 50 − 53 ) 2 = 9 (50 - 53)^2= 9 (50−53)2=9
( 55 − 53 ) 2 = 4 (55 - 53)^2= 4 (55−53)2=4
( 50 − 53 ) 2 = 9 (50 - 53)^2= 9 (50−53)2=9
( 60 − 53 ) 2 = 49 (60 - 53)^2= 49 (60−53)2=49
( 50 − 53 ) 2 = 9 (50 - 53)^2= 9 (50−53)2=9
σ 2 = 9 + 4 + 9 + 49 + 9 5 = 16 \sigma^{2}=\frac{9+4+9+49+9}{5}=16 σ2=59+4+9+49+9=16
最后,因为标准差等于方差的平方根,所以:
σ = 16 = 4 \sigma=\sqrt{16}=4 σ=16 =4
如果觉得这篇文章有用,就给个赞 👍和收藏⭐️吧!也欢迎在评论区分享你的看法!
参考
- Standard deviation by Wikipedia
- Variance by Wikipedia