【漫话机器学习系列】208.标准差(Standard Deviation)


深入理解标准差:从总体到样本的数学之旅

标准差(Standard Deviation)是统计学中最常用的描述性指标之一,它衡量的是一组数据的离散程度,即数据相对于平均值的波动程度。理解标准差不仅是学习统计的基础,也对数据分析、机器学习、科学研究等领域具有重要意义。

今天我们通过一张极具美感又内容详实的手绘图,来系统性地理解标准差的定义、公式结构及其背后的逻辑。


一、什么是标准差?

标准差的本质是一种"平均偏差的平方根"。它告诉我们数据点通常距离平均值有多远。

  • 若标准差 :数据点集中在平均值附近,波动性小;
  • 若标准差 :数据点分散,波动性大。

二、总体标准差(σ)

当我们能获取全部数据(总体)时,计算标准差的公式如下:

<math xmlns="http://www.w3.org/1998/Math/MathML"> σ = 1 n ∑ i = 1 n ( x i − μ ) 2 \sigma = \sqrt{\frac{1}{n} \sum_{i=1}^{n} (x_i - \mu)^2} </math>σ=n1∑i=1n(xi−μ)2

从图中可见,这个公式由多个部分构成:

符号 含义 图中说明
σ 总体标准差 标题"标准差"下方公式
n 总体个数 用红色注明"总体个数"
<math xmlns="http://www.w3.org/1998/Math/MathML"> x i x_i </math>xi 第 i 个观测值 用绿色注明"观察值"
μ 总体均值 用橙色注明"总体均值"

总体标准差解释:

  1. 差值:每个观测值减去总体均值,反映偏差。
  2. 平方:避免正负抵消,同时放大偏差。
  3. 求平均:对所有平方后的偏差值求平均。
  4. 开根号:还原单位,得到标准差。

三、样本标准差(S)

在实际生活中,我们往往只能抽取"样本"进行分析。这时,需要使用"样本标准差"公式:

<math xmlns="http://www.w3.org/1998/Math/MathML"> S = 1 n − 1 ∑ i = 1 n ( x i − x ˉ ) 2 S = \sqrt{\frac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{x})^2} </math>S=n−11∑i=1n(xi−xˉ)2

与总体标准差的差异主要体现在两个地方:

变化部分 含义说明 图中标记
分母为 n-1 贝塞尔修正(Bessel's Correction) 用红色标注"贝塞尔修正"
均值为 <math xmlns="http://www.w3.org/1998/Math/MathML"> x ˉ \bar{x} </math>xˉ 样本均值 橙色箭头标"样本均值"

为什么要减 1(n - 1)?

这就是著名的贝塞尔修正(Bessel's Correction) ,目的是让样本标准差成为总体标准差的无偏估计。因为样本均值 <math xmlns="http://www.w3.org/1998/Math/MathML"> x ˉ \bar{x} </math>xˉ 是从数据中计算出来的,会低估总体的离散程度,所以在分母上减 1 进行校正。


四、标准差 VS 方差

你可能注意到标准差公式中的平方项:

<math xmlns="http://www.w3.org/1998/Math/MathML"> ( x i − μ ) 2 (x_i - \mu)^2 </math>(xi−μ)2

其实,这部分没有开根号时的结果就叫"方差(Variance) "。

指标 定义
方差 偏差的平方的平均值
标准差 方差的平方根
单位 方差单位为原单位的平方,标准差单位与原数据一致

五、图中亮点解析

这张由 Chais Albon 绘制的手绘图,将公式进行了颜色区分,帮助我们快速理解各部分含义:

  • 红色:强调了总体/样本数量,以及贝塞尔修正。
  • 绿色 :表示每个观测值 <math xmlns="http://www.w3.org/1998/Math/MathML"> x i x_i </math>xi。
  • 橙色 :表示均值(总体均值 μ 或样本均值 <math xmlns="http://www.w3.org/1998/Math/MathML"> x ˉ \bar{x} </math>xˉ)。
  • 结构清晰:对比两种标准差公式差异,一目了然。

非常适合初学者或复习者作为思维导图或知识卡片使用。


六、小结与应用场景

类型 公式 适用场景
总体标准差 <math xmlns="http://www.w3.org/1998/Math/MathML"> σ = 1 n ∑ ( x i − μ ) 2 \sigma = \sqrt{\frac{1}{n} \sum (x_i - \mu)^2} </math>σ=n1∑(xi−μ)2 拿到全部数据
样本标准差 <math xmlns="http://www.w3.org/1998/Math/MathML"> S = 1 n − 1 ∑ ( x i − x ˉ ) 2 S = \sqrt{\frac{1}{n-1} \sum (x_i - \bar{x})^2} </math>S=n−11∑(xi−xˉ)2 只拿到一部分样本数据

应用领域包括:

  • 数据分析(分析数据波动范围)
  • 金融(测量风险)
  • 机器学习(损失函数、正则化)
  • 工业(产品一致性)

七、结语

标准差不仅是公式,更是一个反映"稳定性"的直观指标。无论是在科研、工程、还是商业决策中,它都扮演着举足轻重的角色。希望通过本文和这张清晰的手绘图,你能真正"看懂"标准差的每一个符号和背后的意义。

相关推荐
ATM0061 小时前
人机协作系列(四)AI编程的下一个范式革命——看Factory AI如何重构软件工程?
人工智能·大模型·agent·人机协作·人机协同
读创商闻2 小时前
极狐GitLab CEO 柳钢——极狐 GitLab 打造中国企业专属 AI 编程平台,引领编程新潮流
人工智能·gitlab
kailp2 小时前
语言模型玩转3D生成:LLaMA-Mesh开源项目
人工智能·3d·ai·语言模型·llama·gpu算力
marteker2 小时前
弗兰肯斯坦式的人工智能与GTM策略的崩溃
人工智能·搜索引擎
无心水2 小时前
大语言模型零样本情感分析实战:无需机器学习训练,96%准确率实现指南
人工智能·机器学习·语言模型
来自于狂人2 小时前
AI大模型训练的云原生实践:如何用Kubernetes指挥千卡集群?
人工智能·云原生·kubernetes
橡晟7 小时前
深度学习入门:让神经网络变得“深不可测“⚡(二)
人工智能·python·深度学习·机器学习·计算机视觉
墨尘游子7 小时前
神经网络的层与块
人工智能·python·深度学习·机器学习
Leah01057 小时前
什么是神经网络,常用的神经网络,如何训练一个神经网络
人工智能·深度学习·神经网络·ai
PyAIExplorer8 小时前
图像亮度调整的简单实现
人工智能·计算机视觉