神经网络之协方差

1️⃣ 协方差的定义

概念

协方差(Covariance)衡量 两个随机变量的线性关系强弱和方向

  • 对随机变量 (X)(X)(X) 和 (Y)(Y)(Y):
    cov(X,Y)=E(X−E\[X)⋅(Y−EY)] \text{cov}(X, Y) = \mathbb{E}(X - \\mathbb{E}\[X) \cdot (Y - \mathbb{E}Y)] cov(X,Y)=E(X−E\[X)⋅(Y−EY)]

  • 对样本数据 ((X1,Y1),...,(Xn,Yn))((X_1, Y_1), \dots, (X_n, Y_n))((X1,Y1),...,(Xn,Yn)):
    cov(X,Y)=1n−1∑i=1n(Xi−Xˉ)(Yi−Yˉ) \text{cov}(X, Y) = \frac{1}{n-1} \sum_{i=1}^{n} (X_i - \bar{X})(Y_i - \bar{Y}) cov(X,Y)=n−11i=1∑n(Xi−Xˉ)(Yi−Yˉ)

⚡ 核心思想:测量两个变量"共同偏离均值的程度"。


2️⃣ 协方差的理论基础

(1) 概率论视角

  • 协方差是两个变量 偏离自身均值的乘积的期望
  • 如果 (X)(X)(X) 和 (Y)(Y)(Y) 同方向波动 → 协方差为正
  • 如果 (X)(X)(X) 和 (Y)(Y)(Y) 反方向波动 → 协方差为负
  • 协方差为零 → 两变量无线性关系(可能非线性相关)

cov(X,Y)=E(X−E\[X)(Y−EY)] \text{cov}(X,Y) = \mathbb{E}(X-\\mathbb{E}\[X)(Y-\mathbb{E}Y)] cov(X,Y)=E(X−E\[X)(Y−EY)]

(2) 线性代数视角

  • 将样本看作向量 (X,Y)(\mathbf{X}, \mathbf{Y})(X,Y)
    X=(X1,...,Xn),Y=(Y1,...,Yn) \mathbf{X} = (X_1, ..., X_n), \quad \mathbf{Y} = (Y_1, ..., Y_n) X=(X1,...,Xn),Y=(Y1,...,Yn)

  • 中心化向量:
    Xc=X−Xˉ1,Yc=Y−Yˉ1 \mathbf{X}_c = \mathbf{X} - \bar{X}\mathbf{1},\quad \mathbf{Y}_c = \mathbf{Y} - \bar{Y}\mathbf{1} Xc=X−Xˉ1,Yc=Y−Yˉ1

  • 协方差可写为 向量内积形式
    cov(X,Y)=1n−1Xc⊤Yc \text{cov}(X,Y) = \frac{1}{n-1} \mathbf{X}_c^\top \mathbf{Y}_c cov(X,Y)=n−11Xc⊤Yc

  • 几何意义:

    • 内积大 → 方向相似 → 正相关
    • 内积负 → 方向相反 → 负相关
    • 内积为零 → 向量正交 → 无线性关系

3️⃣ 协方差的性质

  1. 对称性
    cov(X,Y)=cov(Y,X) \text{cov}(X,Y) = \text{cov}(Y,X) cov(X,Y)=cov(Y,X)

  2. 方差是特殊情况
    var(X)=cov(X,X)≥0 \text{var}(X) = \text{cov}(X,X) \ge 0 var(X)=cov(X,X)≥0

  3. 线性关系
    cov(aX+b,Y)=a⋅cov(X,Y) \text{cov}(aX+b, Y) = a \cdot \text{cov}(X,Y) cov(aX+b,Y)=a⋅cov(X,Y)
    cov(X,aY+b)=a⋅cov(X,Y) \text{cov}(X, aY+b) = a \cdot \text{cov}(X,Y) cov(X,aY+b)=a⋅cov(X,Y)

  4. 协方差为零 ≠ 独立

  • 协方差为零只说明无线性关系
  • 非线性关系仍可能存在

4️⃣ 协方差矩阵(多维扩展)

  • 对 (d)(d)(d) 维随机变量 (X=X1,...,Xd⊤)(\mathbf{X} = X_1, ..., X_d^\top)(X=X1,...,Xd⊤):
    Σ=Cov(X)=cov(X1,X1)...cov(X1,Xd) ⋮⋱⋮ cov(Xd,X1)...cov(Xd,Xd) \Sigma = \text{Cov}(\mathbf{X}) = \begin{bmatrix} \text{cov}(X_1,X_1) & ... & \text{cov}(X_1,X_d)\ \vdots & \ddots & \vdots \ \text{cov}(X_d,X_1) & ... & \text{cov}(X_d,X_d) \end{bmatrix} Σ=Cov(X)=cov(X1,X1)...cov(X1,Xd) ⋮⋱⋮ cov(Xd,X1)...cov(Xd,Xd)

  • 性质

    • 对称半正定矩阵
    • 可进行特征分解 → PCA、降维、马氏距离等

5️⃣ 协方差的应用场景

场景 用途
金融投资 股票收益协方差 → 投资组合风险管理、资产配置
统计分析 回归分析、相关性分析、线性关系度量
机器学习 特征选择、协方差矩阵用于PCA降维
时间序列 自协方差、交叉协方差 → 滞后关系分析、预测
信号处理 测量信号同步性、滤波、去噪

6️⃣ 协方差与相关系数的关系

  • 协方差单位依赖,不便直接比较
  • 通过标准化得到皮尔逊相关系数:
    rXY=cov(X,Y)σXσY∈−1,1 r_{XY} = \frac{\text{cov}(X,Y)}{\sigma_X \sigma_Y} \in -1,1 rXY=σXσYcov(X,Y)∈−1,1

💡 直观理解

  • 协方差 = "两个变量波动方向的平均内积"
  • 正 → 同方向波动
  • 负 → 反方向波动
  • 0 → 没有线性关系
相关推荐
美团技术团队1 天前
ICML 2026 | 美团技术团队学术论文精选
人工智能
moMo1 天前
你的每一次对话,都是第一次
人工智能
不加辣椒1 天前
第13章 检索增强提示工程
人工智能
小爷毛毛_卓寿杰1 天前
我把 397B 的「Agentic 大脑」塞进了 Xinference,一键部署 Nex-N2
人工智能·架构·github
smallYoung1 天前
Vibe Coding 笔记-中
人工智能
米小虾1 天前
DSpark:让大模型"写得更快"的秘密武器
人工智能·deepseek
JavaGuide1 天前
比 iTerm2 更适合 Claude Code/Codex 的终端,我换成 Ghostty 了
人工智能·后端
threerocks1 天前
神级 Skill,作品个个儿爆,我开源了长期自用的手绘风格库
人工智能·aigc
小爷毛毛_卓寿杰1 天前
我把一个 3B 模型塞进了 Xinference,然后它干掉了 DeepSeek V3.2
人工智能·开源·github
秦先生在广东1 天前
Agent 闭环才是真正的护城河:Anthropic “300 个 Agent“ 背后被忽视的秘密
人工智能