神经网络之特征值与特征向量

1. 定义

给定一个方阵 (A∈Rn×n)(A \in \mathbb{R}^{n \times n})(A∈Rn×n),如果存在一个非零向量 (v≠0)(v \neq 0)(v=0) 和一个标量 (λ)(\lambda)(λ),满足
Av=λv A v = \lambda v Av=λv

那么:

  • (v)(v)(v) 称为矩阵 (A)(A)(A) 的特征向量
  • (λ)(\lambda)(λ) 称为矩阵 (A)(A)(A) 的特征值

直观理解

特征向量是经过矩阵变换 (A)(A)(A) 后,只被拉伸或缩放,而不改变方向 的向量。

特征值就是这个拉伸/缩放的倍数。


2. 几何意义

  • 对称矩阵 (A)(A)(A) 可以看作一个线性变换:把空间中的向量映射到另一个向量。

  • 特征向量对应的是变换中保持方向不变的方向。

  • 特征值告诉我们沿这个方向的伸缩程度:

    • (∣λ∣>1)(|\lambda| > 1)(∣λ∣>1):向量被拉长
    • (0<∣λ∣<1)(0 < |\lambda| < 1)(0<∣λ∣<1):向量被缩短
    • (λ<0)(\lambda < 0)(λ<0):方向反向并缩放

例如:
A=20 03,v1=1 0, v2=0 1 A = \begin{bmatrix} 2 & 0 \ 0 & 3 \end{bmatrix}, \quad v_1 = \begin{bmatrix} 1 \ 0 \end{bmatrix}, \ v_2 = \begin{bmatrix} 0 \ 1 \end{bmatrix} A=20 03,v1=1 0, v2=0 1

这里:
Av1=2v1,Av2=3v2 A v_1 = 2 v_1, \quad A v_2 = 3 v_2 Av1=2v1,Av2=3v2

所以 (v1,v2)(v_1, v_2)(v1,v2) 是特征向量,2 和 3 是特征值。几何上就是 x 方向被拉伸 2 倍,y 方向被拉伸 3 倍。


3. 计算方法

  1. 写出特征方程:
    det⁡(A−λI)=0 \det(A - \lambda I) = 0 det(A−λI)=0

    这里 (I)(I)(I) 是单位矩阵。

  2. 解这个多项式方程得到 (λ1,λ2,...,λn)(\lambda_1, \lambda_2, \dots, \lambda_n)(λ1,λ2,...,λn)(特征值)。

  3. 对每个特征值 (λ)(\lambda)(λ),解线性方程组:
    (A−λI)v=0 (A - \lambda I)v = 0 (A−λI)v=0

    得到对应的特征向量 (v)(v)(v)。


4. 特点

  • (n×n)(n \times n)(n×n) 矩阵最多有 (n)(n)(n) 个特征值(可能有重根)。

  • 对称矩阵:

    • 特征值都是实数
    • 不同特征值对应的特征向量是正交的
相关推荐
滴图服务-七七12 分钟前
滴滴地图:精准定位赋能企业数字化转型
大数据·人工智能·地图服务·甲级测绘资质·商业授权
爱学习的程序媛19 分钟前
2026上半年大模型全景技术解读:推理融合、Agent 爆发与多模态统一
人工智能·ai
A.说学逗唱的Coke2 小时前
【大模型专题】向量数据库深度解析:从原理到实战,构建企业级 AI 知识检索底座
数据库·人工智能
果丁智能2 小时前
智能锁赋能网约房民宿数字化管控:身份核验+远程授权,筑牢安全防线、降本增效
网络·数据库·人工智能·安全·智能家居
V搜xhliang02462 小时前
AI智能体的数据安全与合规实践
人工智能·学习·数据分析·自动化·ai编程
PPIO派欧云2 小时前
PPIO登上贵州新闻联播,深化AI算力生态建设
人工智能
hai3152475432 小时前
一种通过空间几何转换进行软件编程计算的方式与现有计算的对比
人工智能·深度学习·数学建模·硬件架构·几何学·图论·拓扑学
猿饵块2 小时前
LibreOffice---文档制作
人工智能
硅谷秋水2 小时前
HARBOR:一个面向具身智体机器人强化学习的驾驭框架
人工智能·深度学习·机器学习·机器人
Mr..Jackey3 小时前
瑞佑 RUI Builder 图形化 UI 设计工具
arm开发·人工智能·单片机·ui·人机交互·ra8889·lcd控制芯片