特征值和特征向量简单入门

目录


什么是特征值?

想象有一面很大的镜子,你站在镜子前。当你往镜子里看时,可以看到自己无限次的映像,每个映像之间都有一段距离。

现在我们把你和镜子里的每个映像想象成一个点,那么这些点就排成了一条线。我们给第一个点(也就是你自己)赋予一个标号0。那么第二个点的标号就是1,第三个点的标号是2,以此类推。

接着,我们定义一个变换规则:对于任何一个点,它的新位置就是将它的旧位置与前一个点的距离之和。

比如,第0点的新位置就是它自己的位置,因为它前面没有点了。第1点的新位置就是0点和1点之间的距离(设为d)。第2点的新位置就是原来第1点的位置加上原来第1点和第2点之间的距离,以此类推。

用数学语言来表示,就是对于第n点,它的新位置是:

新位置 = n * d

这里的d就是所有点之间的固定距离。

现在的问题是,在这个变换规则下,是否存在某些点,经过变换后,仍保持在原位置不动?

如果有,那个位置的点对应的编号n是多少呢?

带入公式,我们得到:

n * d = n

d = 1

也就是说,当距离d=1时,第n=1的那个点不会移动位置!

n=1对应的这个特殊的"不动点"编号,在数学上被称为这个位移变换的特征值。

类似地,对于任何一个线性变换(如旋转、缩放等),都可能存在一些特殊的不变方向,使得沿这些方向的点在变换前后位置不变。这些对应的特殊的"系数",就是这个变换的特征值。

通过分析特征值,我们就可以很方便地理解和描述一个变换对于不同方向的作用效果。

注意:

特征值是一个具体的数值,而不是一个向量。

对于一个n×n的方阵A,它的特征值λ必须满足以下方程:

A × v = λ × v

其中v是A的一个非零特征向量。

什么是特征向量?

在线性代数中,特征向量是与矩阵相关联的一个非零向量,在矩阵变换后,该向量的方向保持不变,只是改变了长度(被缩放)。

假设A是一个n×n的矩阵,如果存在一个非零向量x,使得:

\[Ax = λx \]

那么我们称x为矩阵A的一个特征向量,λ被称为与x相关联的特征值。

案例:

一个直观的例子来解释什么是特征向量。

想象有一套旋转木马,它可以围绕中心旋转。现在,我们把木马上的各个座位看作是二维平面上的不同位置点,用坐标(x,y)来表示。

当木马开始旋转时,每个座位上的点都会按照某个规律在平面上移动。我们用一个2x2的旋转变换矩阵来描述这种移动规律。

比如,假设旋转矩阵是:

A = [ cos90°  -sin90°
      sin90°   cos90° ]

这表示整个平面A绕原点逆时针旋转90度。(一个90度旋转变换的运算规则。)

现在,我们想找出在这个旋转规律下,是否存在某些特殊的位置点,旋转前后,它们的位置只是改变了长度,但方向保持不变?

带入矩阵运算,我们可以得到:

对于位置点(x,y),经过旋转后,新位置是(y,-x)

让我们检查一下坐标轴上的点(1,0)和(0,1):

(1,0) 旋转后 ---> (0,-1)

(0,1) 旋转后 ---> (1,0)

这个就是找到它的一些特征向量,如(1,0)和(0,1)。

发现坐标轴本身的正向量,在旋转前后,只是改变了长度,但是方向保持不变!

(1,0)和(0,1)就是这个90度旋转变换矩阵的两个特征向量。

类似地,对于任何一种旋转变换,我们都可以找到若干个特征向量,它们在旋转前后,只是长度改变了,但方向保持不变。

这些特征向量的方向,可以帮助我们很好地理解和描述旋转变换对于不同方向的作用效果。

注意:

特征向量需要满足方程: Av = λv

其中,v是特征向量, λ是相应的特征值(一个标量)

特征向量的性质

  • 它是矩阵变换的不变量,可以用来简化矩阵运算。
  • 对于对角化矩阵,特征向量组成了一组基,可以将矩阵对角化。
  • 在主成分分析(PCA)降维中,主成分就是数据的特征向量。
  • 在图像处理中,特征向量可以提取图像的主要特征。
  • 在机器学习中,特征向量广泛用于数据的降维、特征提取等。

特征向量有什么用?

特征向量在许多领域有着重要的应用,主要用途包括:

数据分析和降维

  • 主成分分析(PCA)利用数据的主要特征向量来降低数据维度,去除噪声和冗余信息。
  • 在机器学习和模式识别中,特征向量常用于特征提取和降维。

简化矩阵计算

  • 对角矩阵可由其特征向量和特征值构建。
  • 利用特征向量可简化矩阵的幂运算等。

动态系统分析

  • 线性动态系统的特征向量描述了系统的固有模式。
  • 分析特征向量可以研究系统的稳定性和响应行为。

图像处理

  • 特征向量可用于提取图像的主要成分,进行图像压缩、检索等。
  • 也可用于人脸识别、图像分割等任务。

信号处理

  • 特征向量描述了信号的主要成分。
  • 可用于信号去噪、压缩、频谱分析等。

结构分析

  • 材料力学中,特征向量对应结构的振动模态。
  • 气动力学中,特征向量与流场模态相关。

特征向量入门案例

一个简单的例子,用初中数学水平就可以理解特征向量的应用。

假设你有一个2x2的变换矩阵A:

A = [ 2 1 ]
    [ 1 3 ]

我们想找到A的特征向量。

首先,我们构造方程:

Ax = λx

代入A和x后得到:

[ 2 1 ] [ x1 ] = λ [ x1 ]
[ 1 3 ] [ x2 ]     [ x2 ]

把等式两边 列开:

2x1 + x2  = λx1
x1  + 3x2 = λx2

这是一个方程组,我们可以解出λ和x1,x2的值。

计算过程省略,最终结果是:

λ1 = 4, x1 = [1,  1]
λ2 = 1, x2 = [1, -2]

所以矩阵A有两个特征值λ1=4, λ2=1,对应的特征向量分别是x1=[1,1], x2=[1,-2]

这个例子说明,对于一个2x2矩阵,它有两个不同的特征向量,描述了该矩阵对于不同方向向量的作用效果。

在实际应用中,我们可以利用这些特征向量:

  • 可以发现矩阵变换对于x1=[1,1]和x2=[1,-2]的作用效果。
  • 可以将矩阵用特征向量和特征值来表示,简化计算。
  • 在图像、信号处理等领域,可以利用特征向量提取主要信息。

特征值描述了矩阵对应特征向量的缩放量

  • 对于λ1=4, 意味着矩阵A将沿着特征向量x1=[1,1]的方向放大4倍。
  • 对于λ2=1, 意味着矩阵A将沿着特征向量x2=[1,-2]的方向保持不变。

特征值可以判断矩阵的性质:

  • 如果所有特征值都大于1,说明矩阵是一个扩大变换。
  • 如果所有特征值都小于1,说明矩阵是一个缩小变换。
  • 如果存在负值特征值,说明矩阵会产生翻转。

动态系统分析 中:

正实数、负实数和复数特征值在动态系统中对应的不同模式。

  • 正的实数特征值对应了稳定的模式。
    假设你有一个质量为1kg的物体,系着一根弹簧,弹簧常数为k=4N/m。按照弹性力定律,它会有一个稳定的平衡位置。
    如果你将物体拉动一段距离,然后松手,物体会以一个固定的频率做单振动,渐渐减小幅度,最终回到平衡位置。这种趋于稳定的运动,对应了一个正实数特征值。
  • 负的实数特征值对应了振荡的模式。
    想象一个质量为1kg的物体,系在一根长度为1m的无质量杆的一端,另一端固定。这是一个单摆系统。
    如果你给单摆一个初始位移,它会做周期性的振荡运动,左右摆动。这种不断重复的摆动运动,对应了一个负实数特征值,代表了一种振荡模式。
  • 复数特征值对应旋转或者旋涡的模式。
    想象一个装有水的大桶,你用一个搅拌器在中心快速旋转搅拌水。水会形成一个持续的漩涡状旋转。
    这种持续不断的旋转运动,对应了一对复数特征值(实部决定增长/衰减,虚部决定旋转频率)。复数特征值描述了这种旋转或涡流的模式。

可以利用特征值简化矩阵的计算:

  • 对角矩阵的n次幂只需要把对角线元素(特征值)进行n次幂运算即可。
  • 一些其他矩阵的幂运算也可以借助特征值和向量来简化。
相关推荐
martian6657 天前
深入详解线性代数基础知识:理解矩阵与向量运算、特征值与特征向量,以及矩阵分解方法(如奇异值分解SVD和主成分分析PCA)在人工智能中的应用
人工智能·线性代数·矩阵·特征向量
耗不尽的先生1 个月前
【数学】通用三阶矩阵特征向量的快速求法 超简单!!!
人工智能·线性代数·矩阵·特征向量
SuperHeroWu71 个月前
【HarmonyOS】鸿蒙应用低功耗蓝牙BLE的使用心得 (二)
华为·harmonyos·低功耗蓝牙·ble·扫描·特征值·广播
Mysticbinary7 个月前
主成分分析(PCA)介绍
特征向量·主要成分分析
Wyn_7 个月前
【python】numpy库计算矩阵特征值和特征向量
python·numpy·邻接矩阵·特征值·特征向量
JarodYv7 个月前
【白话机器学习系列】白话特征向量
人工智能·线性代数·机器学习·矩阵·特征值·特征向量
松下J278 个月前
线性代数 --- 矩阵的对角化以及矩阵的n次幂
线性代数·矩阵·特征值·特征向量·矩阵的对角化·矩阵的n次幂·矩阵的幂
松下J2710 个月前
线性代数 --- 特征值与特征向量
人工智能·线性代数·算法·机器学习·特征值·特征向量
你哥同学1 年前
【数值分析】乘幂法,matlab实现
开发语言·线性代数·matlab·特征值·特征向量·乘幂法