目录
[1. 谱理论(谱理论)(Spectral Theorem(Theory))](#1. 谱理论(谱理论)(Spectral Theorem(Theory)))
[2. 矩阵特征值和特征向量的求解](#2. 矩阵特征值和特征向量的求解)
[2.1 求解步骤](#2.1 求解步骤)
[2.2 例子](#2.2 例子)
[3. 特殊矩阵的特征值和特征向量](#3. 特殊矩阵的特征值和特征向量)
[3.1 相似矩阵的特征值求解](#3.1 相似矩阵的特征值求解)
[3.2 初等矩阵的特征值求解(相当于相似矩阵的特例)](#3.2 初等矩阵的特征值求解(相当于相似矩阵的特例))
[3.3 三角矩阵的特征值求解](#3.3 三角矩阵的特征值求解)
1. 谱理论(谱理论)( Spectral Theorem**(** Theory**))**
在线性代数和泛函分析中,谱定理是关于线性算子或矩阵何时可以对角化(即在某个基下可以表示为对角矩阵)的定理。 这非常有用,因为涉及可对角化矩阵的计算通常可以简化为涉及相应对角矩阵的计算。对于有限维向量空间上的算子,对角化的概念相对简单,但对于无限维空间上的算子则需要进行一些修改。一般来说,谱定理确定了一类可以由乘法算子建模的线性算子,而乘法算子是人们所能找到的最简单的算子之一 。用更抽象的语言来说,谱定理是关于交换 代数的一个命题。
谱定理适用于Hilbert空间上的自伴算子,或者更一般地,适用于Hilbert空间上的正规算子。
谱定理还提供了算子作用的底层向量空间的规范分解,称为谱分解。
Augustin-Louis Cauchy证明了对称矩阵的谱定理,即每地个实对称矩阵都是可对角化的。此外,Cauchy也是第一个系统研究行列式的人 。John von Neumann推广的谱定理如今或许是算子理论中最重要的结果。
线性代数中的谱理论将矩阵的特征值/特征向量分析推广到线性算子,尤其关注自伴算子(实对称矩阵/复 Hermite 矩阵),揭示了这些算子可以在由特征向量构成的正交基下对角化,从而简化复杂问题,并构成了量子力学、数据科学(例如 PageRank 算法)和信号处 理等领域的基础。它通过找到一组正交的特征向量基,回答了何时可以将算子简化为对角矩阵(即乘以特征值),从而简化了计算过程 。("谱( spectrum ) "指的是矩阵特征值的分布情况,即矩阵所有特征值之集合。)
几个关键概念:
· 谱 (spectrum)------一个算子(矩阵)的特征值之集合。
· 对角化 (diagonalization)------在特定基(特征向量)下,可以用对角矩阵来表示线性变换。
· 自伴算子(self-adjoint operator)------实对称矩阵或复Hermite矩阵/算子;这是谱定理的关键研究对象。
2. 矩阵特征值和特征向量的求解
关于矩阵(线性变换矩阵)特征值和特征向量的相关知识,我在网文《代数基本概念理解------特征向量和特征值》 中已经做了详细说明。
并非所有方阵都有特征值,但如果允许使用复数,则每一个方阵都至少有一个特征值。实矩阵是否具有实特征值取决于其大小和性质;例如,任何奇数维实矩阵都至少有一个实特征值,但偶数维实矩阵则可能没有。
2.1 求解步骤
我们假设矩阵为A 为一个 n ×n 方阵,我们将这个矩阵看成是一个线性变换T 的矩阵,则有 T (v ) = Av ; 但若这个线性变换是一个缩放变换,则对于一个特征向量v ,有T (v ) = λv ,即 T (v ) = λv = Av ,由 λv = Av 得到 λIv = Av ⟹ (λI - A )v = 0 。要使这个方程有非平凡解,则必需满足 det(λI - A ) = 0 ,即矩阵 (λI - A) 不可逆。
(1) 通过解方程 det(λI - A ) = 0 求得特征值 (可能有多个值)。
(2) 对于每一个 , 通过求基本解 (λI - A )v = 0 来求得基本向量 v≠ 0 。
2.2 例子
1) 令 ,求解其特征值和特征向量。
根据 2.1 的求解步骤,得到
。
求解这个方程,得到 ,
。
我们希望求得使 Av =2v 成立的所有 v ≠ 0 的向量,将特征值 2 代入 (λI - A )v= 0 ,得到
,
假设 v 的两个分量为 ,因此有
,
,
因此,满足 的任意向量都是此矩阵的特征向量,因此,基本向量是
。
同理,将 代入 (λI - A )v = 0,求得特征向量为形如
的任意向量,因此其基本向量为
。
(2) ,求解其特征值和特征向量。
根据 2.1 的求解步骤,得到
,
求得特征值为 ,将其代入 (λI - A )v = 0,求得特征向量分为形如
的任意向量。对于
,,计算得到
,设
,
,则
,因此
,
求得特征向量为形如 的任意向量,因此特征向量的基本向量分别为
和
。
(3) 令 ,求解其特征值和特征向量。
根据 2.1 的求解步骤,得到
求得特征值 ,将其代入 (λI - A )v = 0,得到
,设
, 则
,求得特征向量为形如
的任意向量。对于
,求得 0,得到
,
,设
,则
, 求得特征向量为形如
的任意向量。对于
,求得特征向量为形如
的任意向量。因此,该矩阵的特征向量分别为形如
,
和
的任意向量。
3. 特殊矩阵的特征值和特征向量
我们可以利用三种特殊的矩阵来简化求解特征值和特征向量的过程。在本节中,我们将讨论相似矩阵 、初等矩阵 以及三角矩阵。
3.1 相似矩阵的特征值求解
(1) 相似矩阵之定义
令 A 和 B 分别为 n ×n 矩阵,若存在一个可逆矩阵 P 使得
,
则称A 和 B为相似矩阵。
(2) 相似的特征值求解
相似矩阵具有相同的特征值,但其特征向量往往不同。
3.2 初等矩阵的特征值求解(相当于相似矩阵的特例)
(1) 初等矩阵之定义
令 E 为一个 n ×n 矩阵,若其是将行运算应用到恒等矩阵 而得到的结果,则称其为一个初等矩阵。
初等运算包括:
· 交换矩阵中行的顺序。
· 将任何行乘以非零标量。
· 将一行的倍数加到另一行。
(2) **可以使用初等矩阵来简化矩阵,然后再求其特征值和特征向量。**下面的例子对此进行了说明。
求解矩阵 的特征值。
该矩阵数比较大,我们希望先简化再求解其特征值。
首先,左乘一个初等矩阵 再右乘其逆
,得到
。
再继续 左乘一个初等矩阵 再右乘其逆
, 得到
。
最终得到的矩阵与 A 具有相同的特征值。
3.3 三角矩阵的特征值求解
(1) 三角矩阵之定义
对于一个矩阵 A , 若只要 i >j ,就有 , 则称 A 为上三角阵。因此,这样一个矩阵主对角线以下的元素等于0 。下三角阵的定义类似,其主对角线以上的元素为 0 。
(2) 三角矩阵行列式求解
三角矩阵的行列式等于其主对角线上的元素之积,因此,其特征值就是其对角线上的元素。
令 ,求 A 的特征值。
根据 2.1 的求解步骤,得到
。