考研线代第五课:特征值基础与相似对角化

文章目录

  • 一、特征值与特征向量的核心概念
    • 1.1 定义(仅针对方阵)
    • 1.2 核心性质
      • 1.2.1 特征向量的非零性(核心约束)
      • 1.2.2 等价变形与特征方程
    • 1.3 补充概念
  • 二、特征值与特征向量的求解流程
    • 2.1 求特征值
    • 2.2 求特征向量
    • 2.3 示例(2阶矩阵求解)
  • 三、特征值与特征向量的性质
    • 3.1 特征值的性质
      • 3.1.1 特征值的判定
      • 3.1.2 核心衍生性质
    • 3.2 特征向量的性质
    • 3.3 特殊矩阵的特征值与特征向量
    • 3.4 常用矩阵特征值与特征向量对照表
  • 四、矩阵的相似
    • 4.1 定义
    • 4.2 相似矩阵的性质
      • 4.2.1 等价关系(自反/对称/传递)
      • 4.2.2 相似不变量(必要条件,核心必考)
      • 4.2.3 多项式传递性
    • 4.3 矩阵相似的判别方法
  • 五、矩阵的相似对角化
    • 5.1 定义
    • 5.2 相似对角化的条件
    • 5.3 相似对角化的步骤
    • 5.4 例题(矩阵幂计算)
  • 六、实对称矩阵的正交相似对角化
    • 6.1 实对称矩阵的特殊性质
    • 6.2 正交相似对角化的步骤
    • 6.3 示例(实对称矩阵正交对角化)

一、特征值与特征向量的核心概念

1.1 定义(仅针对方阵)

设AAA是nnn阶方阵,若存在数λ\lambdaλ和非零 nnn维列向量x\boldsymbol{x}x,满足Ax=λxA\boldsymbol{x} = \lambda \boldsymbol{x}Ax=λx,则

  • λ\lambdaλ称为AAA的特征值,描述矩阵对特征向量的伸缩倍数(保持共线关系);
  • 非零向量x\boldsymbol{x}x称为AAA对应于λ\lambdaλ的特征向量 (向量AxAxAx与xxx线性相关)。

核心关联:

  • nnn阶方阵的特征值(计重数)共nnn个,是特征方程的nnn个根,对应nnn维空间线性变换的nnn个(含重数)独立伸缩方向;
  • 特征值是方阵的「方向固有属性」,行列式是特征值的乘积(「整体衍生属性」):∏i=1nλi=∣A∣\prod_{i=1}^n \lambda_i = |A|∏i=1nλi=∣A∣,行列式反映全局缩放效果,无法反推单个特征值。
  • 矩阵对应特征值λ\lambdaλ的全部特征向量,就是齐次线性方程组(A−λE)x=0(A-\lambda E)x=0(A−λE)x=0基础解系的所有非零线性组合。基础解系是特征向量的 "代表",所有特征向量都能由基础解系线性表示,但特征向量≠基础解系。

1.2 核心性质

1.2.1 特征向量的非零性(核心约束)

特征向量必须是非零向量。若x=0\boldsymbol{x} = \boldsymbol{0}x=0,则对任意λ\lambdaλ都满足A0=λ0A\boldsymbol{0} = \lambda \boldsymbol{0}A0=λ0,无法体现矩阵的 "特征",故无意义。

1.2.2 等价变形与特征方程

定义式可变形为(A−λE)x=0(A - \lambda E)\boldsymbol{x} = \boldsymbol{0}(A−λE)x=0。该齐次线性方程组有非零解的充要条件 是系数矩阵的行列式为 0,即:∣A−λE∣=0|A - \lambda E| = 0∣A−λE∣=0,此式称为特征方程 ,f(λ)=∣A−λE∣f(\lambda) = |A - \lambda E|f(λ)=∣A−λE∣称为特征多项式

矩阵A−λEA-\lambda EA−λE称为特征矩阵,形式为:

A−λE=[a11−λa12⋯a1na21a22−λ⋯a2n⋮⋮⋮an1an2⋯ann−λ] A - \lambda E = \begin{bmatrix} a_{11}-\lambda & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22}-\lambda & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn}-\lambda \end{bmatrix} A−λE= a11−λa21⋮an1a12a22−λ⋮an2⋯⋯⋯a1na2n⋮ann−λ

1.3 补充概念

概念 精准定义 关键公式/说明
特征子空间 对应同一特征值λ\lambdaλ的所有特征向量(非零)加上零向量构成的nnn维向量空间,记为VλV_\lambdaVλ Vλ={x∈Rn∣(A−λE)x=0}V_\lambda = \{\boldsymbol{x} \in \mathbb{R}^n \mid (A - \lambda E)\boldsymbol{x} = \boldsymbol{0}\}Vλ={x∈Rn∣(A−λE)x=0}
代数重数 特征值λ\lambdaλ在特征多项式中的重根次数,记为mλm_\lambdamλ 如f(λ)=(λ−2)3(λ+1)f(\lambda)=(\lambda-2)^3(\lambda+1)f(λ)=(λ−2)3(λ+1),则λ=2\lambda=2λ=2的代数重数m2=3m_2=3m2=3
几何重数 特征子空间VλV_\lambdaVλ的维数(即(A−λE)x=0(A - \lambda E)\boldsymbol{x}=\boldsymbol{0}(A−λE)x=0基础解系的向量个数),记为gλg_\lambdagλ gλ=n−r(A−λE)g_\lambda = n - r(A -\lambda E)gλ=n−r(A−λE)(r(A−λE)=r(λE−A)r(A - \lambda E) = r(\lambda E - A)r(A−λE)=r(λE−A))

重要注记:

  1. 非方阵无特征值/特征向量,可通过ATAA^TAATA(nnn阶)或AATAA^TAAT(mmm阶)间接分析(AAA为m×nm \times nm×n矩阵);
  2. 几何重数 ≤ 代数重数(gλ≤mλg_\lambda \leq m_\lambdagλ≤mλ)是矩阵的普遍性质,也是判定矩阵可对角化的核心依据(需满足gλ=mλg_\lambda = m_\lambdagλ=mλ)。

二、特征值与特征向量的求解流程

2.1 求特征值

解特征方程∣A−λE∣=0|A - \lambda E| = 0∣A−λE∣=0,得λ1,λ2,...,λn\lambda_1, \lambda_2, \dots, \lambda_nλ1,λ2,...,λn(含重根)。

✅ 实用技巧:计算行列式时优先利用"按行/列展开""提取公因子""行/列变换化简",避免直接展开3阶及以上行列式。

2.2 求特征向量

对每个特征值λi\lambda_iλi,解(A−λiE)x=0(A - \lambda_i E)\boldsymbol{x} = \boldsymbol{0}(A−λiE)x=0(与(λiE−A)x=0(\lambda_i E - A)\boldsymbol{x} = \boldsymbol{0}(λiE−A)x=0等价,系数矩阵仅差负号,解相同):

  1. 对系数矩阵A−λiEA - \lambda_i EA−λiE做初等行变换,化为行最简阶梯形矩阵
  2. 确定自由未知量个数(即几何重数gλi=n−r(A−λiE)g_{\lambda_i} = n - r(A - \lambda_i E)gλi=n−r(A−λiE));
  3. 令自由未知量依次取标准单位向量形式(如1,0,...,01,0,\dots,01,0,...,0;0,1,...,00,1,\dots,00,1,...,0等),得到基础解系ξ1,ξ2,...,ξgλi\boldsymbol{\xi}1, \boldsymbol{\xi}2, \dots, \boldsymbol{\xi}{g{\lambda_i}}ξ1,ξ2,...,ξgλi(线性无关特征向量);
  4. 对应λi\lambda_iλi的全部特征向量 为:基础解系的所有非零线性组合,即k1ξ1+k2ξ2+⋯+kgλiξgλi(k1,k2,...,kgλi 不同时为 0)k_1\boldsymbol{\xi}1 + k_2\boldsymbol{\xi}2 + \dots + k{g{\lambda_i}}\boldsymbol{\xi}{g{\lambda_i}} \quad (k_1,k_2,\dots,k_{g_{\lambda_i}} \text{ 不同时为 0})k1ξ1+k2ξ2+⋯+kgλiξgλi(k1,k2,...,kgλi 不同时为 0)。

2.3 示例(2阶矩阵求解)

求矩阵A=[2112]A = \begin{bmatrix} 2 & 1 \\ 1 & 2 \end{bmatrix}A=[2112]的特征值与特征向量:

  1. 特征方程:∣A−λE∣=∣2−λ112−λ∣=(λ−1)(λ−3)=0|A - \lambda E| = \begin{vmatrix} 2-\lambda & 1 \\ 1 & 2-\lambda \end{vmatrix} = (\lambda-1)(\lambda-3) = 0∣A−λE∣= 2−λ112−λ =(λ−1)(λ−3)=0,得λ1=1\lambda_1=1λ1=1,λ2=3\lambda_2=3λ2=3;
  2. 求λ1=1\lambda_1=1λ1=1的特征向量:解(A−E)x=0(A - E)\boldsymbol{x} = \boldsymbol{0}(A−E)x=0,即[1111]x=0\begin{bmatrix} 1 & 1 \\ 1 & 1 \end{bmatrix}\boldsymbol{x} = \boldsymbol{0}[1111]x=0,行变换得[1100]\begin{bmatrix} 1 & 1 \\ 0 & 0 \end{bmatrix}[1010],自由未知量为x2x_2x2,令x2=1x_2=1x2=1,得基础解系ξ1=[−11]\boldsymbol{\xi}_1 = \begin{bmatrix} -1 \\ 1 \end{bmatrix}ξ1=[−11],全部特征向量为k1ξ1k_1\boldsymbol{\xi}_1k1ξ1(k1≠0k_1 \neq 0k1=0);
  3. 求λ2=3\lambda_2=3λ2=3的特征向量:解(A−3E)x=0(A - 3E)\boldsymbol{x} = \boldsymbol{0}(A−3E)x=0,即[−111−1]x=0\begin{bmatrix} -1 & 1 \\ 1 & -1 \end{bmatrix}\boldsymbol{x} = \boldsymbol{0}[−111−1]x=0,行变换得[1−100]\begin{bmatrix} 1 & -1 \\ 0 & 0 \end{bmatrix}[10−10],令x2=1x_2=1x2=1,得基础解系ξ2=[11]\boldsymbol{\xi}_2 = \begin{bmatrix} 1 \\ 1 \end{bmatrix}ξ2=[11],全部特征向量为k2ξ2k_2\boldsymbol{\xi}_2k2ξ2(k2≠0k_2 \neq 0k2=0)。

三、特征值与特征向量的性质

3.1 特征值的性质

3.1.1 特征值的判定

  • λ0\lambda_0λ0是AAA的特征值  ⟺  ∣λ0E−A∣=0\iff |\lambda_0 E - A| = 0⟺∣λ0E−A∣=0(可用于建立方程求参数或证明行列式为 0);

  • λ0\lambda_0λ0不是AAA的特征值  ⟺  ∣λ0E−A∣≠0\iff |\lambda_0 E - A| \neq 0⟺∣λ0E−A∣=0(此时矩阵λ0E−A\lambda_0 E - Aλ0E−A可逆、满秩)。

必考结论 :若∣aA+bE∣=0|aA + bE| = 0∣aA+bE∣=0(或aA+bEaA + bEaA+bE不可逆)且a≠0a \neq 0a=0,则−ba-\frac{b}{a}−ab是AAA的特征值。

证明:∣aA+bE∣=0  ⟹  ∣−a(−baE−A)∣=0  ⟹  (−a)n∣−baE−A∣=0  ⟹  ∣−baE−A∣=0|aA + bE| = 0 \implies |-a(-\frac{b}{a}E - A)| = 0 \implies (-a)^n |-\frac{b}{a}E - A| = 0 \implies |-\frac{b}{a}E - A| = 0∣aA+bE∣=0⟹∣−a(−abE−A)∣=0⟹(−a)n∣−abE−A∣=0⟹∣−abE−A∣=0,故λ0=−ba\lambda_0 = -\frac{b}{a}λ0=−ab。

3.1.2 核心衍生性质

设nnn阶矩阵AAA的特征值为λ1,λ2,...,λn\lambda_1, \lambda_2, \dots, \lambda_nλ1,λ2,...,λn(含重根),则:

  • 迹的关系 :特征值之和等于矩阵的迹(主对角线元素之和),即:∑i=1nλi=tr(A)=a11+a22+⋯+ann\sum_{i=1}^n \lambda_i = \text{tr}(A) = a_{11} + a_{22} + \dots + a_{nn}∑i=1nλi=tr(A)=a11+a22+⋯+ann

  • 行列式关系 :特征值之积等于矩阵的行列式,即:∏i=1nλi=∣A∣\prod_{i=1}^n \lambda_i = |A|∏i=1nλi=∣A∣

  • 可逆性判定 :矩阵AAA可逆的充要条件是其所有特征值都不为 0(因∣A∣≠0  ⟺  ∏i=1nλi≠0|A| \neq 0 \iff \prod_{i=1}^n \lambda_i \neq 0∣A∣=0⟺∏i=1nλi=0)。

  • 拓展应用 :若已知AAA的n−1n-1n−1个特征值,可通过"迹"快速求第nnn个特征值(如3阶矩阵AAA的迹为5,已知特征值1、2,则第三个特征值为2)。

3.2 特征向量的性质

  1. 基础约束:特征向量必非零(零向量无意义);

  2. 线性无关性

    • 不同特征值的特征向量线性无关;
    • kkk重特征值至多有kkk个线性无关特征向量(几何重数 ≤ 代数重数);
  3. 组合性质

    • 同一特征值的特征向量非零线性组合仍为该特征值的特征向量;

    • 不同特征值的特征向量非零线性组合不是任何特征值的特征向量;

  4. 唯一性 :一个特征向量仅对应一个特征值(即若ξ\boldsymbol{\xi}ξ是λ1\lambda_1λ1的特征向量,则必不是λ2\lambda_2λ2(λ1≠λ2\lambda_1 \neq \lambda_2λ1=λ2)的特征向量)。

映射关系:"一对多"(一个特征值对应无数个特征向量,一个特征向量仅对应一个特征值)。
📌 推广结论 :若λ1,...,λs\lambda_1, \dots, \lambda_sλ1,...,λs是互异,ξi1,...,ξiri\boldsymbol{\xi}{i1}, \dots, \boldsymbol{\xi}{ir_i}ξi1,...,ξiri是λi\lambda_iλi的线性无关特征向量,则集合{ξ11,...,ξ1r1,...,ξs1,...,ξsrs}\{\boldsymbol{\xi}{11}, \dots, \boldsymbol{\xi}{1r_1},\quad \dots, \quad\boldsymbol{\xi}{s1}, \dots, \boldsymbol{\xi}{sr_s}\}{ξ11,...,ξ1r1,...,ξs1,...,ξsrs}线性无关;

3.3 特殊矩阵的特征值与特征向量

矩阵类型 特征值特征 特征向量说明
三角/对角矩阵 特征值 = 主对角线元素(因∣A−λE∣=∏i=1n(aii−λ)=0|A - \lambda E| = \prod_{i=1}^n (a_{ii} - \lambda)=0∣A−λE∣=∏i=1n(aii−λ)=0) 对角矩阵的特征向量为标准单位向量e1,...,en\boldsymbol{e}_1,\dots,\boldsymbol{e}_ne1,...,en
分块对角矩阵A=(A1OOA2)A=\begin{pmatrix}A_1&O\\O&A_2\end{pmatrix}A=(A1OOA2) 特征值 =A1A_1A1特征值 ∪A2A_2A2特征值 对应A1A_1A1特征向量补零得AAA特征向量,对应A2A_2A2特征向量补零同理
秩1方阵(r(A)=1r(A)=1r(A)=1) λ1=tr(A)\lambda_1=\text{tr}(A)λ1=tr(A),λ2=⋯=λn=0\lambda_2=\dots=\lambda_n=0λ2=⋯=λn=0 0 的几何重数g0=n−1g_0 = n-1g0=n−1,代数重数m0≥n−1m_0 \geq n-1m0≥n−1(仅当tr(A)=0\text{tr}(A)=0tr(A)=0时m0=nm_0=nm0=n)
每行元素和为mmm的方阵 mmm是特征值,其余特征值需解特征方程 对应mmm的特征向量为全1向量A(11⋮1)=(mm⋮m)=m(11⋮1)A \begin{pmatrix}1\\1\\\vdots\\1\end{pmatrix} = \begin{pmatrix}m\\m\\\vdots\\m\end{pmatrix} = m \begin{pmatrix}1\\1\\\vdots\\1\end{pmatrix}A 11⋮1 = mm⋮m =m 11⋮1

补充:秩1矩阵的推导(A=αβTA = \boldsymbol{\alpha}\boldsymbol{\beta}^TA=αβT,,,α,β\boldsymbol{\alpha},\boldsymbol{\beta}α,β为非零列向量)

  • Aα=αβTα=(βTα)αA\boldsymbol{\alpha} = \boldsymbol{\alpha}\boldsymbol{\beta}^T\boldsymbol{\alpha} = (\boldsymbol{\beta}^T\boldsymbol{\alpha})\boldsymbol{\alpha}Aα=αβTα=(βTα)α,故非零特征值λ=βTα=tr(A)\lambda = \boldsymbol{\beta}^T\boldsymbol{\alpha} = \text{tr}(A)λ=βTα=tr(A);
  • r(A)=1r(A)=1r(A)=1,故(A−0E)x=0(A - 0E)\boldsymbol{x}=\boldsymbol{0}(A−0E)x=0的基础解系含n−1n-1n−1个向量,即 0 的几何重数为n−1n-1n−1。

3.4 常用矩阵特征值与特征向量对照表

若λ\lambdaλ是AAA的特征值,ξ\boldsymbol{\xi}ξ是对应特征向量,则:

矩阵 特征值 对应的特征向量
AAA λ\lambdaλ ξ\boldsymbol{\xi}ξ
ATA^TAT λ\lambdaλ 需单独解(λE−AT)x=0(\lambda E - A^T)\boldsymbol{x} = \boldsymbol{0}(λE−AT)x=0
kAkAkA kλk\lambdakλ ξ\boldsymbol{\xi}ξ(k≠0k\neq0k=0可回推)
AkA^kAk λk\lambda^kλk ξ\boldsymbol{\xi}ξ
f(A)f(A)f(A) f(λ)f(\lambda)f(λ) ξ\boldsymbol{\xi}ξ
A−1A^{-1}A−1 1λ\frac{1}{\lambda}λ1 ξ\boldsymbol{\xi}ξ(可回推)
A∗A^*A∗ ∣A∣λ\frac{|A|}{\lambda}λ∣A∣ ξ\boldsymbol{\xi}ξ(AAA可逆时可回推)
P−1APP^{-1}APP−1AP λ\lambdaλ P−1ξP^{-1}\boldsymbol{\xi}P−1ξ
PAP−1PAP^{-1}PAP−1 λ\lambdaλ PξP\boldsymbol{\xi}Pξ

考试常考回推。注意,除注明外,其它都不可回推。
📝 推导示例(P−1APP^{-1}APP−1AP的特征向量):由于Aξ=λξ→P−1AEξ=λP−1ξ→P−1AP(P−1ξ)=λ(P−1ξ)A\xi=\lambda\xi\rightarrow P^{-1}AE\xi=\lambda P^{-1}\xi\rightarrow P^{-1}AP(P^{-1}\xi)=\lambda (P^{-1}\xi)Aξ=λξ→P−1AEξ=λP−1ξ→P−1AP(P−1ξ)=λ(P−1ξ),故λ\lambdaλ是P−1APP^{-1}APP−1AP的特征值,对应的特征向量是P−1ξP^{-1}\xiP−1ξ.

🚨 重要推论:若矩阵AAA满足f(A)=0f(A)=0f(A)=0(fff为多项式),则AAA的任一特征值λ\lambdaλ必满足f(λ)=0f(\lambda)=0f(λ)=0(可用于快速求特征值范围)。


四、矩阵的相似

4.1 定义

设A,BA, BA,B为nnn阶方阵,若存在nnn阶可逆矩阵PPP,使得P−1AP=BP^{-1}AP = BP−1AP=B,则称AAA与BBB相似 ,记为A∼BA \sim BA∼B,可逆矩阵PPP称为相似变换矩阵

💡 关系层级:相似⊂\subset⊂等价

  • 等价:要求PAQ=BPAQ = BPAQ=B(P,QP,QP,Q可逆,适用于任意矩阵);
  • 相似:要求Q=P−1Q = P^{-1}Q=P−1(仅适用于方阵)。

4.2 相似矩阵的性质

4.2.1 等价关系(自反/对称/传递)

相似是特殊的等价,故等价的三个性质相似也有:

  • 反身性:A∼AA \sim AA∼A(取P=EP = EP=E);

  • 对称性:A∼B  ⟹  B∼AA \sim B \implies B \sim AA∼B⟹B∼A(取P−1P^{-1}P−1为变换矩阵);

  • 传递性:A∼BA \sim BA∼B且B∼C  ⟹  A∼CB \sim C \implies A \sim CB∼C⟹A∼C(取P,QP,QP,Q为变换矩阵,B=P−1AP,C=Q−1BQB=P^{-1}AP, C=Q^{-1}BQB=P−1AP,C=Q−1BQ)。

4.2.2 相似不变量(必要条件,核心必考)

若A∼BA \sim BA∼B,则以下性质完全相同:

  • 特征多项式、特征值(含重数);
  • 迹(tr(A)=tr(B)\text{tr}(A) = \text{tr}(B)tr(A)=tr(B));
  • 行列式(∣A∣=∣B∣|A| = |B|∣A∣=∣B∣);
  • 秩(r(A)=r(B)r(A) = r(B)r(A)=r(B));
  • 各阶主子式之和;
  • 特征矩阵的秩(r(λE−A)=r(λE−B)r(\lambda E - A) = r(\lambda E - B)r(λE−A)=r(λE−B),即λE−A∼λE−B\lambda E - A \sim \lambda E - BλE−A∼λE−B)。

上述性质是矩阵相似的必要非充分条件 。例如,A=[1101]A = \begin{bmatrix}1&1\\0&1\end{bmatrix}A=[1011]与E=[1001]E = \begin{bmatrix}1&0\\0&1\end{bmatrix}E=[1001]特征值相同但不相似(AAA不可对角化,EEE是对角矩阵)。
🔑 关键提醒:相似矩阵特征值相同 ,但特征向量不同 。若A∼BA\sim BA∼B(B=P−1APB=P^{-1}APB=P−1AP),则:

  1. 若ξ\boldsymbol{\xi}ξ是AAA对应λ\lambdaλ的特征向量,则P−1ξP^{-1}\boldsymbol{\xi}P−1ξ是BBB对应λ\lambdaλ的特征向量,即Aξ=λξ  ⟺  B(P−1ξ)=λ(P−1ξ)A\boldsymbol{\xi}=\lambda\boldsymbol{\xi} \iff B(P^{-1}\boldsymbol{\xi})=\lambda(P^{-1}\boldsymbol{\xi})Aξ=λξ⟺B(P−1ξ)=λ(P−1ξ);
  2. 若ξ\boldsymbol{\xi}ξ是BBB对应λ\lambdaλ的特征向量,则PξP\boldsymbol{\xi}Pξ是AAA对应λ\lambdaλ的特征向量,即Bξ=λξ  ⟺  A(Pξ)=λ(Pξ)B\boldsymbol{\xi}=\lambda\boldsymbol{\xi}\iff A(P\boldsymbol{\xi})=\lambda(P\boldsymbol{\xi})Bξ=λξ⟺A(Pξ)=λ(Pξ)。

4.2.3 多项式传递性

若A∼BA \sim BA∼B,则:

  • Am∼BmA^m \sim B^mAm∼Bm(mmm为正整数);
  • 对任意多项式f(x)f(x)f(x),有f(A)∼f(B)f(A) \sim f(B)f(A)∼f(B)(因P−1f(A)P=f(P−1AP)=f(B)P^{-1}f(A)P = f(P^{-1}AP) = f(B)P−1f(A)P=f(P−1AP)=f(B));
  • 若AAA可逆,则A−1∼B−1A^{-1} \sim B^{-1}A−1∼B−1、A∗∼B∗A^* \sim B^*A∗∼B∗;
  • AT∼BTA^T \sim B^TAT∼BT;
  • 若A∼CA \sim CA∼C且B∼DB \sim DB∼D,则(AOOB)∼(COOD)\begin{pmatrix} A& O \\ O & B\end{pmatrix} \sim \begin{pmatrix} C & O \\ O & D\end{pmatrix}(AOOB)∼(COOD)。

AT∼BTA^T \sim B^TAT∼BT推导:若B=P−1APB=P^{-1}APB=P−1AP,则BT=PTAT(P−1)T=PTAT(PT)−1B^T=P^T A^T (P^{-1})^T = P^T A^T (P^T)^{-1}BT=PTAT(P−1)T=PTAT(PT)−1,令Q=(PT)−1Q=(P^T)^{-1}Q=(PT)−1,则BT=Q−1ATQB^T=Q^{-1}A^TQBT=Q−1ATQ

需注意AT∼BTA^T \sim B^TAT∼BT的变换矩阵与其他性质不同,不可混用(如A2+ATA^2+A^TA2+AT与B2+BTB^2+B^TB2+BT未必相似)。

4.3 矩阵相似的判别方法

  1. 定义法 :找到可逆矩阵PPP满足P−1AP=BP^{-1}AP = BP−1AP=B;

  2. 传递性法 :若A∼ΛA \sim \LambdaA∼Λ且Λ∼B\Lambda \sim BΛ∼B,则A∼BA \sim BA∼B;

  3. 必要条件排除法:若矩阵不满足上述 "不变量"(如特征值不同、秩不同等),则必不相似;

  4. 实对称矩阵特例 :实对称矩阵A∼B  ⟺  A,BA \sim B \iff A,BA∼B⟺A,B特征值相同(充要条件)。


五、矩阵的相似对角化

5.1 定义

若nnn阶矩阵AAA与对角矩阵Λ=diag(λ1,λ2,...,λn)\Lambda = \text{diag}(\lambda_1, \lambda_2, \dots, \lambda_n)Λ=diag(λ1,λ2,...,λn)相似,则称AAA可相似对角化 ,Λ\LambdaΛ为AAA的相似标准形 (对角元为AAA的特征值,顺序与PPP的列向量一一对应,PPP的每列是AAA对应特征值的特征向量)。

与等价标准形的区别:

  • 等价标准形:PAQ=(ErOOO)PAQ = \begin{pmatrix}E_r&O\\O&O\end{pmatrix}PAQ=(ErOOO)(适用于非方阵,P,QP,QP,Q独立可逆);
  • 相似对角化:仅针对方阵,要求Q=P−1Q = P^{-1}Q=P−1。

5.2 相似对角化的条件

由P−1AP=ΛP^{-1}AP = \LambdaP−1AP=Λ得AP=PΛAP = P\LambdaAP=PΛ,记P=[ξ1,ξ2,⋯ ,ξn],Λ=diag(λ1,λ2,...,λn)P = [\xi_1, \xi_2, \cdots, \xi_n] ,\Lambda = \text{diag}(\lambda_1, \lambda_2, \dots, \lambda_n)P=[ξ1,ξ2,⋯,ξn],Λ=diag(λ1,λ2,...,λn),

则[Aξ1,Aξ2,⋯ ,Aξn]=[λ1ξ1,λ2ξ2,⋯ ,λnξn][A\xi_1, A\xi_2, \cdots, A\xi_n] = [\lambda_1\xi_1, \lambda_2\xi_2, \cdots, \lambda_n\xi_n][Aξ1,Aξ2,⋯,Aξn]=[λ1ξ1,λ2ξ2,⋯,λnξn],即Aξi=λiξiA\xi_i = \lambda_i\xi_iAξi=λiξi(i=1,2,⋯ ,ni = 1,2,\cdots,ni=1,2,⋯,n)。

因PPP可逆,故ξ1,ξ2,⋯ ,ξn\xi_1, \xi_2, \cdots, \xi_nξ1,ξ2,⋯,ξn线性无关,由此得:

条件类型 具体表述
充要条件1 AAA有nnn个线性无关的特征向量(所有特征值的几何重数之和为nnn)
充要条件2 AAA的每个kkk重特征值(代数重数mλ=km_\lambda=kmλ=k)对应的几何重数gλ=kg_\lambda=kgλ=k(即k=n−r(A−λE)k=n-r(A-\lambda E)k=n−r(A−λE))
充分条件1 AAA有nnn个互不相同的特征值(单根特征值几何重数=1,总和为nnn)
充分条件2 AAA为实对称矩阵(必可对角化)

✅ 判别一个矩阵是否可相似对角化:

  • 检查是否为实对称矩阵(是则必可对角化);
  • 检查特征值是否为单根(是则可对角化);
  • 若有重特征值,验证"几何重数=代数重数"(满足则可对角化,否则不可)。

5.3 相似对角化的步骤

  1. 求特征值 :解∣A−λE∣=0|A - \lambda E| = 0∣A−λE∣=0,得λ1,...,λn\lambda_1, \dots, \lambda_nλ1,...,λn(含重根);
  2. 求线性无关特征向量 :对每个λi\lambda_iλi,解(A−λiE)x=0(A - \lambda_i E)\boldsymbol{x} = \boldsymbol{0}(A−λiE)x=0,得基础解系;
  3. 验证可对角化 :若线性无关特征向量总数 = 矩阵阶数nnn,则可对角化,否则不可;
  4. 构造矩阵 :令P=[ξ1,ξ2,⋯ ,ξn]P=[\xi_1,\xi_2,\cdots,\xi_n]P=[ξ1,ξ2,⋯,ξn](ξi\boldsymbol{\xi}_iξi为线性无关特征向量),则P−1AP=ΛP^{-1}AP = \LambdaP−1AP=Λ(Λ\LambdaΛ对角元为对应特征值)。

💡 核心应用:若A∼ΛA \sim \LambdaA∼Λ,则P−1AkP=ΛkP^{-1}A^kP = \Lambda^kP−1AkP=Λk、P−1f(A)P=f(Λ)=diag(f(λ1),...,f(λn))P^{-1}f(A)P = f(\Lambda)= \text{diag}(f(\lambda_1), \dots, f(\lambda_n))P−1f(A)P=f(Λ)=diag(f(λ1),...,f(λn)),可大幅简化矩阵幂/多项式计算。
⚠️ 注意事项:

  • PPP不唯一:同一特征值的基础解系可替换,PPP列序调整时,Λ\LambdaΛ对角元顺序需同步调整;
  • 反求AAA:利用A=PΛP−1A = P\Lambda P^{-1}A=PΛP−1;
  • 并非所有矩阵都可对角化(如[1101]\begin{bmatrix}1&1\\0&1\end{bmatrix}[1011]不可对角化)。

5.4 例题(矩阵幂计算)

已知A=[2112]A = \begin{bmatrix}2&1\\1&2\end{bmatrix}A=[2112],求A10A^{10}A10。

解:AAA的特征值λ1=1\lambda_1=1λ1=1,λ2=3\lambda_2=3λ2=3,特征向量ξ1=[−11]\boldsymbol{\xi}_1=\begin{bmatrix}-1\\1\end{bmatrix}ξ1=[−11],ξ2=[11]\boldsymbol{\xi}_2=\begin{bmatrix}1\\1\end{bmatrix}ξ2=[11];

构造P=[−1111]P = \begin{bmatrix}-1&1\\1&1\end{bmatrix}P=[−1111],则P−1=12[−1111]P^{-1} = \frac{1}{2}\begin{bmatrix}-1&1\\1&1\end{bmatrix}P−1=21[−1111],Λ=[1003]\Lambda = \begin{bmatrix}1&0\\0&3\end{bmatrix}Λ=[1003];

A10=PΛ10P−1=[−1111][100310]12[−1111]=12[310+1310−1310−1310+1]A^{10} = P\Lambda^{10}P^{-1} = \begin{bmatrix}-1&1\\1&1\end{bmatrix}\begin{bmatrix}1&0\\0&3^{10}\end{bmatrix}\frac{1}{2}\begin{bmatrix}-1&1\\1&1\end{bmatrix} = \frac{1}{2}\begin{bmatrix}3^{10}+1&3^{10}-1\\3^{10}-1&3^{10}+1\end{bmatrix}A10=PΛ10P−1=[−1111][100310]21[−1111]=21[310+1310−1310−1310+1]。


六、实对称矩阵的正交相似对角化

6.1 实对称矩阵的特殊性质

满足AT=AA^T = AAT=A的实矩阵称为实对称矩阵,其核心性质:

  • A−1A^{-1}A−1、A∗A^*A∗、ATA^TAT均为实对称矩阵;

  • 特征值全为实数,特征向量均为实向量;

  • ⭐️不同特征值的特征向量必正交(普通矩阵仅线性无关);

  • 必可通过正交矩阵 对角化(Q−1AQ=QTAQ=ΛQ^{-1}AQ = Q^TAQ = \LambdaQ−1AQ=QTAQ=Λ);

  • 每个kkk重特征值的几何重数 = 代数重数(gλ=mλg_\lambda = m_\lambdagλ=mλ)。

普通非实对称矩阵未必存在正交矩阵QQQ,使其相似对角化。

QQQ中特征向量ηi\eta_iηi与Λ\LambdaΛ中的特征值λi\lambda_iλi对应,且QQQ不唯一。
📌 正交 vs 线性无关:正交是更强的条件(正交必线性无关,线性无关未必正交)。

  • 普通矩阵AAA:若λ1≠λ2  ⟹  ξ1\lambda_1 \neq \lambda_2 \implies \xi_1λ1=λ2⟹ξ1与ξ2\xi_2ξ2线性无关;

  • 实对称矩阵AAA:若λ1≠λ2  ⟹  ξ1⊥ξ2\lambda_1 \neq \lambda_2 \implies \xi_1 \perp \xi_2λ1=λ2⟹ξ1⊥ξ2。

6.2 正交相似对角化的步骤

  1. 求特征值 :解∣A−λE∣=0|A - \lambda E| = 0∣A−λE∣=0,得实特征值λ1,...,λn\lambda_1, \dots, \lambda_nλ1,...,λn(含重根);

  2. 求特征向量 :对每个λi\lambda_iλi,解(A−λiE)x=0(A - \lambda_i E)\boldsymbol{x} = \boldsymbol{0}(A−λiE)x=0,得基础解系;

  3. 正交化 :仅对相同特征值 的线性无关特征向量做施密特正交化(不同特征值的特征向量已正交,无需处理);

    PS:施密特正交化在《考研线代第三课:向量组》的向量空间一节中有详细说明。

    回顾:设α1,α2\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2α1,α2线性无关,正交化得:

    β1=α1\boldsymbol{\beta}_1 = \boldsymbol{\alpha}_1β1=α1,β2=α2−<α2,β1><β1,β1>β1\boldsymbol{\beta}_2 = \boldsymbol{\alpha}_2 - \frac{<\boldsymbol{\alpha}_2,\boldsymbol{\beta}_1>}{<\boldsymbol{\beta}_1,\boldsymbol{\beta}_1>}\boldsymbol{\beta}_1β2=α2−<β1,β1><α2,β1>β1;

    高阶同理:βk=αk−∑i=1k−1<αk,βi><βi,βi>βi\boldsymbol{\beta}_k = \boldsymbol{\alpha}k - \sum{i=1}^{k-1}\frac{<\boldsymbol{\alpha}_k,\boldsymbol{\beta}_i>}{<\boldsymbol{\beta}_i,\boldsymbol{\beta}_i>}\boldsymbol{\beta}_iβk=αk−∑i=1k−1<βi,βi><αk,βi>βi。

  4. 单位化 :将正交化后的向量单位化为ηi=βi∣∣βi∣∣(i=1,...,n))\eta_i=\frac{\beta_i}{||\beta_i||}\quad(i=1,...,n))ηi=∣∣βi∣∣βi(i=1,...,n));

  5. 构造正交矩阵 :令Q=[η1,η2,⋯ ,ηn]Q = [\eta_1, \eta_2, \cdots, \eta_n]Q=[η1,η2,⋯,ηn],则QQQ为正交矩阵,且Q−1AQ=QTAQ=ΛQ^{-1}AQ=Q^TAQ=\LambdaQ−1AQ=QTAQ=Λ。

特征值相同是两个矩阵相似的必要条件。当A,BA, BA,B均为实对称矩阵时,A∼BA \sim BA∼B的充要条件是A,BA, BA,B有相同的特征值。

6.3 示例(实对称矩阵正交对角化)

求A=[1111]A = \begin{bmatrix}1&1\\1&1\end{bmatrix}A=[1111]的正交相似对角矩阵:

  1. 特征方程:∣A−λE∣=∣1−λ111−λ∣=λ(λ−2)=0|A - \lambda E| = \begin{vmatrix}1-\lambda&1\\1&1-\lambda\end{vmatrix} = \lambda(\lambda-2) = 0∣A−λE∣= 1−λ111−λ =λ(λ−2)=0,得λ1=0\lambda_1=0λ1=0,λ2=2\lambda_2=2λ2=2;
  2. 求特征向量:
    • λ1=0\lambda_1=0λ1=0:解(A−0E)x=0(A-0E)\boldsymbol{x}=0(A−0E)x=0,得基础解系α1=[−11]\boldsymbol{\alpha}_1 = \begin{bmatrix}-1\\1\end{bmatrix}α1=[−11];
    • λ2=2\lambda_2=2λ2=2:解(A−2E)x=0(A-2E)\boldsymbol{x}=0(A−2E)x=0,得基础解系α2=[11]\boldsymbol{\alpha}_2 = \begin{bmatrix}1\\1\end{bmatrix}α2=[11];
  3. 正交化:α1\boldsymbol{\alpha}_1α1与α2\boldsymbol{\alpha}_2α2已正交,无需处理;
  4. 单位化:η1=12[−11]\boldsymbol{\eta}_1 = \frac{1}{\sqrt{2}}\begin{bmatrix}-1\\1\end{bmatrix}η1=2 1[−11],η2=12[11]\boldsymbol{\eta}_2 = \frac{1}{\sqrt{2}}\begin{bmatrix}1\\1\end{bmatrix}η2=2 1[11];
  5. 构造正交矩阵:Q=[−12121212]Q = \begin{bmatrix}-\frac{1}{\sqrt{2}}&\frac{1}{\sqrt{2}}\\\frac{1}{\sqrt{2}}&\frac{1}{\sqrt{2}}\end{bmatrix}Q=[−2 12 12 12 1],则QTAQ=[0002]Q^TAQ = \begin{bmatrix}0&0\\0&2\end{bmatrix}QTAQ=[0002]。
相关推荐
丝斯20112 小时前
AI学习笔记整理(48)——大模型中的向量工程RAG系统
人工智能·笔记·学习
YY_pdd2 小时前
全面战争三国-mod开发教程(demo,已实证)
经验分享·笔记·学习
IMPYLH2 小时前
Lua 的 Package 模块
java·开发语言·笔记·后端·junit·游戏引擎·lua
代码游侠2 小时前
学习笔记——DS18B20 温度传感器
笔记·单片机·嵌入式硬件·学习·51单片机
创作者mateo2 小时前
深度学习学习笔记:发展脉络以及核心原理全解析
笔记·深度学习·学习
發糞塗牆2 小时前
Azure 架构师学习笔记 - Azure AI(1)- 概述
笔记·学习·ai·azure
aigcapi2 小时前
矩阵系统哪家好?2026主流矩阵系统TOP5测评+全场景选型指南
大数据·人工智能·矩阵
浮鱼浮鱼2 小时前
基于T矩阵的多结构系统的特征模计算
算法·矩阵·天线设计·特征模理论·计算电磁学
AI视觉网奇2 小时前
ue5 设置分辨率笔记
笔记·ue5