文章目录
- 一、特征值与特征向量的核心概念
-
- 1.1 定义(仅针对方阵)
- 1.2 核心性质
-
- 1.2.1 特征向量的非零性(核心约束)
- 1.2.2 等价变形与特征方程
- 1.3 补充概念
- 二、特征值与特征向量的求解流程
-
- 2.1 求特征值
- 2.2 求特征向量
- 2.3 示例(2阶矩阵求解)
- 三、特征值与特征向量的性质
-
- 3.1 特征值的性质
-
- 3.1.1 特征值的判定
- 3.1.2 核心衍生性质
- 3.2 特征向量的性质
- 3.3 特殊矩阵的特征值与特征向量
- 3.4 常用矩阵特征值与特征向量对照表
- 四、矩阵的相似
-
- 4.1 定义
- 4.2 相似矩阵的性质
-
- 4.2.1 等价关系(自反/对称/传递)
- 4.2.2 相似不变量(必要条件,核心必考)
- 4.2.3 多项式传递性
- 4.3 矩阵相似的判别方法
- 五、矩阵的相似对角化
-
- 5.1 定义
- 5.2 相似对角化的条件
- 5.3 相似对角化的步骤
- 5.4 例题(矩阵幂计算)
- 六、实对称矩阵的正交相似对角化
-
- 6.1 实对称矩阵的特殊性质
- 6.2 正交相似对角化的步骤
- 6.3 示例(实对称矩阵正交对角化)
一、特征值与特征向量的核心概念
1.1 定义(仅针对方阵)
设AAA是nnn阶方阵,若存在数λ\lambdaλ和非零 nnn维列向量x\boldsymbol{x}x,满足Ax=λxA\boldsymbol{x} = \lambda \boldsymbol{x}Ax=λx,则
- λ\lambdaλ称为AAA的特征值,描述矩阵对特征向量的伸缩倍数(保持共线关系);
- 非零向量x\boldsymbol{x}x称为AAA对应于λ\lambdaλ的特征向量 (向量AxAxAx与xxx线性相关)。
核心关联:
- nnn阶方阵的特征值(计重数)共nnn个,是特征方程的nnn个根,对应nnn维空间线性变换的nnn个(含重数)独立伸缩方向;
- 特征值是方阵的「方向固有属性」,行列式是特征值的乘积(「整体衍生属性」):∏i=1nλi=∣A∣\prod_{i=1}^n \lambda_i = |A|∏i=1nλi=∣A∣,行列式反映全局缩放效果,无法反推单个特征值。
- 矩阵对应特征值λ\lambdaλ的全部特征向量,就是齐次线性方程组(A−λE)x=0(A-\lambda E)x=0(A−λE)x=0基础解系的所有非零线性组合。基础解系是特征向量的 "代表",所有特征向量都能由基础解系线性表示,但特征向量≠基础解系。
1.2 核心性质
1.2.1 特征向量的非零性(核心约束)
特征向量必须是非零向量。若x=0\boldsymbol{x} = \boldsymbol{0}x=0,则对任意λ\lambdaλ都满足A0=λ0A\boldsymbol{0} = \lambda \boldsymbol{0}A0=λ0,无法体现矩阵的 "特征",故无意义。
1.2.2 等价变形与特征方程
定义式可变形为(A−λE)x=0(A - \lambda E)\boldsymbol{x} = \boldsymbol{0}(A−λE)x=0。该齐次线性方程组有非零解的充要条件 是系数矩阵的行列式为 0,即:∣A−λE∣=0|A - \lambda E| = 0∣A−λE∣=0,此式称为特征方程 ,f(λ)=∣A−λE∣f(\lambda) = |A - \lambda E|f(λ)=∣A−λE∣称为特征多项式。
矩阵A−λEA-\lambda EA−λE称为特征矩阵,形式为:
A−λE=[a11−λa12⋯a1na21a22−λ⋯a2n⋮⋮⋮an1an2⋯ann−λ] A - \lambda E = \begin{bmatrix} a_{11}-\lambda & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22}-\lambda & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn}-\lambda \end{bmatrix} A−λE= a11−λa21⋮an1a12a22−λ⋮an2⋯⋯⋯a1na2n⋮ann−λ
1.3 补充概念
| 概念 | 精准定义 | 关键公式/说明 |
|---|---|---|
| 特征子空间 | 对应同一特征值λ\lambdaλ的所有特征向量(非零)加上零向量构成的nnn维向量空间,记为VλV_\lambdaVλ | Vλ={x∈Rn∣(A−λE)x=0}V_\lambda = \{\boldsymbol{x} \in \mathbb{R}^n \mid (A - \lambda E)\boldsymbol{x} = \boldsymbol{0}\}Vλ={x∈Rn∣(A−λE)x=0} |
| 代数重数 | 特征值λ\lambdaλ在特征多项式中的重根次数,记为mλm_\lambdamλ | 如f(λ)=(λ−2)3(λ+1)f(\lambda)=(\lambda-2)^3(\lambda+1)f(λ)=(λ−2)3(λ+1),则λ=2\lambda=2λ=2的代数重数m2=3m_2=3m2=3 |
| 几何重数 | 特征子空间VλV_\lambdaVλ的维数(即(A−λE)x=0(A - \lambda E)\boldsymbol{x}=\boldsymbol{0}(A−λE)x=0基础解系的向量个数),记为gλg_\lambdagλ | gλ=n−r(A−λE)g_\lambda = n - r(A -\lambda E)gλ=n−r(A−λE)(r(A−λE)=r(λE−A)r(A - \lambda E) = r(\lambda E - A)r(A−λE)=r(λE−A)) |
重要注记:
- 非方阵无特征值/特征向量,可通过ATAA^TAATA(nnn阶)或AATAA^TAAT(mmm阶)间接分析(AAA为m×nm \times nm×n矩阵);
- 几何重数 ≤ 代数重数(gλ≤mλg_\lambda \leq m_\lambdagλ≤mλ)是矩阵的普遍性质,也是判定矩阵可对角化的核心依据(需满足gλ=mλg_\lambda = m_\lambdagλ=mλ)。
二、特征值与特征向量的求解流程
2.1 求特征值
解特征方程∣A−λE∣=0|A - \lambda E| = 0∣A−λE∣=0,得λ1,λ2,...,λn\lambda_1, \lambda_2, \dots, \lambda_nλ1,λ2,...,λn(含重根)。
✅ 实用技巧:计算行列式时优先利用"按行/列展开""提取公因子""行/列变换化简",避免直接展开3阶及以上行列式。
2.2 求特征向量
对每个特征值λi\lambda_iλi,解(A−λiE)x=0(A - \lambda_i E)\boldsymbol{x} = \boldsymbol{0}(A−λiE)x=0(与(λiE−A)x=0(\lambda_i E - A)\boldsymbol{x} = \boldsymbol{0}(λiE−A)x=0等价,系数矩阵仅差负号,解相同):
- 对系数矩阵A−λiEA - \lambda_i EA−λiE做初等行变换,化为行最简阶梯形矩阵;
- 确定自由未知量个数(即几何重数gλi=n−r(A−λiE)g_{\lambda_i} = n - r(A - \lambda_i E)gλi=n−r(A−λiE));
- 令自由未知量依次取标准单位向量形式(如1,0,...,01,0,\dots,01,0,...,0;0,1,...,00,1,\dots,00,1,...,0等),得到基础解系ξ1,ξ2,...,ξgλi\boldsymbol{\xi}1, \boldsymbol{\xi}2, \dots, \boldsymbol{\xi}{g{\lambda_i}}ξ1,ξ2,...,ξgλi(线性无关特征向量);
- 对应λi\lambda_iλi的全部特征向量 为:基础解系的所有非零线性组合,即k1ξ1+k2ξ2+⋯+kgλiξgλi(k1,k2,...,kgλi 不同时为 0)k_1\boldsymbol{\xi}1 + k_2\boldsymbol{\xi}2 + \dots + k{g{\lambda_i}}\boldsymbol{\xi}{g{\lambda_i}} \quad (k_1,k_2,\dots,k_{g_{\lambda_i}} \text{ 不同时为 0})k1ξ1+k2ξ2+⋯+kgλiξgλi(k1,k2,...,kgλi 不同时为 0)。
2.3 示例(2阶矩阵求解)
求矩阵A=[2112]A = \begin{bmatrix} 2 & 1 \\ 1 & 2 \end{bmatrix}A=[2112]的特征值与特征向量:
- 特征方程:∣A−λE∣=∣2−λ112−λ∣=(λ−1)(λ−3)=0|A - \lambda E| = \begin{vmatrix} 2-\lambda & 1 \\ 1 & 2-\lambda \end{vmatrix} = (\lambda-1)(\lambda-3) = 0∣A−λE∣= 2−λ112−λ =(λ−1)(λ−3)=0,得λ1=1\lambda_1=1λ1=1,λ2=3\lambda_2=3λ2=3;
- 求λ1=1\lambda_1=1λ1=1的特征向量:解(A−E)x=0(A - E)\boldsymbol{x} = \boldsymbol{0}(A−E)x=0,即[1111]x=0\begin{bmatrix} 1 & 1 \\ 1 & 1 \end{bmatrix}\boldsymbol{x} = \boldsymbol{0}[1111]x=0,行变换得[1100]\begin{bmatrix} 1 & 1 \\ 0 & 0 \end{bmatrix}[1010],自由未知量为x2x_2x2,令x2=1x_2=1x2=1,得基础解系ξ1=[−11]\boldsymbol{\xi}_1 = \begin{bmatrix} -1 \\ 1 \end{bmatrix}ξ1=[−11],全部特征向量为k1ξ1k_1\boldsymbol{\xi}_1k1ξ1(k1≠0k_1 \neq 0k1=0);
- 求λ2=3\lambda_2=3λ2=3的特征向量:解(A−3E)x=0(A - 3E)\boldsymbol{x} = \boldsymbol{0}(A−3E)x=0,即[−111−1]x=0\begin{bmatrix} -1 & 1 \\ 1 & -1 \end{bmatrix}\boldsymbol{x} = \boldsymbol{0}[−111−1]x=0,行变换得[1−100]\begin{bmatrix} 1 & -1 \\ 0 & 0 \end{bmatrix}[10−10],令x2=1x_2=1x2=1,得基础解系ξ2=[11]\boldsymbol{\xi}_2 = \begin{bmatrix} 1 \\ 1 \end{bmatrix}ξ2=[11],全部特征向量为k2ξ2k_2\boldsymbol{\xi}_2k2ξ2(k2≠0k_2 \neq 0k2=0)。
三、特征值与特征向量的性质
3.1 特征值的性质
3.1.1 特征值的判定
-
λ0\lambda_0λ0是AAA的特征值 ⟺ ∣λ0E−A∣=0\iff |\lambda_0 E - A| = 0⟺∣λ0E−A∣=0(可用于建立方程求参数或证明行列式为 0);
-
λ0\lambda_0λ0不是AAA的特征值 ⟺ ∣λ0E−A∣≠0\iff |\lambda_0 E - A| \neq 0⟺∣λ0E−A∣=0(此时矩阵λ0E−A\lambda_0 E - Aλ0E−A可逆、满秩)。
必考结论 :若∣aA+bE∣=0|aA + bE| = 0∣aA+bE∣=0(或aA+bEaA + bEaA+bE不可逆)且a≠0a \neq 0a=0,则−ba-\frac{b}{a}−ab是AAA的特征值。
证明:∣aA+bE∣=0 ⟹ ∣−a(−baE−A)∣=0 ⟹ (−a)n∣−baE−A∣=0 ⟹ ∣−baE−A∣=0|aA + bE| = 0 \implies |-a(-\frac{b}{a}E - A)| = 0 \implies (-a)^n |-\frac{b}{a}E - A| = 0 \implies |-\frac{b}{a}E - A| = 0∣aA+bE∣=0⟹∣−a(−abE−A)∣=0⟹(−a)n∣−abE−A∣=0⟹∣−abE−A∣=0,故λ0=−ba\lambda_0 = -\frac{b}{a}λ0=−ab。
3.1.2 核心衍生性质
设nnn阶矩阵AAA的特征值为λ1,λ2,...,λn\lambda_1, \lambda_2, \dots, \lambda_nλ1,λ2,...,λn(含重根),则:
-
迹的关系 :特征值之和等于矩阵的迹(主对角线元素之和),即:∑i=1nλi=tr(A)=a11+a22+⋯+ann\sum_{i=1}^n \lambda_i = \text{tr}(A) = a_{11} + a_{22} + \dots + a_{nn}∑i=1nλi=tr(A)=a11+a22+⋯+ann
-
行列式关系 :特征值之积等于矩阵的行列式,即:∏i=1nλi=∣A∣\prod_{i=1}^n \lambda_i = |A|∏i=1nλi=∣A∣
-
可逆性判定 :矩阵AAA可逆的充要条件是其所有特征值都不为 0(因∣A∣≠0 ⟺ ∏i=1nλi≠0|A| \neq 0 \iff \prod_{i=1}^n \lambda_i \neq 0∣A∣=0⟺∏i=1nλi=0)。
-
拓展应用 :若已知AAA的n−1n-1n−1个特征值,可通过"迹"快速求第nnn个特征值(如3阶矩阵AAA的迹为5,已知特征值1、2,则第三个特征值为2)。
3.2 特征向量的性质
-
基础约束:特征向量必非零(零向量无意义);
-
线性无关性:
- 不同特征值的特征向量线性无关;
- kkk重特征值至多有kkk个线性无关特征向量(几何重数 ≤ 代数重数);
-
组合性质:
-
同一特征值的特征向量非零线性组合仍为该特征值的特征向量;
-
不同特征值的特征向量非零线性组合不是任何特征值的特征向量;
-
-
唯一性 :一个特征向量仅对应一个特征值(即若ξ\boldsymbol{\xi}ξ是λ1\lambda_1λ1的特征向量,则必不是λ2\lambda_2λ2(λ1≠λ2\lambda_1 \neq \lambda_2λ1=λ2)的特征向量)。
映射关系:"一对多"(一个特征值对应无数个特征向量,一个特征向量仅对应一个特征值)。
📌 推广结论 :若λ1,...,λs\lambda_1, \dots, \lambda_sλ1,...,λs是互异,ξi1,...,ξiri\boldsymbol{\xi}{i1}, \dots, \boldsymbol{\xi}{ir_i}ξi1,...,ξiri是λi\lambda_iλi的线性无关特征向量,则集合{ξ11,...,ξ1r1,...,ξs1,...,ξsrs}\{\boldsymbol{\xi}{11}, \dots, \boldsymbol{\xi}{1r_1},\quad \dots, \quad\boldsymbol{\xi}{s1}, \dots, \boldsymbol{\xi}{sr_s}\}{ξ11,...,ξ1r1,...,ξs1,...,ξsrs}线性无关;
3.3 特殊矩阵的特征值与特征向量
| 矩阵类型 | 特征值特征 | 特征向量说明 |
|---|---|---|
| 三角/对角矩阵 | 特征值 = 主对角线元素(因∣A−λE∣=∏i=1n(aii−λ)=0|A - \lambda E| = \prod_{i=1}^n (a_{ii} - \lambda)=0∣A−λE∣=∏i=1n(aii−λ)=0) | 对角矩阵的特征向量为标准单位向量e1,...,en\boldsymbol{e}_1,\dots,\boldsymbol{e}_ne1,...,en |
| 分块对角矩阵A=(A1OOA2)A=\begin{pmatrix}A_1&O\\O&A_2\end{pmatrix}A=(A1OOA2) | 特征值 =A1A_1A1特征值 ∪A2A_2A2特征值 | 对应A1A_1A1特征向量补零得AAA特征向量,对应A2A_2A2特征向量补零同理 |
| 秩1方阵(r(A)=1r(A)=1r(A)=1) | λ1=tr(A)\lambda_1=\text{tr}(A)λ1=tr(A),λ2=⋯=λn=0\lambda_2=\dots=\lambda_n=0λ2=⋯=λn=0 | 0 的几何重数g0=n−1g_0 = n-1g0=n−1,代数重数m0≥n−1m_0 \geq n-1m0≥n−1(仅当tr(A)=0\text{tr}(A)=0tr(A)=0时m0=nm_0=nm0=n) |
| 每行元素和为mmm的方阵 | mmm是特征值,其余特征值需解特征方程 | 对应mmm的特征向量为全1向量A(11⋮1)=(mm⋮m)=m(11⋮1)A \begin{pmatrix}1\\1\\\vdots\\1\end{pmatrix} = \begin{pmatrix}m\\m\\\vdots\\m\end{pmatrix} = m \begin{pmatrix}1\\1\\\vdots\\1\end{pmatrix}A 11⋮1 = mm⋮m =m 11⋮1 |
补充:秩1矩阵的推导(A=αβTA = \boldsymbol{\alpha}\boldsymbol{\beta}^TA=αβT,,,α,β\boldsymbol{\alpha},\boldsymbol{\beta}α,β为非零列向量)
- Aα=αβTα=(βTα)αA\boldsymbol{\alpha} = \boldsymbol{\alpha}\boldsymbol{\beta}^T\boldsymbol{\alpha} = (\boldsymbol{\beta}^T\boldsymbol{\alpha})\boldsymbol{\alpha}Aα=αβTα=(βTα)α,故非零特征值λ=βTα=tr(A)\lambda = \boldsymbol{\beta}^T\boldsymbol{\alpha} = \text{tr}(A)λ=βTα=tr(A);
- r(A)=1r(A)=1r(A)=1,故(A−0E)x=0(A - 0E)\boldsymbol{x}=\boldsymbol{0}(A−0E)x=0的基础解系含n−1n-1n−1个向量,即 0 的几何重数为n−1n-1n−1。
3.4 常用矩阵特征值与特征向量对照表
若λ\lambdaλ是AAA的特征值,ξ\boldsymbol{\xi}ξ是对应特征向量,则:
| 矩阵 | 特征值 | 对应的特征向量 |
|---|---|---|
| AAA | λ\lambdaλ | ξ\boldsymbol{\xi}ξ |
| ATA^TAT | λ\lambdaλ | 需单独解(λE−AT)x=0(\lambda E - A^T)\boldsymbol{x} = \boldsymbol{0}(λE−AT)x=0 |
| kAkAkA | kλk\lambdakλ | ξ\boldsymbol{\xi}ξ(k≠0k\neq0k=0可回推) |
| AkA^kAk | λk\lambda^kλk | ξ\boldsymbol{\xi}ξ |
| f(A)f(A)f(A) | f(λ)f(\lambda)f(λ) | ξ\boldsymbol{\xi}ξ |
| A−1A^{-1}A−1 | 1λ\frac{1}{\lambda}λ1 | ξ\boldsymbol{\xi}ξ(可回推) |
| A∗A^*A∗ | ∣A∣λ\frac{|A|}{\lambda}λ∣A∣ | ξ\boldsymbol{\xi}ξ(AAA可逆时可回推) |
| P−1APP^{-1}APP−1AP | λ\lambdaλ | P−1ξP^{-1}\boldsymbol{\xi}P−1ξ |
| PAP−1PAP^{-1}PAP−1 | λ\lambdaλ | PξP\boldsymbol{\xi}Pξ |
考试常考回推。注意,除注明外,其它都不可回推。
📝 推导示例(P−1APP^{-1}APP−1AP的特征向量):由于Aξ=λξ→P−1AEξ=λP−1ξ→P−1AP(P−1ξ)=λ(P−1ξ)A\xi=\lambda\xi\rightarrow P^{-1}AE\xi=\lambda P^{-1}\xi\rightarrow P^{-1}AP(P^{-1}\xi)=\lambda (P^{-1}\xi)Aξ=λξ→P−1AEξ=λP−1ξ→P−1AP(P−1ξ)=λ(P−1ξ),故λ\lambdaλ是P−1APP^{-1}APP−1AP的特征值,对应的特征向量是P−1ξP^{-1}\xiP−1ξ.🚨 重要推论:若矩阵AAA满足f(A)=0f(A)=0f(A)=0(fff为多项式),则AAA的任一特征值λ\lambdaλ必满足f(λ)=0f(\lambda)=0f(λ)=0(可用于快速求特征值范围)。
四、矩阵的相似
4.1 定义
设A,BA, BA,B为nnn阶方阵,若存在nnn阶可逆矩阵PPP,使得P−1AP=BP^{-1}AP = BP−1AP=B,则称AAA与BBB相似 ,记为A∼BA \sim BA∼B,可逆矩阵PPP称为相似变换矩阵。
💡 关系层级:相似⊂\subset⊂等价
- 等价:要求PAQ=BPAQ = BPAQ=B(P,QP,QP,Q可逆,适用于任意矩阵);
- 相似:要求Q=P−1Q = P^{-1}Q=P−1(仅适用于方阵)。
4.2 相似矩阵的性质
4.2.1 等价关系(自反/对称/传递)
相似是特殊的等价,故等价的三个性质相似也有:
-
反身性:A∼AA \sim AA∼A(取P=EP = EP=E);
-
对称性:A∼B ⟹ B∼AA \sim B \implies B \sim AA∼B⟹B∼A(取P−1P^{-1}P−1为变换矩阵);
-
传递性:A∼BA \sim BA∼B且B∼C ⟹ A∼CB \sim C \implies A \sim CB∼C⟹A∼C(取P,QP,QP,Q为变换矩阵,B=P−1AP,C=Q−1BQB=P^{-1}AP, C=Q^{-1}BQB=P−1AP,C=Q−1BQ)。
4.2.2 相似不变量(必要条件,核心必考)
若A∼BA \sim BA∼B,则以下性质完全相同:
- 特征多项式、特征值(含重数);
- 迹(tr(A)=tr(B)\text{tr}(A) = \text{tr}(B)tr(A)=tr(B));
- 行列式(∣A∣=∣B∣|A| = |B|∣A∣=∣B∣);
- 秩(r(A)=r(B)r(A) = r(B)r(A)=r(B));
- 各阶主子式之和;
- 特征矩阵的秩(r(λE−A)=r(λE−B)r(\lambda E - A) = r(\lambda E - B)r(λE−A)=r(λE−B),即λE−A∼λE−B\lambda E - A \sim \lambda E - BλE−A∼λE−B)。
上述性质是矩阵相似的必要非充分条件 。例如,A=[1101]A = \begin{bmatrix}1&1\\0&1\end{bmatrix}A=[1011]与E=[1001]E = \begin{bmatrix}1&0\\0&1\end{bmatrix}E=[1001]特征值相同但不相似(AAA不可对角化,EEE是对角矩阵)。
🔑 关键提醒:相似矩阵特征值相同 ,但特征向量不同 。若A∼BA\sim BA∼B(B=P−1APB=P^{-1}APB=P−1AP),则:
- 若ξ\boldsymbol{\xi}ξ是AAA对应λ\lambdaλ的特征向量,则P−1ξP^{-1}\boldsymbol{\xi}P−1ξ是BBB对应λ\lambdaλ的特征向量,即Aξ=λξ ⟺ B(P−1ξ)=λ(P−1ξ)A\boldsymbol{\xi}=\lambda\boldsymbol{\xi} \iff B(P^{-1}\boldsymbol{\xi})=\lambda(P^{-1}\boldsymbol{\xi})Aξ=λξ⟺B(P−1ξ)=λ(P−1ξ);
- 若ξ\boldsymbol{\xi}ξ是BBB对应λ\lambdaλ的特征向量,则PξP\boldsymbol{\xi}Pξ是AAA对应λ\lambdaλ的特征向量,即Bξ=λξ ⟺ A(Pξ)=λ(Pξ)B\boldsymbol{\xi}=\lambda\boldsymbol{\xi}\iff A(P\boldsymbol{\xi})=\lambda(P\boldsymbol{\xi})Bξ=λξ⟺A(Pξ)=λ(Pξ)。
4.2.3 多项式传递性
若A∼BA \sim BA∼B,则:
- Am∼BmA^m \sim B^mAm∼Bm(mmm为正整数);
- 对任意多项式f(x)f(x)f(x),有f(A)∼f(B)f(A) \sim f(B)f(A)∼f(B)(因P−1f(A)P=f(P−1AP)=f(B)P^{-1}f(A)P = f(P^{-1}AP) = f(B)P−1f(A)P=f(P−1AP)=f(B));
- 若AAA可逆,则A−1∼B−1A^{-1} \sim B^{-1}A−1∼B−1、A∗∼B∗A^* \sim B^*A∗∼B∗;
- AT∼BTA^T \sim B^TAT∼BT;
- 若A∼CA \sim CA∼C且B∼DB \sim DB∼D,则(AOOB)∼(COOD)\begin{pmatrix} A& O \\ O & B\end{pmatrix} \sim \begin{pmatrix} C & O \\ O & D\end{pmatrix}(AOOB)∼(COOD)。
AT∼BTA^T \sim B^TAT∼BT推导:若B=P−1APB=P^{-1}APB=P−1AP,则BT=PTAT(P−1)T=PTAT(PT)−1B^T=P^T A^T (P^{-1})^T = P^T A^T (P^T)^{-1}BT=PTAT(P−1)T=PTAT(PT)−1,令Q=(PT)−1Q=(P^T)^{-1}Q=(PT)−1,则BT=Q−1ATQB^T=Q^{-1}A^TQBT=Q−1ATQ
需注意AT∼BTA^T \sim B^TAT∼BT的变换矩阵与其他性质不同,不可混用(如A2+ATA^2+A^TA2+AT与B2+BTB^2+B^TB2+BT未必相似)。
4.3 矩阵相似的判别方法
-
定义法 :找到可逆矩阵PPP满足P−1AP=BP^{-1}AP = BP−1AP=B;
-
传递性法 :若A∼ΛA \sim \LambdaA∼Λ且Λ∼B\Lambda \sim BΛ∼B,则A∼BA \sim BA∼B;
-
必要条件排除法:若矩阵不满足上述 "不变量"(如特征值不同、秩不同等),则必不相似;
-
实对称矩阵特例 :实对称矩阵A∼B ⟺ A,BA \sim B \iff A,BA∼B⟺A,B特征值相同(充要条件)。
五、矩阵的相似对角化
5.1 定义
若nnn阶矩阵AAA与对角矩阵Λ=diag(λ1,λ2,...,λn)\Lambda = \text{diag}(\lambda_1, \lambda_2, \dots, \lambda_n)Λ=diag(λ1,λ2,...,λn)相似,则称AAA可相似对角化 ,Λ\LambdaΛ为AAA的相似标准形 (对角元为AAA的特征值,顺序与PPP的列向量一一对应,PPP的每列是AAA对应特征值的特征向量)。
与等价标准形的区别:
- 等价标准形:PAQ=(ErOOO)PAQ = \begin{pmatrix}E_r&O\\O&O\end{pmatrix}PAQ=(ErOOO)(适用于非方阵,P,QP,QP,Q独立可逆);
- 相似对角化:仅针对方阵,要求Q=P−1Q = P^{-1}Q=P−1。
5.2 相似对角化的条件
由P−1AP=ΛP^{-1}AP = \LambdaP−1AP=Λ得AP=PΛAP = P\LambdaAP=PΛ,记P=[ξ1,ξ2,⋯ ,ξn],Λ=diag(λ1,λ2,...,λn)P = [\xi_1, \xi_2, \cdots, \xi_n] ,\Lambda = \text{diag}(\lambda_1, \lambda_2, \dots, \lambda_n)P=[ξ1,ξ2,⋯,ξn],Λ=diag(λ1,λ2,...,λn),
则[Aξ1,Aξ2,⋯ ,Aξn]=[λ1ξ1,λ2ξ2,⋯ ,λnξn][A\xi_1, A\xi_2, \cdots, A\xi_n] = [\lambda_1\xi_1, \lambda_2\xi_2, \cdots, \lambda_n\xi_n][Aξ1,Aξ2,⋯,Aξn]=[λ1ξ1,λ2ξ2,⋯,λnξn],即Aξi=λiξiA\xi_i = \lambda_i\xi_iAξi=λiξi(i=1,2,⋯ ,ni = 1,2,\cdots,ni=1,2,⋯,n)。
因PPP可逆,故ξ1,ξ2,⋯ ,ξn\xi_1, \xi_2, \cdots, \xi_nξ1,ξ2,⋯,ξn线性无关,由此得:
| 条件类型 | 具体表述 |
|---|---|
| 充要条件1 | AAA有nnn个线性无关的特征向量(所有特征值的几何重数之和为nnn) |
| 充要条件2 | AAA的每个kkk重特征值(代数重数mλ=km_\lambda=kmλ=k)对应的几何重数gλ=kg_\lambda=kgλ=k(即k=n−r(A−λE)k=n-r(A-\lambda E)k=n−r(A−λE)) |
| 充分条件1 | AAA有nnn个互不相同的特征值(单根特征值几何重数=1,总和为nnn) |
| 充分条件2 | AAA为实对称矩阵(必可对角化) |
✅ 判别一个矩阵是否可相似对角化:
- 检查是否为实对称矩阵(是则必可对角化);
- 检查特征值是否为单根(是则可对角化);
- 若有重特征值,验证"几何重数=代数重数"(满足则可对角化,否则不可)。
5.3 相似对角化的步骤
- 求特征值 :解∣A−λE∣=0|A - \lambda E| = 0∣A−λE∣=0,得λ1,...,λn\lambda_1, \dots, \lambda_nλ1,...,λn(含重根);
- 求线性无关特征向量 :对每个λi\lambda_iλi,解(A−λiE)x=0(A - \lambda_i E)\boldsymbol{x} = \boldsymbol{0}(A−λiE)x=0,得基础解系;
- 验证可对角化 :若线性无关特征向量总数 = 矩阵阶数nnn,则可对角化,否则不可;
- 构造矩阵 :令P=[ξ1,ξ2,⋯ ,ξn]P=[\xi_1,\xi_2,\cdots,\xi_n]P=[ξ1,ξ2,⋯,ξn](ξi\boldsymbol{\xi}_iξi为线性无关特征向量),则P−1AP=ΛP^{-1}AP = \LambdaP−1AP=Λ(Λ\LambdaΛ对角元为对应特征值)。
💡 核心应用:若A∼ΛA \sim \LambdaA∼Λ,则P−1AkP=ΛkP^{-1}A^kP = \Lambda^kP−1AkP=Λk、P−1f(A)P=f(Λ)=diag(f(λ1),...,f(λn))P^{-1}f(A)P = f(\Lambda)= \text{diag}(f(\lambda_1), \dots, f(\lambda_n))P−1f(A)P=f(Λ)=diag(f(λ1),...,f(λn)),可大幅简化矩阵幂/多项式计算。
⚠️ 注意事项:
- PPP不唯一:同一特征值的基础解系可替换,PPP列序调整时,Λ\LambdaΛ对角元顺序需同步调整;
- 反求AAA:利用A=PΛP−1A = P\Lambda P^{-1}A=PΛP−1;
- 并非所有矩阵都可对角化(如[1101]\begin{bmatrix}1&1\\0&1\end{bmatrix}[1011]不可对角化)。
5.4 例题(矩阵幂计算)
已知A=[2112]A = \begin{bmatrix}2&1\\1&2\end{bmatrix}A=[2112],求A10A^{10}A10。
解:AAA的特征值λ1=1\lambda_1=1λ1=1,λ2=3\lambda_2=3λ2=3,特征向量ξ1=[−11]\boldsymbol{\xi}_1=\begin{bmatrix}-1\\1\end{bmatrix}ξ1=[−11],ξ2=[11]\boldsymbol{\xi}_2=\begin{bmatrix}1\\1\end{bmatrix}ξ2=[11];
构造P=[−1111]P = \begin{bmatrix}-1&1\\1&1\end{bmatrix}P=[−1111],则P−1=12[−1111]P^{-1} = \frac{1}{2}\begin{bmatrix}-1&1\\1&1\end{bmatrix}P−1=21[−1111],Λ=[1003]\Lambda = \begin{bmatrix}1&0\\0&3\end{bmatrix}Λ=[1003];
A10=PΛ10P−1=[−1111][100310]12[−1111]=12[310+1310−1310−1310+1]A^{10} = P\Lambda^{10}P^{-1} = \begin{bmatrix}-1&1\\1&1\end{bmatrix}\begin{bmatrix}1&0\\0&3^{10}\end{bmatrix}\frac{1}{2}\begin{bmatrix}-1&1\\1&1\end{bmatrix} = \frac{1}{2}\begin{bmatrix}3^{10}+1&3^{10}-1\\3^{10}-1&3^{10}+1\end{bmatrix}A10=PΛ10P−1=[−1111][100310]21[−1111]=21[310+1310−1310−1310+1]。
六、实对称矩阵的正交相似对角化
6.1 实对称矩阵的特殊性质
满足AT=AA^T = AAT=A的实矩阵称为实对称矩阵,其核心性质:
-
A−1A^{-1}A−1、A∗A^*A∗、ATA^TAT均为实对称矩阵;
-
特征值全为实数,特征向量均为实向量;
-
⭐️不同特征值的特征向量必正交(普通矩阵仅线性无关);
-
必可通过正交矩阵 对角化(Q−1AQ=QTAQ=ΛQ^{-1}AQ = Q^TAQ = \LambdaQ−1AQ=QTAQ=Λ);
-
每个kkk重特征值的几何重数 = 代数重数(gλ=mλg_\lambda = m_\lambdagλ=mλ)。
普通非实对称矩阵未必存在正交矩阵QQQ,使其相似对角化。
QQQ中特征向量ηi\eta_iηi与Λ\LambdaΛ中的特征值λi\lambda_iλi对应,且QQQ不唯一。
📌 正交 vs 线性无关:正交是更强的条件(正交必线性无关,线性无关未必正交)。
普通矩阵AAA:若λ1≠λ2 ⟹ ξ1\lambda_1 \neq \lambda_2 \implies \xi_1λ1=λ2⟹ξ1与ξ2\xi_2ξ2线性无关;
实对称矩阵AAA:若λ1≠λ2 ⟹ ξ1⊥ξ2\lambda_1 \neq \lambda_2 \implies \xi_1 \perp \xi_2λ1=λ2⟹ξ1⊥ξ2。
6.2 正交相似对角化的步骤
-
求特征值 :解∣A−λE∣=0|A - \lambda E| = 0∣A−λE∣=0,得实特征值λ1,...,λn\lambda_1, \dots, \lambda_nλ1,...,λn(含重根);
-
求特征向量 :对每个λi\lambda_iλi,解(A−λiE)x=0(A - \lambda_i E)\boldsymbol{x} = \boldsymbol{0}(A−λiE)x=0,得基础解系;
-
正交化 :仅对相同特征值 的线性无关特征向量做施密特正交化(不同特征值的特征向量已正交,无需处理);
PS:施密特正交化在《考研线代第三课:向量组》的向量空间一节中有详细说明。
回顾:设α1,α2\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2α1,α2线性无关,正交化得:
β1=α1\boldsymbol{\beta}_1 = \boldsymbol{\alpha}_1β1=α1,β2=α2−<α2,β1><β1,β1>β1\boldsymbol{\beta}_2 = \boldsymbol{\alpha}_2 - \frac{<\boldsymbol{\alpha}_2,\boldsymbol{\beta}_1>}{<\boldsymbol{\beta}_1,\boldsymbol{\beta}_1>}\boldsymbol{\beta}_1β2=α2−<β1,β1><α2,β1>β1;
高阶同理:βk=αk−∑i=1k−1<αk,βi><βi,βi>βi\boldsymbol{\beta}_k = \boldsymbol{\alpha}k - \sum{i=1}^{k-1}\frac{<\boldsymbol{\alpha}_k,\boldsymbol{\beta}_i>}{<\boldsymbol{\beta}_i,\boldsymbol{\beta}_i>}\boldsymbol{\beta}_iβk=αk−∑i=1k−1<βi,βi><αk,βi>βi。
-
单位化 :将正交化后的向量单位化为ηi=βi∣∣βi∣∣(i=1,...,n))\eta_i=\frac{\beta_i}{||\beta_i||}\quad(i=1,...,n))ηi=∣∣βi∣∣βi(i=1,...,n));
-
构造正交矩阵 :令Q=[η1,η2,⋯ ,ηn]Q = [\eta_1, \eta_2, \cdots, \eta_n]Q=[η1,η2,⋯,ηn],则QQQ为正交矩阵,且Q−1AQ=QTAQ=ΛQ^{-1}AQ=Q^TAQ=\LambdaQ−1AQ=QTAQ=Λ。
特征值相同是两个矩阵相似的必要条件。当A,BA, BA,B均为实对称矩阵时,A∼BA \sim BA∼B的充要条件是A,BA, BA,B有相同的特征值。
6.3 示例(实对称矩阵正交对角化)
求A=[1111]A = \begin{bmatrix}1&1\\1&1\end{bmatrix}A=[1111]的正交相似对角矩阵:
- 特征方程:∣A−λE∣=∣1−λ111−λ∣=λ(λ−2)=0|A - \lambda E| = \begin{vmatrix}1-\lambda&1\\1&1-\lambda\end{vmatrix} = \lambda(\lambda-2) = 0∣A−λE∣= 1−λ111−λ =λ(λ−2)=0,得λ1=0\lambda_1=0λ1=0,λ2=2\lambda_2=2λ2=2;
- 求特征向量:
- λ1=0\lambda_1=0λ1=0:解(A−0E)x=0(A-0E)\boldsymbol{x}=0(A−0E)x=0,得基础解系α1=[−11]\boldsymbol{\alpha}_1 = \begin{bmatrix}-1\\1\end{bmatrix}α1=[−11];
- λ2=2\lambda_2=2λ2=2:解(A−2E)x=0(A-2E)\boldsymbol{x}=0(A−2E)x=0,得基础解系α2=[11]\boldsymbol{\alpha}_2 = \begin{bmatrix}1\\1\end{bmatrix}α2=[11];
- 正交化:α1\boldsymbol{\alpha}_1α1与α2\boldsymbol{\alpha}_2α2已正交,无需处理;
- 单位化:η1=12[−11]\boldsymbol{\eta}_1 = \frac{1}{\sqrt{2}}\begin{bmatrix}-1\\1\end{bmatrix}η1=2 1[−11],η2=12[11]\boldsymbol{\eta}_2 = \frac{1}{\sqrt{2}}\begin{bmatrix}1\\1\end{bmatrix}η2=2 1[11];
- 构造正交矩阵:Q=[−12121212]Q = \begin{bmatrix}-\frac{1}{\sqrt{2}}&\frac{1}{\sqrt{2}}\\\frac{1}{\sqrt{2}}&\frac{1}{\sqrt{2}}\end{bmatrix}Q=[−2 12 12 12 1],则QTAQ=[0002]Q^TAQ = \begin{bmatrix}0&0\\0&2\end{bmatrix}QTAQ=[0002]。