在考研数学的复习中,线性代数的相似对角化和实对称矩阵是绝对的核心考点。这部分内容不仅计算量大,而且概念容易混淆。脚踏实地跑通这里的每一个底层逻辑,是将知识内化为解题直觉的关键。
本文基于我近期的复习笔记,系统梳理了等价与相似的区别、相似对角化的判定顺序、实对称矩阵的特殊性质,以及施密特正交化的计算技巧。
一、 等价与相似的边界及核心性质
在矩阵的变换中,必须严格区分等价 与相似:
- 相似 (Similarity): P−1AP=BP^{-1}AP = BP−1AP=B,则称 A∼BA \sim BA∼B。若 BBB 为对角阵 Λ\LambdaΛ,则是我们常说的相似对角化。
- 等价 (Equivalence): PAQ=BPAQ = BPAQ=B,则称 A≃BA \simeq BA≃B(通过初等行列变换)。
1. 相似必推出的 4 大性质
若 A∼BA \sim BA∼B,则必然满足以下四个条件(这是解题的极重要切入点):
- 特征值相同 :λA=λB\lambda_A = \lambda_BλA=λB
- 迹相同 :∑aii=∑bii\sum a_{ii} = \sum b_{ii}∑aii=∑bii,即 tr(A)=tr(B)\text{tr}(A) = \text{tr}(B)tr(A)=tr(B)(主对角线元素之和相等)
- 行列式相同 :∣A∣=∣B∣|A| = |B|∣A∣=∣B∣,且 ∣A∣=λ1λ2⋯λn|A| = \lambda_1\lambda_2\cdots\lambda_n∣A∣=λ1λ2⋯λn
- 秩相同 :r(A)=r(B)r(A) = r(B)r(A)=r(B)
💡 笔记方法总结:这四大性质在考题中的 3 种核心应用
- (1) 反推不相似: 选择题中,只要上述 4 个条件有一个不满足,直接秒杀判定两矩阵不相似。
- (2) 桥梁条件: 已知 A∼BA \sim BA∼B,利用迹或行列式相等建立等式,求解矩阵中的未知参数或未知的特征值 λn\lambda_nλn。
- (3) 降维求值: 遇到复杂的矩阵求秩或求行列式,直接转化为求其特征值的乘积或非零特征值的个数。
2. 相似的其他传递与扩展性质
- 自反、对称与传递性:A∼AA \sim AA∼A;若 A∼BA \sim BA∼B,则 B∼AB \sim AB∼A;若 A∼B,B∼CA \sim B, B \sim CA∼B,B∼C,则 A∼CA \sim CA∼C。
- 特殊矩阵: 数量阵 A=kEA = kEA=kE 只与自身相似(即只能找到它自己 111 个)。
- 同步变化性质: 若 A∼BA \sim BA∼B,则它们的逆、幂次、伴随、转置均相似,即:
A−1∼B−1,An∼Bn,A∗∼B∗,AT∼BTA^{-1} \sim B^{-1}, A^n \sim B^n, A^* \sim B^*, A^T \sim B^TA−1∼B−1,An∼Bn,A∗∼B∗,AT∼BT - 平移性质: A+kE∼B+kEA+kE \sim B+kEA+kE∼B+kE
二、 相似对角化的判定法则与做题顺序
这是做大题时的核心框架。面对一个矩阵 AAA,判断其能否相似对角化,有以下判定法则:
1. 判定的充要与充分条件
- ① 充要条件(宏观判断): A∼Λ⇔AA \sim \Lambda \Leftrightarrow AA∼Λ⇔A 有 nnn 个线性无关的特征向量。
- ② 充分条件: AAA 有 nnn 个不同特征值 ⇔A∼Λ\Leftrightarrow A \sim \Lambda⇔A∼Λ(即 nnn 个不同的单根,必能对角化)。
- ③ 重根条件: λ\lambdaλ 是 AAA 的 kkk 重特征值,如果 λ\lambdaλ 恰好有 kkk 个线性无关的特征向量 ⇔A∼Λ\Leftrightarrow A \sim \Lambda⇔A∼Λ(即几何重数 = 代数重数)。
- ④ 实对称条件: AAA 是实对称矩阵 ⇒A∼Λ\Rightarrow A \sim \Lambda⇒A∼Λ。(即使有重根,如某特征值是 2 重根,也必定能求出 2 个线性无关的特征向量)。
💡 笔记方法总结:考场上的判定与应用顺序
做题时,切忌直接上手求特征向量。请务必按照以下顺序进行判定,能极大提升效率:
④ 实对称阵判定 →\rightarrow→ ② 互不相同单根判定 →\rightarrow→ ③ 重根情况验证 →\rightarrow→ ① 宏观充要条件
2. 特殊例题:秩为 1 的矩阵"秒杀"法
例: 已知矩阵 A=(123246369)A = \begin{pmatrix} 1 & 2 & 3 \\ 2 & 4 & 6 \\ 3 & 6 & 9 \end{pmatrix}A= 123246369 ,求其特征值。
分析与秒杀技巧:
观察发现,矩阵 AAA 的各行、各列均成比例。
- 原理解析: 经过初等行列变换后,该矩阵只有 111 个有效行,即 r(A)=1r(A)=1r(A)=1。
- 特征值推导: 秩为 1 意味着有 3−1=23-1=23−1=2 个特征值为 000。
- 利用迹求余根: 因为 λ1+λ2+λ3=∑i=13aii=1+4+9=14\lambda_1 + \lambda_2 + \lambda_3 = \sum_{i=1}^3 a_{ii} = 1 + 4 + 9 = 14λ1+λ2+λ3=∑i=13aii=1+4+9=14。已知 λ1=0,λ2=0\lambda_1=0, \lambda_2=0λ1=0,λ2=0,故 λ3=14\lambda_3 = 14λ3=14。
结论: 特征值为 0,0,140, 0, 140,0,14。全程无需展开 ∣λE−A∣| \lambda E - A |∣λE−A∣!
3. A∼ΛA \sim \LambdaA∼Λ 的标准步骤
- 求 AAA 的特征值 λ1,...,λn\lambda_1, \dots, \lambda_nλ1,...,λn。
- 求对应的特征向量 η1,η2,...,ηn\eta_1, \eta_2, \dots, \eta_nη1,η2,...,ηn(求值 →\rightarrow→ 求向量)。
- 按列合并为可逆矩阵 P=(η1,η2,...,ηn)P = (\eta_1, \eta_2, \dots, \eta_n)P=(η1,η2,...,ηn),则有 P−1AP=diag(λ1,...,λn)P^{-1}AP = \text{diag}(\lambda_1, \dots, \lambda_n)P−1AP=diag(λ1,...,λn)。
三、 实对称矩阵与正交矩阵:性质与几何直观
1. 矩阵高次幂的计算技巧
已知相似对角阵(特征值)和 PPP,可以通过 P−1AP=Λ⇔A=PΛP−1P^{-1}AP = \Lambda \Leftrightarrow A = P\Lambda P^{-1}P−1AP=Λ⇔A=PΛP−1 来反求 AAA。
求矩阵高次幂的核心公式:
An=(PΛP−1)n=PΛnP−1A^n = (P\Lambda P^{-1})^n = P\Lambda^n P^{-1}An=(PΛP−1)n=PΛnP−1
2. 实对称矩阵的 4 大专属特权
实对称矩阵在考研中地位极高,因为它具备以下完美性质:
- 特征值都为实数。
- 不同特征值对应的特征向量必正交(这是重点!)。
- 必能相似对角化。
- 可用正交矩阵进行相似对角化。
3. 正交矩阵的判定与几何理解
若 ATA=AAT=EA^TA = AA^T = EATA=AAT=E,则 AAA 为正交矩阵。由此可得:
- A−1=ATA^{-1} = A^TA−1=AT(这是简化计算的神器,求逆直接变转置)。
- AAA 的行(列)向量必两两正交。
- AAA 的行(列)向量均为单位向量。
💡 笔记方法总结:正交与线性无关的几何图景
- 线性相关: 两个向量 α1,α2\alpha_1, \alpha_2α1,α2 共线(如 α1=kα2\alpha_1 = k\alpha_2α1=kα2)。
- 线性无关: 两个向量的夹角在 (0∘,180∘)(0^\circ, 180^\circ)(0∘,180∘) 之间,构成了平面/空间。
- 正交: 两个向量夹角严格等于 90∘90^\circ90∘。
本质理解: 正交是一种"特异化"的线性无关。
四、 施密特正交化与相似的物理本质
当我们使用正交矩阵 QQQ 使得 Q−1AQ=ΛQ^{-1}AQ = \LambdaQ−1AQ=Λ 时,因为 Q−1=QTQ^{-1} = Q^TQ−1=QT,所以公式可以直接简化为 QTAQ=ΛQ^TAQ = \LambdaQTAQ=Λ ,即 A=QΛQTA = Q\Lambda Q^TA=QΛQT。这里无需再求复杂的逆矩阵。
构建正交矩阵 QQQ 的核心工具就是施密特正交化。
1. 施密特正交化公式与计算经验
对于一组线性无关的向量 α1,α2,α3\alpha_1, \alpha_2, \alpha_3α1,α2,α3:
- 令 β1=α1\beta_1 = \alpha_1β1=α1
- 令 β2=α2−(α2,β1)(β1,β1)β1\beta_2 = \alpha_2 - \frac{(\alpha_2, \beta_1)}{(\beta_1, \beta_1)}\beta_1β2=α2−(β1,β1)(α2,β1)β1
- 令 β3=α3−(α3,β1)(β1,β1)β1−(α3,β2)(β2,β2)β2\beta_3 = \alpha_3 - \frac{(\alpha_3, \beta_1)}{(\beta_1, \beta_1)}\beta_1 - \frac{(\alpha_3, \beta_2)}{(\beta_2, \beta_2)}\beta_2β3=α3−(β1,β1)(α3,β1)β1−(β2,β2)(α3,β2)β2
💡 笔记方法总结:计算减负与"去属性"理解
- 个人理解: 施密特正交化的本质,就是对每个新加入的列向量"去属性"(剔除掉在已有向量方向上的投影分量),使每一个留下来的向量之间都绝对垂直(线性无关)。
- 算力优化: 内积 (β1,β1)(\beta_1, \beta_1)(β1,β1) 和 (β2,β2)(\beta_2, \beta_2)(β2,β2) 本质上就是向量的模长平方(如 a12+a22+a32a_1^2+a_2^2+a_3^2a12+a22+a32)。这两个值可以优先算出来,在后续公式中反复使用,能显著降低计算错误率。
2. 重根与单根的处理策略
面对特征向量 α1,α2,α3\alpha_1, \alpha_2, \alpha_3α1,α2,α3 时,不要盲目套用正交化公式:
- 单根情况: 若 λ1,λ2,λ3\lambda_1, \lambda_2, \lambda_3λ1,λ2,λ3 均为单根,由于实对称矩阵不同特征值的特征向量天然正交,只需直接单位化即可。
- 重根情况: 若 λ1=λ2≠λ3\lambda_1 = \lambda_2 \neq \lambda_3λ1=λ2=λ3,则只需对属于重根的 α1,α2\alpha_1, \alpha_2α1,α2 进行施密特正交化,然后再将所有向量单位化。
合并后令 Q=(η1,η2,η3)Q = (\eta_1, \eta_2, \eta_3)Q=(η1,η2,η3),则 QQQ 即为所求的正交阵。
3. 升维思考:相似矩阵与对角化的物理本质
在复习的最后,跳出应试的计算,理解这套体系的底层逻辑:
- 相似矩阵的本质: 对同一个"物理运动轨迹",在不同坐标系 (或不同观测原点)下得到的不同观测结果。矩阵 PPP 就是那个转换坐标系的观测镜。
- 相似对角阵的本质: 一种完美的解耦状态。在对角阵的视角下,系统只有各个轴方向上的独立拉伸或收缩,没有轴与轴之间的干扰。
- 工程应用: 这种寻找主方向并解耦的思想,是诸多计算机底层算法的基础。例如图像压缩 (PCA 主成分分析,保留大特征值方向,剔除干扰轴)、以及 Google 的 PageRank 算法(计算马尔可夫转移矩阵的特征值极限稳态)。
扎实的推导是通往高分的唯一捷径。希望这篇笔记整理能为大家的线代复习提供一个清晰的逻辑主线!