【考研线代笔记】相似对角化与实对称矩阵：判定法则、计算技巧与物理本质

在考研数学的复习中，线性代数的相似对角化和实对称矩阵是绝对的核心考点。这部分内容不仅计算量大，而且概念容易混淆。脚踏实地跑通这里的每一个底层逻辑，是将知识内化为解题直觉的关键。

本文基于我近期的复习笔记，系统梳理了等价与相似的区别、相似对角化的判定顺序、实对称矩阵的特殊性质，以及施密特正交化的计算技巧。

一、等价与相似的边界及核心性质

在矩阵的变换中，必须严格区分等价与相似：

相似 (Similarity): P−1AP=BP^{-1}AP = BP−1AP=B，则称 A∼BA \sim BA∼B。若 BBB 为对角阵 Λ\LambdaΛ，则是我们常说的相似对角化。
等价 (Equivalence): PAQ=BPAQ = BPAQ=B，则称 A≃BA \simeq BA≃B（通过初等行列变换）。

1. 相似必推出的 4 大性质

若 A∼BA \sim BA∼B，则必然满足以下四个条件（这是解题的极重要切入点）：

特征值相同 ：λA=λB\lambda_A = \lambda_BλA=λB
迹相同 ：∑aii=∑bii\sum a_{ii} = \sum b_{ii}∑aii=∑bii，即 tr(A)=tr(B)\text{tr}(A) = \text{tr}(B)tr(A)=tr(B)（主对角线元素之和相等）
行列式相同 ：∣A∣=∣B∣|A| = |B|∣A∣=∣B∣，且 ∣A∣=λ1λ2⋯λn|A| = \lambda_1\lambda_2\cdots\lambda_n∣A∣=λ1λ2⋯λn
秩相同 ：r(A)=r(B)r(A) = r(B)r(A)=r(B)

💡 笔记方法总结：这四大性质在考题中的 3 种核心应用

(1) 反推不相似： 选择题中，只要上述 4 个条件有一个不满足，直接秒杀判定两矩阵不相似。

(2) 桥梁条件： 已知 A∼BA \sim BA∼B，利用迹或行列式相等建立等式，求解矩阵中的未知参数或未知的特征值 λn\lambda_nλn。

(3) 降维求值： 遇到复杂的矩阵求秩或求行列式，直接转化为求其特征值的乘积或非零特征值的个数。

2. 相似的其他传递与扩展性质

自反、对称与传递性：A∼AA \sim AA∼A；若 A∼BA \sim BA∼B，则 B∼AB \sim AB∼A；若 A∼B,B∼CA \sim B, B \sim CA∼B,B∼C，则 A∼CA \sim CA∼C。
特殊矩阵： 数量阵 A=kEA = kEA=kE 只与自身相似（即只能找到它自己 111 个）。
同步变化性质： 若 A∼BA \sim BA∼B，则它们的逆、幂次、伴随、转置均相似，即：
A−1∼B−1,An∼Bn,A∗∼B∗,AT∼BTA^{-1} \sim B^{-1}, A^n \sim B^n, A^* \sim B^*, A^T \sim B^TA−1∼B−1,An∼Bn,A∗∼B∗,AT∼BT
平移性质： A+kE∼B+kEA+kE \sim B+kEA+kE∼B+kE

二、相似对角化的判定法则与做题顺序

这是做大题时的核心框架。面对一个矩阵 AAA，判断其能否相似对角化，有以下判定法则：

1. 判定的充要与充分条件

① 充要条件（宏观判断）： A∼Λ⇔AA \sim \Lambda \Leftrightarrow AA∼Λ⇔A 有 nnn 个线性无关的特征向量。
② 充分条件： AAA 有 nnn 个不同特征值 ⇔A∼Λ\Leftrightarrow A \sim \Lambda⇔A∼Λ（即 nnn 个不同的单根，必能对角化）。
③ 重根条件： λ\lambdaλ 是 AAA 的 kkk 重特征值，如果 λ\lambdaλ 恰好有 kkk 个线性无关的特征向量 ⇔A∼Λ\Leftrightarrow A \sim \Lambda⇔A∼Λ（即几何重数 = 代数重数）。
④ 实对称条件： AAA 是实对称矩阵 ⇒A∼Λ\Rightarrow A \sim \Lambda⇒A∼Λ。（即使有重根，如某特征值是 2 重根，也必定能求出 2 个线性无关的特征向量）。

💡 笔记方法总结：考场上的判定与应用顺序

做题时，切忌直接上手求特征向量。请务必按照以下顺序进行判定，能极大提升效率：
④ 实对称阵判定 →\rightarrow→ ② 互不相同单根判定 →\rightarrow→ ③ 重根情况验证 →\rightarrow→ ① 宏观充要条件

2. 特殊例题：秩为 1 的矩阵"秒杀"法

例：已知矩阵 A=(123246369)A = \begin{pmatrix} 1 & 2 & 3 \\ 2 & 4 & 6 \\ 3 & 6 & 9 \end{pmatrix}A= 123246369 ，求其特征值。

分析与秒杀技巧：

观察发现，矩阵 AAA 的各行、各列均成比例。

原理解析： 经过初等行列变换后，该矩阵只有 111 个有效行，即 r(A)=1r(A)=1r(A)=1。
特征值推导： 秩为 1 意味着有 3−1=23-1=23−1=2 个特征值为 000。
利用迹求余根： 因为 λ1+λ2+λ3=∑i=13aii=1+4+9=14\lambda_1 + \lambda_2 + \lambda_3 = \sum_{i=1}^3 a_{ii} = 1 + 4 + 9 = 14λ1+λ2+λ3=∑i=13aii=1+4+9=14。已知 λ1=0,λ2=0\lambda_1=0, \lambda_2=0λ1=0,λ2=0，故 λ3=14\lambda_3 = 14λ3=14。
结论： 特征值为 0,0,140, 0, 140,0,14。全程无需展开 ∣λE−A∣| \lambda E - A |∣λE−A∣！

3. A∼ΛA \sim \LambdaA∼Λ 的标准步骤

求 AAA 的特征值 λ1,...,λn\lambda_1, \dots, \lambda_nλ1,...,λn。
求对应的特征向量 η1,η2,...,ηn\eta_1, \eta_2, \dots, \eta_nη1,η2,...,ηn（求值 →\rightarrow→ 求向量）。
按列合并为可逆矩阵 P=(η1,η2,...,ηn)P = (\eta_1, \eta_2, \dots, \eta_n)P=(η1,η2,...,ηn)，则有 P−1AP=diag(λ1,...,λn)P^{-1}AP = \text{diag}(\lambda_1, \dots, \lambda_n)P−1AP=diag(λ1,...,λn)。

三、实对称矩阵与正交矩阵：性质与几何直观

1. 矩阵高次幂的计算技巧

已知相似对角阵（特征值）和 PPP，可以通过 P−1AP=Λ⇔A=PΛP−1P^{-1}AP = \Lambda \Leftrightarrow A = P\Lambda P^{-1}P−1AP=Λ⇔A=PΛP−1 来反求 AAA。

求矩阵高次幂的核心公式：

An=(PΛP−1)n=PΛnP−1A^n = (P\Lambda P^{-1})^n = P\Lambda^n P^{-1}An=(PΛP−1)n=PΛnP−1

2. 实对称矩阵的 4 大专属特权

实对称矩阵在考研中地位极高，因为它具备以下完美性质：

特征值都为实数。
不同特征值对应的特征向量必正交（这是重点！）。
必能相似对角化。
可用正交矩阵进行相似对角化。

3. 正交矩阵的判定与几何理解

若 ATA=AAT=EA^TA = AA^T = EATA=AAT=E，则 AAA 为正交矩阵。由此可得：

A−1=ATA^{-1} = A^TA−1=AT（这是简化计算的神器，求逆直接变转置）。
AAA 的行（列）向量必两两正交。
AAA 的行（列）向量均为单位向量。

💡 笔记方法总结：正交与线性无关的几何图景

线性相关： 两个向量 α1,α2\alpha_1, \alpha_2α1,α2 共线（如 α1=kα2\alpha_1 = k\alpha_2α1=kα2）。

线性无关： 两个向量的夹角在 (0∘,180∘)(0^\circ, 180^\circ)(0∘,180∘) 之间，构成了平面/空间。

正交： 两个向量夹角严格等于 90∘90^\circ90∘。
本质理解： 正交是一种"特异化"的线性无关。

四、施密特正交化与相似的物理本质

当我们使用正交矩阵 QQQ 使得 Q−1AQ=ΛQ^{-1}AQ = \LambdaQ−1AQ=Λ 时，因为 Q−1=QTQ^{-1} = Q^TQ−1=QT，所以公式可以直接简化为 QTAQ=ΛQ^TAQ = \LambdaQTAQ=Λ ，即 A=QΛQTA = Q\Lambda Q^TA=QΛQT。这里无需再求复杂的逆矩阵。

构建正交矩阵 QQQ 的核心工具就是施密特正交化。

1. 施密特正交化公式与计算经验

对于一组线性无关的向量 α1,α2,α3\alpha_1, \alpha_2, \alpha_3α1,α2,α3：

令 β1=α1\beta_1 = \alpha_1β1=α1
令 β2=α2−(α2,β1)(β1,β1)β1\beta_2 = \alpha_2 - \frac{(\alpha_2, \beta_1)}{(\beta_1, \beta_1)}\beta_1β2=α2−(β1,β1)(α2,β1)β1
令 β3=α3−(α3,β1)(β1,β1)β1−(α3,β2)(β2,β2)β2\beta_3 = \alpha_3 - \frac{(\alpha_3, \beta_1)}{(\beta_1, \beta_1)}\beta_1 - \frac{(\alpha_3, \beta_2)}{(\beta_2, \beta_2)}\beta_2β3=α3−(β1,β1)(α3,β1)β1−(β2,β2)(α3,β2)β2

💡 笔记方法总结：计算减负与"去属性"理解

个人理解： 施密特正交化的本质，就是对每个新加入的列向量"去属性"（剔除掉在已有向量方向上的投影分量），使每一个留下来的向量之间都绝对垂直（线性无关）。

算力优化： 内积 (β1,β1)(\beta_1, \beta_1)(β1,β1) 和 (β2,β2)(\beta_2, \beta_2)(β2,β2) 本质上就是向量的模长平方（如 a12+a22+a32a_1^2+a_2^2+a_3^2a12+a22+a32）。这两个值可以优先算出来，在后续公式中反复使用，能显著降低计算错误率。

2. 重根与单根的处理策略

面对特征向量 α1,α2,α3\alpha_1, \alpha_2, \alpha_3α1,α2,α3 时，不要盲目套用正交化公式：

单根情况： 若 λ1,λ2,λ3\lambda_1, \lambda_2, \lambda_3λ1,λ2,λ3 均为单根，由于实对称矩阵不同特征值的特征向量天然正交，只需直接单位化即可。
重根情况： 若 λ1=λ2≠λ3\lambda_1 = \lambda_2 \neq \lambda_3λ1=λ2=λ3，则只需对属于重根的 α1,α2\alpha_1, \alpha_2α1,α2 进行施密特正交化，然后再将所有向量单位化。

合并后令 Q=(η1,η2,η3)Q = (\eta_1, \eta_2, \eta_3)Q=(η1,η2,η3)，则 QQQ 即为所求的正交阵。

3. 升维思考：相似矩阵与对角化的物理本质

在复习的最后，跳出应试的计算，理解这套体系的底层逻辑：

相似矩阵的本质： 对同一个"物理运动轨迹"，在不同坐标系 （或不同观测原点）下得到的不同观测结果。矩阵 PPP 就是那个转换坐标系的观测镜。
相似对角阵的本质： 一种完美的解耦状态。在对角阵的视角下，系统只有各个轴方向上的独立拉伸或收缩，没有轴与轴之间的干扰。
工程应用： 这种寻找主方向并解耦的思想，是诸多计算机底层算法的基础。例如图像压缩 （PCA 主成分分析，保留大特征值方向，剔除干扰轴）、以及 Google 的 PageRank 算法（计算马尔可夫转移矩阵的特征值极限稳态）。

扎实的推导是通往高分的唯一捷径。希望这篇笔记整理能为大家的线代复习提供一个清晰的逻辑主线！