坐标变换与相似矩阵
2023年11月4日
#algebra
文章目录
1. 基变换与坐标变换
坐标变换与基变换都要通过过渡矩阵 A A A 来实现。设有一向量 f ⃗ \vec f f , x x x 是在基 α \alpha α 下该向量的坐标, y y y 是在新基 β \beta β 下该向量的坐标,则基变换为:
β = α A , A = α − 1 β \beta=\alpha A \,\,,\,\, A= \alpha^ {-1} \beta β=αA,A=α−1β
式中的基也是矩阵。当原基 α = I \alpha= I α=I ,过渡矩阵的每一列列向量相当于新的坐标轴的基向量。
坐标变换通过原坐标向量左乘过渡矩阵的逆得到,即:
y = A − 1 x y= A^{-1}x y=A−1x
而注意,矩阵在某组基下的表示意味着相似变换。如矩阵 X X X 在基 β \beta β 下的表示为 Y Y Y,意味着
X β = β Y , Y = β − 1 X β X \beta=\beta Y \,\,,\,\, Y=\beta^{-1} X \beta Xβ=βY,Y=β−1Xβ
相当于矩阵的坐标变换,原基相当于单位阵。如果 X X X 又是矩阵 F F F 在某组基 α \alpha α 下的表示,则有
F α = α X , X = α − 1 F α F \alpha= \alpha X \,\,,\,\, X= \alpha^{-1}F \alpha Fα=αX,X=α−1Fα
Y = ( α − 1 β ) − 1 F ( α − 1 β ) = A − 1 F A Y=( \alpha^{-1} \beta)^{-1}F( \alpha^{-1} \beta)=A^{-1}FA Y=(α−1β)−1F(α−1β)=A−1FA
F F F 的基是单位阵。
2. 相似变换
如果存在可逆矩阵 P {P} P ,使得
B = P − 1 A P B=P^{-1}AP B=P−1AP
则称矩阵 A {A} A 与 B {B} B 相似,记为 A ∼ B {A\sim B} A∼B ;并称 P {P} P 为把 A {A} A 变成B的相似变换矩阵 。显然相似即等价。
相似变换与逆矩阵有关,相似变换前后的矩阵为相似矩阵。
性质如下
- 反身性 A ∼ A A\sim A A∼A
- 对称性 A ∼ B → B ∼ A A\sim B\to B \sim A A∼B→B∼A
- 传递性 A ∼ B , B ∼ C → A ∼ C A\sim B \,\,,\,\, B\sim C\to A\sim C A∼B,B∼C→A∼C
几条定理,若 A ∼ B A\sim B A∼B
- rank ( A ) = rank ( B ) , ∣ A ∣ = ∣ B ∣ \text{rank}(A)= \text{rank}(B) \,\,,\,\, |A|=|B| rank(A)=rank(B),∣A∣=∣B∣
- det ( λ I − A ) = det ( λ I − B ) \det( \lambda I-A)=\det( \lambda I-B) det(λI−A)=det(λI−B),即特征相同
- A − 1 ∼ B − 1 , A T ∼ B T , f ( A ) ∼ f ( B ) A^{-1}\sim B^{-1} \,\,,\,\, A^ \mathrm T\sim B^ \mathrm T \,\,,\,\, f(A)\sim f(B) A−1∼B−1,AT∼BT,f(A)∼f(B)
说明
- 相似对角化 如果 A n {A_n} An 有 n {n} n 个线性无关的特征向量(特征值可以相同),则相似变换可以把 A {A} A 变成对角阵
- 实对称矩阵 A {A} A 可以相似对角化, rank ( A ) \text{rank}(A) rank(A) 等于非零特征值的个数
- 上/下三角矩阵主对角线元素相同则不能相似对角化
- n {n} n 阶方阵 A {A} A 满足的二次方程有两个互异实根,则因式分解后秩的和为 n {n} n ,且 A {A} A 可相似对角化
证明
A 2 − 3 A + 2 I = 0 → ( A − I ) ( A − 2 I ) = 0 A^2-3A+2I=0\to(A-I)(A-2I)=0 A2−3A+2I=0→(A−I)(A−2I)=0
∴ rank ( A − I ) + rank ( A − 2 I ) ≤ n \therefore \text{rank}(A-I)+ \text{rank}(A-2I) \le n ∴rank(A−I)+rank(A−2I)≤n
又 rank ( A − I ) + rank ( A − 2 I ) ≥ rank ( A − I + 2 I − A ) = rank ( I ) = n \text{又}\, \text{rank}(A-I)+ \text{rank}(A-2I)\ge \text{rank}(A-I+2I-A)= \text{rank}(I)=n 又rank(A−I)+rank(A−2I)≥rank(A−I+2I−A)=rank(I)=n
∴ rank ( A − I ) + rank ( A − 2 I ) = n \therefore \text{rank}(A-I)+ \text{rank}(A-2I)=n ∴rank(A−I)+rank(A−2I)=n
A {A} A 的线性无关特征向量的个数为
n − rank ( A − I ) + n − rank ( A − 2 I ) = 2 n − n = n n- \text{rank}(A-I)+ n- \text{rank}(A-2I)=2n-n=n n−rank(A−I)+n−rank(A−2I)=2n−n=n - 相似没有充要条件,有充分条件(矩阵有相同的相似对角化矩阵),也有必要条件(相似则1. 特征值相同 2. 秩相同)。如果特征值相同,而两个矩阵都不可对角化且秩相同,则不能判断矩阵是否相似。
使用相似变换求解LTI微分方程:
[!example]-
{ d d t x 1 = x 2 d d t x 2 = x 3 d d t x 3 = − 6 x 1 − 11 x 2 − 6 x 3 \begin{cases} \frac{\mathrm d}{\mathrm dt}x_1=x_2\\ \frac{\mathrm d }{\mathrm dt}x_2=x_3\\ \frac{\mathrm d }{\mathrm dt}x_3=-6x_1-11x_2-6x_3 \end{cases} ⎩ ⎨ ⎧dtdx1=x2dtdx2=x3dtdx3=−6x1−11x2−6x3解:
A = [ 0 1 0 0 0 1 − 6 − 11 − 6 ] , det ( λ I − A ) = ( λ + 1 ) ( λ + 2 ) ( λ + 3 ) A= \begin{bmatrix} 0 & 1 & 0 \\ 0 & 0 & 1 \\ -6 & -11 & -6 \end{bmatrix} \,\,,\,\, \det(\lambda I-A)=( \lambda+1)( \lambda+2)( \lambda+3) A= 00−610−1101−6 ,det(λI−A)=(λ+1)(λ+2)(λ+3)有三个不同的特征值, A {A} A 可对角化。分别解 ( λ k I − A ) x = 0 , k = 1 , 2 , 3 (\lambda_k I-A)x=0 \,\,,\,\, k=1,2,3 (λkI−A)x=0,k=1,2,3,得变换矩阵
P = ( α 1 , α 2 , α 3 ) = [ 1 1 1 − 1 − 2 − 3 1 4 9 ] P=(\alpha_1,\alpha_2,\alpha_3)= \begin{bmatrix} 1 & 1 & 1 \\ -1 & -2 & -3 \\ 1 & 4 & 9 \end{bmatrix} P=(α1,α2,α3)= 1−111−241−39
D = P − 1 A P = [ − 1 0 0 0 − 2 0 0 0 − 3 ] D=P^{-1}AP= \begin{bmatrix} -1 & 0 & 0 \\ 0 & -2 & 0 \\ 0 & 0 & -3 \end{bmatrix} D=P−1AP= −1000−2000−3由于 d d t x = A x \frac{\mathrm d }{\mathrm dt}x=Ax dtdx=Ax,令 x = P y x=Py x=Py,有
d y d t = P − 1 d x d t = P − 1 A x = P − 1 A P y = D y = [ − y 1 − 2 y 2 − 3 y 3 ] \frac{\mathrm d y}{\mathrm dt}=P^{-1} \frac{\mathrm d x}{\mathrm dt}=P^{-1}Ax=P^{-1}APy=Dy= \begin{bmatrix} -y_1\\-2y_2\\-3y_3 \end{bmatrix} dtdy=P−1dtdx=P−1Ax=P−1APy=Dy= −y1−2y2−3y3
y 1 ′ ( t ) = − y 1 , y 2 ′ ( t ) = − 2 y 2 , y 3 ′ ( t ) = − 3 y 3 y_1'(t)=-y_1 \,\,,\,\, y_2'(t)=-2y_2 \,\,,\,\, y_3'(t)=-3y_3 y1′(t)=−y1,y2′(t)=−2y2,y3′(t)=−3y3
y 1 ( t ) = c 1 e − t , y 2 ( t ) = c 2 e − 2 t , y 3 ( t ) = c 3 e − 3 t y_1(t)=c_1e^{-t} \,\,,\,\, y_2(t)=c_2e^{-2t} \,\,,\,\, y_3(t)=c_3e^{-3t} y1(t)=c1e−t,y2(t)=c2e−2t,y3(t)=c3e−3t
x = P y = [ c 1 e − t + c 2 e − 2 t + c 3 e − 3 t − c 1 e − t − 2 c 2 e − 2 t − 3 c 3 e − 3 t c 1 e − t + 4 c 2 e − 2 t + 9 c 3 e − 3 t ] x=Py= \begin{bmatrix} c_1e^{-t}+c_2e^{-2t}+ c_3e^{-3t}\\ -c_1e^{-t}-2c_2e^{-2t}-3c_3e^{-3t}\\ c_1e^{-t}+4c_2e^{-2t}+9 c_3e^{-3t} \end{bmatrix} x=Py= c1e−t+c2e−2t+c3e−3t−c1e−t−2c2e−2t−3c3e−3tc1e−t+4c2e−2t+9c3e−3t