1. 特征向量与特征值
研究对象是一个平面 A A A,向量 X X X通过 A A A变换后仍然平行于 X X X。
这样的向量就叫特征向量。
变换后的向量与原向量的比值就是特征值。
A X / / X A X = λ X AX \mathop{//} X\\ AX= \lambda X AX//XAX=λX
如果矩阵 A A A是奇异矩阵,那么 λ = 0 \lambda=0 λ=0是一个特征值。
1.1 举例子
- 投影矩阵
如果 X X X在投影平面上 P X = X , λ = 1 PX=X,\lambda=1 PX=X,λ=1;
如果 X ⊥ P X\perp P X⊥P,则 P X = 0 = 0 X , λ = 0 PX=0=0X,\lambda=0 PX=0=0X,λ=0 - 二阶矩阵
A = [ 0 1 1 0 ] A=\begin{bmatrix} 0 & 1\\1 & 0 \end{bmatrix} A=[0110]
X 1 = [ 1 1 ] λ 1 = 1 A X = X X_1=\begin{bmatrix} 1\\1 \end{bmatrix} \ \lambda_1=1\\ AX=X X1=[11] λ1=1AX=X
X 2 = [ − 1 1 ] λ 2 = − 1 A X = − X X_2=\begin{bmatrix} -1\\1 \end{bmatrix} \ \lambda_2=-1\\ AX=-X X2=[−11] λ2=−1AX=−X
矩阵的迹
t r a c e = ∑ i = 1 n λ i trace=\sum_{i=1}^{n} \lambda_i trace=i=1∑nλi
矩阵的迹与对角线元素之和相等
t r a c e = ∑ i = 1 n a i i = ∑ i = 1 n λ i trace=\sum_{i=1}^{n}a_{ii}=\sum_{i=1}^{n}\lambda_i trace=i=1∑naii=i=1∑nλi
1.2 求解 A X = λ X AX=\lambda X AX=λX
A X = λ X ( A − λ I ) X = 0 AX=\lambda X\\ (A-\lambda I)X=0 AX=λX(A−λI)X=0
要使 X X X为不为 0 0 0,则矩阵 A − λ I A-\lambda I A−λI为奇异矩阵。
所以
d e t A − λ I = 0 det\ A-\lambda I=0 det A−λI=0
就变成了求解 A − λ I A-\lambda I A−λI的零空间。
举例子
A = [ 3 1 1 3 ] A − λ I = [ 3 − λ 1 1 3 − λ ] ( 3 − λ ) 2 − 1 = 0 λ 1 = 2 λ 2 = 4 A=\begin{bmatrix} 3 & 1\\1 & 3 \end{bmatrix}\\ A-\lambda I= \begin{bmatrix} 3-\lambda & 1\\1 & 3-\lambda \end{bmatrix}\\ (3-\lambda)^2-1=0\\ \lambda_1=2\\\lambda_2=4 A=[3113]A−λI=[3−λ113−λ](3−λ)2−1=0λ1=2λ2=4
6是迹,8是行列式的值。
A − 4 I = [ − 1 1 1 − 1 ] X 1 = [ 1 1 ] A − 2 I = [ 1 1 1 1 ] X 2 = [ 1 − 1 ] A-4I= \begin{bmatrix} -1 & 1\\1 & -1 \end{bmatrix} \ X_1=\begin{bmatrix} 1 \\1 \end{bmatrix}\\ A-2I= \begin{bmatrix} 1 & 1\\1 & 1 \end{bmatrix} \ X_2=\begin{bmatrix} 1 \\-1 \end{bmatrix} A−4I=[−111−1] X1=[11]A−2I=[1111] X2=[1−1]
我们可以看到两个特征向量与我们的上一个例子中特征向量一样,特征值分别加 3 3 3了。
这是因为
A + 3 I = A ′ A X = λ X ( A + 3 I ) X = ( λ + 3 ) X A+3I=A'\\ AX= \lambda X\\ (A+3I)X=(\lambda+3)X A+3I=A′AX=λX(A+3I)X=(λ+3)X
但这对两个其他不同矩阵特征值不能应用。
A X = α X B Y = β Y AX=\alpha X\\BY=\beta Y AX=αXBY=βY
因为不能保证他们的特征向量一致。
举例子,旋转矩阵
r o t a = [ cos θ − sin θ sin θ cos θ ] rota=\begin{bmatrix} \cos \theta & -\sin \theta\\ \sin \theta & \cos \theta \end{bmatrix} rota=[cosθsinθ−sinθcosθ]
取 9 0 ∘ 90^{\circ} 90∘时旋转矩阵
Q = [ 0 − 1 1 0 ] Q= \begin{bmatrix} 0 & -1\\ 1 & 0 \end{bmatrix} Q=[01−10]
Q ′ = Q − λ I = [ − λ − 1 1 − λ ] d e t Q ′ = λ 2 + 1 = 0 λ 1 = i λ 2 = − i Q'=Q-\lambda I= \begin{bmatrix} -\lambda & -1\\ 1 & -\lambda \end{bmatrix}\\ det\ Q'= \lambda^2+1=0\\ \lambda_1= i\\\lambda_2=-i Q′=Q−λI=[−λ1−1−λ]det Q′=λ2+1=0λ1=iλ2=−i
矩阵越对称,越有实数特征值。否则就是复数特征值。
再一个例子
A = [ 3 1 0 3 ] A ′ = A − λ I = [ 3 − λ 1 0 3 − λ ] d e t A ′ = [ 3 − λ 1 0 3 − λ ] = ( λ − 3 ) 2 = 0 λ 1 = λ 2 = 1 X 1 = [ 1 0 ] A=\begin{bmatrix} 3 & 1\\0 & 3 \end{bmatrix}\\ A'=A-\lambda I= \begin{bmatrix} 3-\lambda & 1 \\ 0 & 3-\lambda \end{bmatrix}\\ det\ A'= \begin{bmatrix} 3-\lambda & 1\\ 0 & 3-\lambda \end{bmatrix}= (\lambda-3)^2=0\\ \lambda_1=\lambda_2=1\\ X_1=\begin{bmatrix} 1 \\ 0 \end{bmatrix} A=[3013]A′=A−λI=[3−λ013−λ]det A′=[3−λ013−λ]=(λ−3)2=0λ1=λ2=1X1=[10]
重根造成了特征向量的缺失
2. 旋转矩阵的推导
假设在二维平面上向量 O A → = ( x , y ) \overrightarrow{OA}=(x,y) OA =(x,y),求逆时针旋转 θ \theta θ后的坐标。
假设 O A → \overrightarrow{OA} OA 的平面角为 α \alpha α,则
x 2 + y 2 = r 2 x^{2}+y^{2}=r^2 x2+y2=r2
r cos α = x , r sin α = y r\cos\alpha=x,r\sin\alpha=y rcosα=x,rsinα=y
假设旋转后的角度为 β \beta β,则
α + θ = β cos β = c o s ( α + θ ) = cos θ cos α − sin θ sin α sin β = sin ( α + θ ) = sin θ cos α + cos θ sin α \alpha + \theta= \beta\\ \cos \beta= cos(\alpha+\theta)=\cos \theta \cos \alpha-\sin \theta \sin \alpha\\ \sin \beta=\sin(\alpha+\theta)=\sin \theta \cos \alpha+\cos \theta \sin \alpha α+θ=βcosβ=cos(α+θ)=cosθcosα−sinθsinαsinβ=sin(α+θ)=sinθcosα+cosθsinα
换成矩阵的形式
[ cos β sin β ] = [ cos θ − sin θ sin θ cos θ ] [ cos α sin α ] \begin{bmatrix} \cos \beta\\ \sin \beta\\ \end{bmatrix}= \begin{bmatrix} \cos \theta &-\sin \theta\\ \sin \theta & \cos \theta\\ \end{bmatrix} \begin{bmatrix} \cos \alpha\\ \sin \alpha\\ \end{bmatrix} [cosβsinβ]=[cosθsinθ−sinθcosθ][cosαsinα]
等式两边同乘向量的模长得到旋转后的坐标
[ cos β sin β ] [ r ] = [ r cos β r sin β ] = [ cos θ − sin θ sin θ cos θ ] [ cos α sin α ] [ r ] = [ cos θ − sin θ sin θ cos θ ] [ r cos α r sin α ] \begin{bmatrix} \cos \beta\\ \sin \beta\\ \end{bmatrix} \begin{bmatrix} r \end{bmatrix}=\begin{bmatrix} r\cos \beta\\ r\sin \beta\\ \end{bmatrix}= \begin{bmatrix} \cos \theta &-\sin \theta\\ \sin \theta & \cos \theta\\ \end{bmatrix} \begin{bmatrix} \cos \alpha\\ \sin \alpha\\ \end{bmatrix} \begin{bmatrix} r \end{bmatrix}\\= \begin{bmatrix} \cos \theta &-\sin \theta\\ \sin \theta & \cos \theta\\ \end{bmatrix} \begin{bmatrix} r\cos \alpha\\ r\sin \alpha\\ \end{bmatrix} [cosβsinβ][r]=[rcosβrsinβ]=[cosθsinθ−sinθcosθ][cosαsinα][r]=[cosθsinθ−sinθcosθ][rcosαrsinα]
整理后得到旋转后坐标与旋转前坐标关系
[ x ′ y ′ ] = [ cos θ − sin θ sin θ cos θ ] [ x y ] \begin{bmatrix} x'\\y' \end{bmatrix}= \begin{bmatrix} \cos \theta &-\sin \theta\\ \sin \theta & \cos \theta\\ \end{bmatrix} \begin{bmatrix} x\\ y\\ \end{bmatrix} [x′y′]=[cosθsinθ−sinθcosθ][xy]
所以旋转矩阵为
t r a n s ( θ ) = [ cos θ − sin θ sin θ cos θ ] trans(\theta)=\begin{bmatrix} \cos \theta &-\sin \theta\\ \sin \theta & \cos \theta\\ \end{bmatrix} trans(θ)=[cosθsinθ−sinθcosθ]