相平面数学基础常识
第一部分: 什么是特征值和特征向量?
想象一下,我们有一个矩阵 A A A,它可以看作是一个线性变换。比如,把它应用到一个向量上,这个向量可能会被旋转、拉伸、压缩或者进行这些操作的组合。
在这个变换过程中,绝大多数的向量都会改变方向。但是,存在一些特殊的"非零"向量 ,它们在这个变换下只改变长度(大小),而不改变方向。
- 特征向量 :就是这些特殊的、在变换 A A A下方向不变的向量。它就像一个"主轴"或"不变的方向"。
- 特征值 :就是这个特征向量被拉伸或压缩的倍数 。它描述了变换 A A A在这个特定方向上的"作用强度"。
数学定义:
对于方阵 A A A,如果存在一个非零向量 v ⃗ \vec{v} v 和一个标量 λ \lambda λ,使得:
A v ⃗ = λ v ⃗ A\vec{v} = \lambda\vec{v} Av =λv
那么:
- λ \lambda λ就是 A A A的特征值 (Eigenvalue)
- v ⃗ \vec{v} v 就是对应于 λ \lambda λ的特征向量 (Eigenvector)
直观理解:
你可以把矩阵 A A A想象成一个"黑盒"函数,把向量 v ⃗ \vec{v} v 喂进去,出来的结果 A v ⃗ A\vec{v} Av 和原来的 v ⃗ \vec{v} v 长得一模一样,只是在方向上被拉长或缩短了 λ \lambda λ倍。
第二部分:特征值和特征向量为什么可以将矩阵对角化?
现在我们来解释为什么特征值和特征向量能把矩阵变成对角矩阵。
假设我们有一个 n × n n \times n n×n的矩阵 A A A,并且我们幸运地找到了它的 n n n个线性无关 的特征向量 v ⃗ 1 , v ⃗ 2 , . . . , v ⃗ n \vec{v}_1, \vec{v}_2, ..., \vec{v}_n v 1,v 2,...,v n,它们对应的特征值分别是 λ 1 , λ 2 , . . . , λ n \lambda_1, \lambda_2, ..., \lambda_n λ1,λ2,...,λn。
-
构造特征向量矩阵 P P P :把这 n n n个特征向量作为列,拼成一个新的矩阵:
P = [ v ⃗ 1 v ⃗ 2 . . . v ⃗ n ] P = [\vec{v}_1 \ \vec{v}_2 \ ... \ \vec{v}_n] P=[v 1 v 2 ... v n] -
计算 A P AP AP :现在,我们来计算矩阵 A A A乘以 P P P的结果。
A P = A [ v ⃗ 1 v ⃗ 2 . . . v ⃗ n ] AP = A[\vec{v}_1 \ \vec{v}_2 \ ... \ \vec{v}_n] AP=A[v 1 v 2 ... v n]根据矩阵乘法的规则,这等于:
A P = [ A v ⃗ 1 A v ⃗ 2 . . . A v ⃗ n ] AP = [A\vec{v}_1 \ A\vec{v}_2 \ ... \ A\vec{v}_n] AP=[Av 1 Av 2 ... Av n]由于 v ⃗ i \vec{v}_i v i是特征向量,我们知道 A v ⃗ i = λ i v ⃗ i A\vec{v}_i = \lambda_i \vec{v}_i Av i=λiv i。所以:
A P = [ λ 1 v ⃗ 1 λ 2 v ⃗ 2 . . . λ n v ⃗ n ] AP = [\lambda_1\vec{v}_1 \ \lambda_2\vec{v}_2 \ ... \ \lambda_n\vec{v}_n] AP=[λ1v 1 λ2v 2 ... λnv n] -
引入对角矩阵 Λ \Lambda Λ :我们注意到,上面的结果可以写成一种新的矩阵乘法形式。如果我们定义对角矩阵 Λ \Lambda Λ,其对角线上的元素就是特征值:
Λ = [ λ 1 0 . . . 0 0 λ 2 . . . 0 ⋮ ⋮ ⋱ ⋮ 0 0 . . . λ n ] \Lambda = \begin{bmatrix} \lambda_1 & 0 & ... & 0 \\ 0 & \lambda_2 & ... & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & ... & \lambda_n \end{bmatrix} Λ= λ10⋮00λ2⋮0......⋱...00⋮λn那么你会发现:
P Λ = [ v ⃗ 1 v ⃗ 2 . . . v ⃗ n ] [ λ 1 0 . . . 0 0 λ 2 . . . 0 ⋮ ⋮ ⋱ ⋮ 0 0 . . . λ n ] P\Lambda = [\vec{v}_1 \ \vec{v}_2 \ ... \ \vec{v}_n] \begin{bmatrix} \lambda_1 & 0 & ... & 0 \\ 0 & \lambda_2 & ... & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & ... & \lambda_n \end{bmatrix} PΛ=[v 1 v 2 ... v n] λ10⋮00λ2⋮0......⋱...00⋮λn根据矩阵乘法的规则, P Λ P\Lambda PΛ的第一列就是 λ 1 \lambda_1 λ1乘以 P P P的第一列,即 λ 1 v ⃗ 1 \lambda_1\vec{v}_1 λ1v 1;第二列是 λ 2 v ⃗ 2 \lambda_2\vec{v}_2 λ2v 2,以此类推。这恰好就是 [ λ 1 v ⃗ 1 λ 2 v ⃗ 2 . . . λ n v ⃗ n ] [\lambda_1\vec{v}_1 \ \lambda_2\vec{v}_2 \ ... \ \lambda_n\vec{v}_n] [λ1v 1 λ2v 2 ... λnv n]。
-
得到核心等式 :因此,我们得到了一个极其重要的等式:
A P = P Λ AP = P\Lambda AP=PΛ -
对角化 :由于 P P P的列是线性无关的,所以 P P P是可逆矩阵。我们可以在等式两边同时左乘 P − 1 P^{-1} P−1:
P − 1 A P = Λ P^{-1}AP = \Lambda P−1AP=Λ
这就完成了矩阵的对角化!
结论: 当我们用特征向量组成的矩阵 P P P作为基变换矩阵时,原来的矩阵 A A A在新基(即特征向量基)下的表示,就变成了一个非常简单的对角矩阵 Λ \Lambda Λ 。对角线上是特征值,它描述了 A A A在每个独立方向(特征向量方向)上的作用。
第三部分:如何进行解耦合
"解耦合"是工程和物理中一个非常重要的思想。它经常出现在微分方程组中。
耦合的状态:
考虑一个描述两个相互关联的物体(比如用弹簧连接的两个小球)运动的微分方程组:
{ d x 1 d t = a x 1 + b x 2 d x 2 d t = c x 1 + d x 2 \begin{cases} \frac{dx_1}{dt} = a x_1 + b x_2 \\ \frac{dx_2}{dt} = c x_1 + d x_2 \end{cases} {dtdx1=ax1+bx2dtdx2=cx1+dx2
在这个系统中, x 1 x_1 x1的变化率不仅取决于它自己,还取决于 x 2 x_2 x2;同样, x 2 x_2 x2的变化也受 x 1 x_1 x1影响。它们耦合 在一起,很难单独求解。用矩阵形式表示就是:
d x ⃗ d t = A x ⃗ , 其中 x ⃗ = [ x 1 x 2 ] , A = [ a b c d ] \frac{d\vec{x}}{dt} = A\vec{x}, \quad 其中 \vec{x} = \begin{bmatrix} x_1 \\ x_2 \end{bmatrix}, A = \begin{bmatrix} a & b \\ c & d \end{bmatrix} dtdx =Ax ,其中x =[x1x2],A=[acbd]
这个矩阵 A A A的非对角线元素( b , c b, c b,c)就是耦合项。
对角化如何解耦合?
-
引入新变量 :我们利用之前找到的特征向量矩阵 P P P,引入一组新的变量 y ⃗ \vec{y} y ,让 x ⃗ = P y ⃗ \vec{x} = P\vec{y} x =Py 。这里的 y ⃗ \vec{y} y 代表的是系统在特征向量方向上的坐标。
-
代入原方程 :
d ( P y ⃗ ) d t = A ( P y ⃗ ) \frac{d(P\vec{y})}{dt} = A(P\vec{y}) dtd(Py )=A(Py )由于 P P P是常数矩阵,可以提到微分算子外面:
P d y ⃗ d t = A P y ⃗ P\frac{d\vec{y}}{dt} = AP\vec{y} Pdtdy =APy -
利用对角化结果 :在等式两边左乘 P − 1 P^{-1} P−1:
d y ⃗ d t = P − 1 A P y ⃗ \frac{d\vec{y}}{dt} = P^{-1}AP\vec{y} dtdy =P−1APy而 P − 1 A P P^{-1}AP P−1AP正是我们之前得到的对角矩阵 Λ \Lambda Λ!
d y ⃗ d t = Λ y ⃗ \frac{d\vec{y}}{dt} = \Lambda \vec{y} dtdy =Λy -
见证奇迹(解耦合) :让我们把这个方程展开:
d y 1 d t d y 2 d t \] = \[ λ 1 0 0 λ 2 \] \[ y 1 y 2 \] = \[ λ 1 y 1 λ 2 y 2 \] \\begin{bmatrix} \\frac{dy_1}{dt} \\\\ \\frac{dy_2}{dt} \\end{bmatrix} = \\begin{bmatrix} \\lambda_1 \& 0 \\\\ 0 \& \\lambda_2 \\end{bmatrix} \\begin{bmatrix} y_1 \\\\ y_2 \\end{bmatrix} = \\begin{bmatrix} \\lambda_1 y_1 \\\\ \\lambda_2 y_2 \\end{bmatrix} \[dtdy1dtdy2\]=\[λ100λ2\]\[y1y2\]=\[λ1y1λ2y2
这等价于:
{ d y 1 d t = λ 1 y 1 d y 2 d t = λ 2 y 2 \begin{cases} \frac{dy_1}{dt} = \lambda_1 y_1 \\ \frac{dy_2}{dt} = \lambda_2 y_2 \end{cases} {dtdy1=λ1y1dtdy2=λ2y2
看!在新的变量 y ⃗ \vec{y} y (也就是特征向量坐标系)下,原来的方程组变成了两个完全独立 、互不影响 的方程。这就是解耦合 ! y 1 y_1 y1和 y 2 y_2 y2各自按照自己的规律(由对应的特征值 λ \lambda λ决定)演化。
- 求解与回代 :这种 d y d t = λ y \frac{dy}{dt} = \lambda y dtdy=λy形式的方程是极易求解的,解就是 y 1 ( t ) = C 1 e λ 1 t y_1(t) = C_1 e^{\lambda_1 t} y1(t)=C1eλ1t, y 2 ( t ) = C 2 e λ 2 t y_2(t) = C_2 e^{\lambda_2 t} y2(t)=C2eλ2t。最后,我们再通过 x ⃗ = P y ⃗ \vec{x} = P\vec{y} x =Py 把解变换回原始的物理变量 x ⃗ \vec{x} x ,就得到了原耦合系统的解。
补充
y ⃗ \vec{y} y 是什么?------ 新坐标系下的坐标
让我们回到数学定义: x ⃗ = P y ⃗ \vec{x} = P \vec{y} x =Py 。
- x ⃗ \vec{x} x :是我们原始的变量向量,比如 [ x 1 x 2 ] \begin{bmatrix} x_1 \\ x_2 \end{bmatrix} [x1x2]。它是在自然基 (比如 ( 1 , 0 ) (1,0) (1,0)和 ( 0 , 1 ) (0,1) (0,1))下的坐标。
- P P P:是特征向量矩阵 ,它的每一列都是一个特征向量,比如 v ⃗ 1 \vec{v}_1 v 1和 v ⃗ 2 \vec{v}_2 v 2。这些特征向量构成了一个新坐标系的基。因为它们是线性无关的,所以可以张成整个空间。
- y ⃗ \vec{y} y :是新坐标系下的坐标向量 ,比如 [ y 1 y 2 ] \begin{bmatrix} y_1 \\ y_2 \end{bmatrix} [y1y2]。
所以, y ⃗ \vec{y} y 的本质就是:用特征向量作为"尺子"去度量 x ⃗ \vec{x} x 得到的读数。
具体来说, x ⃗ = P y ⃗ \vec{x} = P\vec{y} x =Py 可以展开为:
x ⃗ = y 1 v ⃗ 1 + y 2 v ⃗ 2 + ⋯ + y n v ⃗ n \vec{x} = y_1 \vec{v}_1 + y_2 \vec{v}_2 + \dots + y_n \vec{v}_n x =y1v 1+y2v 2+⋯+ynv n
这意味着:原始的向量 x ⃗ \vec{x} x 等于 y 1 y_1 y1份的第一个特征向量,加上 y 2 y_2 y2份的第二个特征向量,以此类推。
- y 1 y_1 y1就是 x ⃗ \vec{x} x 在 v ⃗ 1 \vec{v}_1 v 1方向上的"分量大小"。
- y 2 y_2 y2就是 x ⃗ \vec{x} x 在 v ⃗ 2 \vec{v}_2 v 2方向上的"分量大小"。
在物理系统中, y i y_i yi通常被称为模态坐标 或简正坐标。它们代表的是系统在各个独立振动模式上的"参与程度"或"振幅"。
为什么这个变换能解耦合?
关键在于特征向量的一个核心性质:当一个线性变换 A A A作用在它的特征向量 v ⃗ i \vec{v}_i v i上时,结果仍然在 v ⃗ i \vec{v}_i v i的方向上,只是被拉长了 λ i \lambda_i λi倍。
换句话说,在由特征向量张成的坐标系里, A A A的作用变得非常简单:它不混合不同的坐标轴 。它只是把 y 1 y_1 y1轴上的分量乘以 λ 1 \lambda_1 λ1,把 y 2 y_2 y2轴上的分量乘以 λ 2 \lambda_2 λ2,等等。
现在,回到我们的微分方程 d x ⃗ d t = A x ⃗ \frac{d\vec{x}}{dt} = A\vec{x} dtdx =Ax 。如果我们想知道每个模态坐标 y i y_i yi是如何随时间变化的,我们可以这样做:
- 把 x ⃗ \vec{x} x 替换成它在模态坐标下的表示: x ⃗ = P y ⃗ \vec{x} = P\vec{y} x =Py 。
- 方程变成: d ( P y ⃗ ) d t = A ( P y ⃗ ) \frac{d(P\vec{y})}{dt} = A(P\vec{y}) dtd(Py )=A(Py )。
- 由于 P P P是常数矩阵,可以提到微分外面: P d y ⃗ d t = A P y ⃗ P\frac{d\vec{y}}{dt} = AP\vec{y} Pdtdy =APy 。
- 左乘 P − 1 P^{-1} P−1: d y ⃗ d t = P − 1 A P y ⃗ \frac{d\vec{y}}{dt} = P^{-1}AP \vec{y} dtdy =P−1APy 。
- 根据对角化, P − 1 A P = Λ P^{-1}AP = \Lambda P−1AP=Λ,是一个对角矩阵。
把这个结果写开:
d y 1 d t d y 2 d t \] = \[ λ 1 0 0 λ 2 \] \[ y 1 y 2 \] = \[ λ 1 y 1 λ 2 y 2 \] \\begin{bmatrix} \\frac{dy_1}{dt} \\\\ \\frac{dy_2}{dt} \\end{bmatrix} = \\begin{bmatrix} \\lambda_1 \& 0 \\\\ 0 \& \\lambda_2 \\end{bmatrix} \\begin{bmatrix} y_1 \\\\ y_2 \\end{bmatrix} = \\begin{bmatrix} \\lambda_1 y_1 \\\\ \\lambda_2 y_2 \\end{bmatrix} \[dtdy1dtdy2\]=\[λ100λ2\]\[y1y2\]=\[λ1y1λ2y2
关键点出现了: 第一个方程 d y 1 d t = λ 1 y 1 \frac{dy_1}{dt} = \lambda_1 y_1 dtdy1=λ1y1中,完全没有出现 y 2 y_2 y2!同样,第二个方程中也完全没有出现 y 1 y_1 y1。这意味着,每一个模态坐标 y i y_i yi的演化只取决于它自己,与其他模态坐标完全无关。 这就是解耦合------原本相互纠缠的变量,在新的坐标系下变成了多个独立的单变量系统。
解耦合实际方法
以矩阵 A = ( 1 1 4 − 2 ) A = \begin{pmatrix} 1 & 1 \\ 4 & -2 \end{pmatrix} A=(141−2)为例
求解特征值与特征向量
目标: 找到非零向量 v ⃗ \vec{v} v 和标量 λ \lambda λ,使得 A v ⃗ = λ v ⃗ A\vec{v} = \lambda\vec{v} Av =λv 。
步骤:
-
解特征方程 det ( A − λ I ) = 0 \det(A - \lambda I) = 0 det(A−λI)=0:
A − λ I = ( 1 − λ 1 4 − 2 − λ ) A - \lambda I = \begin{pmatrix} 1-\lambda & 1 \\ 4 & -2-\lambda \end{pmatrix} A−λI=(1−λ41−2−λ)行列式:
( 1 − λ ) ( − 2 − λ ) − 4 = λ 2 + λ − 6 = 0 (1-\lambda)(-2-\lambda) - 4 = \lambda^2 + \lambda - 6 = 0 (1−λ)(−2−λ)−4=λ2+λ−6=0解得 λ 1 = 2 \lambda_1 = 2 λ1=2, λ 2 = − 3 \lambda_2 = -3 λ2=−3。
-
求 λ 1 = 2 \lambda_1 = 2 λ1=2的特征向量:
解 ( A − 2 I ) v ⃗ = 0 (A - 2I)\vec{v} = 0 (A−2I)v =0:
( − 1 1 4 − 4 ) ( x y ) = 0 ⇒ − x + y = 0 ⇒ y = x \begin{pmatrix} -1 & 1 \\ 4 & -4 \end{pmatrix} \begin{pmatrix} x \\ y \end{pmatrix} = 0 \quad \Rightarrow \quad -x + y = 0 \;\Rightarrow\; y = x (−141−4)(xy)=0⇒−x+y=0⇒y=x取 v ⃗ 1 = ( 1 1 ) \vec{v}_1 = \begin{pmatrix} 1 \\ 1 \end{pmatrix} v 1=(11)(任意非零倍数均可)。
-
求 λ 2 = − 3 \lambda_2 = -3 λ2=−3的特征向量:
解 ( A + 3 I ) v ⃗ = 0 (A + 3I)\vec{v} = 0 (A+3I)v =0:
( 4 1 4 1 ) ( x y ) = 0 ⇒ 4 x + y = 0 ⇒ y = − 4 x \begin{pmatrix} 4 & 1 \\ 4 & 1 \end{pmatrix} \begin{pmatrix} x \\ y \end{pmatrix} = 0 \quad \Rightarrow \quad 4x + y = 0 \;\Rightarrow\; y = -4x (4411)(xy)=0⇒4x+y=0⇒y=−4x取 v ⃗ 2 = ( 1 − 4 ) \vec{v}_2 = \begin{pmatrix} 1 \\ -4 \end{pmatrix} v 2=(1−4)。
讲解:
- v ⃗ 1 \vec{v}_1 v 1和 v ⃗ 2 \vec{v}_2 v 2是矩阵 A A A的两个不变方向 :当 A A A作用在 v ⃗ 1 \vec{v}_1 v 1上时,它只是被拉伸了 2 倍;作用在 v ⃗ 2 \vec{v}_2 v 2上时,被压缩并反向(-3 倍)。
- 它们线性无关,因此可以作为新坐标系的一组基。
构造变换矩阵 P P P并验证对角化
构造特征向量矩阵 P P P :
P = ( v ⃗ 1 v ⃗ 2 ) = ( 1 1 1 − 4 ) P = \begin{pmatrix} \vec{v}_1 & \vec{v}_2 \end{pmatrix} = \begin{pmatrix} 1 & 1 \\ 1 & -4 \end{pmatrix} P=(v 1v 2)=(111−4)
求逆矩阵 P − 1 P^{-1} P−1 :
det ( P ) = 1 × ( − 4 ) − 1 × 1 = − 5 , P − 1 = 1 − 5 ( − 4 − 1 − 1 1 ) = ( 4 5 1 5 1 5 − 1 5 ) \det(P) = 1 \times (-4) - 1 \times 1 = -5, \quad P^{-1} = \frac{1}{-5} \begin{pmatrix} -4 & -1 \\ -1 & 1 \end{pmatrix} = \begin{pmatrix} \frac{4}{5} & \frac{1}{5} \\ \frac{1}{5} & -\frac{1}{5} \end{pmatrix} det(P)=1×(−4)−1×1=−5,P−1=−51(−4−1−11)=(545151−51)
验证对角化公式 P − 1 A P = Λ P^{-1}AP = \Lambda P−1AP=Λ :
先计算 A P AP AP:
A P = ( 1 1 4 − 2 ) ( 1 1 1 − 4 ) = ( 2 − 3 2 12 ) AP = \begin{pmatrix} 1 & 1 \\ 4 & -2 \end{pmatrix} \begin{pmatrix} 1 & 1 \\ 1 & -4 \end{pmatrix} = \begin{pmatrix} 2 & -3 \\ 2 & 12 \end{pmatrix} AP=(141−2)(111−4)=(22−312)
再计算 P − 1 ( A P ) P^{-1}(AP) P−1(AP):
P − 1 ( A P ) = ( 4 5 1 5 1 5 − 1 5 ) ( 2 − 3 2 12 ) = ( 4 5 ⋅ 2 + 1 5 ⋅ 2 4 5 ⋅ ( − 3 ) + 1 5 ⋅ 12 1 5 ⋅ 2 + ( − 1 5 ) ⋅ 2 1 5 ⋅ ( − 3 ) + ( − 1 5 ) ⋅ 12 ) = ( 2 0 0 − 3 ) = Λ P^{-1}(AP) = \begin{pmatrix} \frac{4}{5} & \frac{1}{5} \\ \frac{1}{5} & -\frac{1}{5} \end{pmatrix} \begin{pmatrix} 2 & -3 \\ 2 & 12 \end{pmatrix} = \begin{pmatrix} \frac{4}{5}\cdot2 + \frac{1}{5}\cdot2 & \frac{4}{5}\cdot(-3) + \frac{1}{5}\cdot12 \\[2mm] \frac{1}{5}\cdot2 + (-\frac{1}{5})\cdot2 & \frac{1}{5}\cdot(-3) + (-\frac{1}{5})\cdot12 \end{pmatrix} = \begin{pmatrix} 2 & 0 \\ 0 & -3 \end{pmatrix} = \Lambda P−1(AP)=(545151−51)(22−312)=(54⋅2+51⋅251⋅2+(−51)⋅254⋅(−3)+51⋅1251⋅(−3)+(−51)⋅12)=(200−3)=Λ
其中 Λ = ( 2 0 0 − 3 ) \Lambda = \begin{pmatrix} 2 & 0 \\ 0 & -3 \end{pmatrix} Λ=(200−3)是对角矩阵,对角线元素正是特征值。
讲解:
- P P P是从标准基到特征向量基的坐标变换矩阵 。任何向量 x ⃗ \vec{x} x 在特征向量基下的坐标 y ⃗ \vec{y} y 满足 x ⃗ = P y ⃗ \vec{x} = P\vec{y} x =Py 。
- 对角化公式 P − 1 A P = Λ P^{-1}AP = \Lambda P−1AP=Λ表明:在特征向量基下,矩阵 A A A的作用变得非常简单------它只是将各个坐标分别乘以对应的特征值,而不再混合不同方向。这正是解耦合的数学根源。
应用于微分方程组:解耦合
考虑一个线性微分方程组:
d x ⃗ d t = A x ⃗ , x ⃗ ( t ) = ( x 1 ( t ) x 2 ( t ) ) \frac{d\vec{x}}{dt} = A \vec{x}, \quad \vec{x}(t) = \begin{pmatrix} x_1(t) \\ x_2(t) \end{pmatrix} dtdx =Ax ,x (t)=(x1(t)x2(t))
即:
{ d x 1 d t = x 1 + x 2 d x 2 d t = 4 x 1 − 2 x 2 \begin{cases} \dfrac{dx_1}{dt} = x_1 + x_2 \\[2mm] \dfrac{dx_2}{dt} = 4x_1 - 2x_2 \end{cases} ⎩ ⎨ ⎧dtdx1=x1+x2dtdx2=4x1−2x2
这是一个耦合系统,因为 x 1 x_1 x1的变化依赖于 x 2 x_2 x2,反之亦然。
引入新变量 y ⃗ \vec{y} y :
令 x ⃗ = P y ⃗ \vec{x} = P \vec{y} x =Py ,即
( x 1 x 2 ) = ( 1 1 1 − 4 ) ( y 1 y 2 ) ⇒ { x 1 = y 1 + y 2 x 2 = y 1 − 4 y 2 \begin{pmatrix} x_1 \\ x_2 \end{pmatrix} = \begin{pmatrix} 1 & 1 \\ 1 & -4 \end{pmatrix} \begin{pmatrix} y_1 \\ y_2 \end{pmatrix} \quad \Rightarrow \quad \begin{cases} x_1 = y_1 + y_2 \\ x_2 = y_1 - 4y_2 \end{cases} (x1x2)=(111−4)(y1y2)⇒{x1=y1+y2x2=y1−4y2
这里 y ⃗ = ( y 1 , y 2 ) T \vec{y} = (y_1, y_2)^T y =(y1,y2)T是 x ⃗ \vec{x} x 在特征向量基下的坐标。直观上, y 1 y_1 y1代表系统在 v ⃗ 1 \vec{v}_1 v 1方向上的"分量"(即第一种振动模式的强度), y 2 y_2 y2代表在 v ⃗ 2 \vec{v}_2 v 2方向上的分量。
代入原方程 :
d d t ( P y ⃗ ) = A ( P y ⃗ ) ⇒ P d y ⃗ d t = A P y ⃗ \frac{d}{dt}(P\vec{y}) = A (P\vec{y}) \quad \Rightarrow \quad P \frac{d\vec{y}}{dt} = A P \vec{y} dtd(Py )=A(Py )⇒Pdtdy =APy
左乘 P − 1 P^{-1} P−1:
d y ⃗ d t = ( P − 1 A P ) y ⃗ = Λ y ⃗ \frac{d\vec{y}}{dt} = (P^{-1} A P) \vec{y} = \Lambda \vec{y} dtdy =(P−1AP)y =Λy
即:
( d y 1 d t d y 2 d t ) = ( 2 0 0 − 3 ) ( y 1 y 2 ) \begin{pmatrix} \frac{dy_1}{dt} \\ \frac{dy_2}{dt} \end{pmatrix} = \begin{pmatrix} 2 & 0 \\ 0 & -3 \end{pmatrix} \begin{pmatrix} y_1 \\ y_2 \end{pmatrix} (dtdy1dtdy2)=(200−3)(y1y2)
得到解耦合的方程 :
{ d y 1 d t = 2 y 1 d y 2 d t = − 3 y 2 \begin{cases} \dfrac{dy_1}{dt} = 2y_1 \\[2mm] \dfrac{dy_2}{dt} = -3y_2 \end{cases} ⎩ ⎨ ⎧dtdy1=2y1dtdy2=−3y2
这两个方程完全独立, y 1 y_1 y1和 y 2 y_2 y2互不影响,因此可以轻松求解:
y 1 ( t ) = C 1 e 2 t , y 2 ( t ) = C 2 e − 3 t y_1(t) = C_1 e^{2t}, \quad y_2(t) = C_2 e^{-3t} y1(t)=C1e2t,y2(t)=C2e−3t
其中 C 1 , C 2 C_1, C_2 C1,C2由初始条件确定。
返回原变量 :
利用 x ⃗ = P y ⃗ \vec{x} = P\vec{y} x =Py 得到原系统的解:
{ x 1 ( t ) = y 1 + y 2 = C 1 e 2 t + C 2 e − 3 t x 2 ( t ) = y 1 − 4 y 2 = C 1 e 2 t − 4 C 2 e − 3 t \begin{cases} x_1(t) = y_1 + y_2 = C_1 e^{2t} + C_2 e^{-3t} \\ x_2(t) = y_1 - 4y_2 = C_1 e^{2t} - 4C_2 e^{-3t} \end{cases} {x1(t)=y1+y2=C1e2t+C2e−3tx2(t)=y1−4y2=C1e2t−4C2e−3t
文章示例请查看控制理论前置知识------相平面数学基础2(示例部分)