控制理论前置知识——相平面数学基础1(理论部分)

相平面数学基础常识

第一部分：什么是特征值和特征向量？

想象一下，我们有一个矩阵 A A A，它可以看作是一个线性变换。比如，把它应用到一个向量上，这个向量可能会被旋转、拉伸、压缩或者进行这些操作的组合。

在这个变换过程中，绝大多数的向量都会改变方向。但是，存在一些特殊的"非零"向量 ，它们在这个变换下只改变长度（大小），而不改变方向。

特征向量 ：就是这些特殊的、在变换 A A A下方向不变的向量。它就像一个"主轴"或"不变的方向"。
特征值 ：就是这个特征向量被拉伸或压缩的倍数。它描述了变换 A A A在这个特定方向上的"作用强度"。

数学定义：

对于方阵 A A A，如果存在一个非零向量 v ⃗ \vec{v} v 和一个标量 λ \lambda λ，使得：
A v ⃗ = λ v ⃗ A\vec{v} = \lambda\vec{v} Av =λv

那么：

λ \lambda λ就是 A A A的特征值 (Eigenvalue)
v ⃗ \vec{v} v 就是对应于 λ \lambda λ的特征向量 (Eigenvector)

直观理解：

你可以把矩阵 A A A想象成一个"黑盒"函数，把向量 v ⃗ \vec{v} v 喂进去，出来的结果 A v ⃗ A\vec{v} Av 和原来的 v ⃗ \vec{v} v 长得一模一样，只是在方向上被拉长或缩短了 λ \lambda λ倍。

第二部分：特征值和特征向量为什么可以将矩阵对角化？

现在我们来解释为什么特征值和特征向量能把矩阵变成对角矩阵。

假设我们有一个 n × n n \times n n×n的矩阵 A A A，并且我们幸运地找到了它的 n n n个线性无关 的特征向量 v ⃗ 1 , v ⃗ 2 , . . . , v ⃗ n \vec{v}_1, \vec{v}_2, ..., \vec{v}_n v 1,v 2,...,v n，它们对应的特征值分别是 λ 1 , λ 2 , . . . , λ n \lambda_1, \lambda_2, ..., \lambda_n λ1,λ2,...,λn。

构造特征向量矩阵 P P P ：把这 n n n个特征向量作为列，拼成一个新的矩阵：
P = [ v ⃗ 1 v ⃗ 2 . . . v ⃗ n ] P = [\vec{v}_1 \ \vec{v}_2 \ ... \ \vec{v}_n] P=[v 1 v 2 ... v n]
计算 A P AP AP ：现在，我们来计算矩阵 A A A乘以 P P P的结果。
A P = A [ v ⃗ 1 v ⃗ 2 . . . v ⃗ n ] AP = A[\vec{v}_1 \ \vec{v}_2 \ ... \ \vec{v}_n] AP=A[v 1 v 2 ... v n]

根据矩阵乘法的规则，这等于：
A P = [ A v ⃗ 1 A v ⃗ 2 . . . A v ⃗ n ] AP = [A\vec{v}_1 \ A\vec{v}_2 \ ... \ A\vec{v}_n] AP=[Av 1 Av 2 ... Av n]

由于 v ⃗ i \vec{v}_i v i是特征向量，我们知道 A v ⃗ i = λ i v ⃗ i A\vec{v}_i = \lambda_i \vec{v}_i Av i=λiv i。所以：
A P = [ λ 1 v ⃗ 1 λ 2 v ⃗ 2 . . . λ n v ⃗ n ] AP = [\lambda_1\vec{v}_1 \ \lambda_2\vec{v}_2 \ ... \ \lambda_n\vec{v}_n] AP=[λ1v 1 λ2v 2 ... λnv n]
引入对角矩阵 Λ \Lambda Λ ：我们注意到，上面的结果可以写成一种新的矩阵乘法形式。如果我们定义对角矩阵 Λ \Lambda Λ，其对角线上的元素就是特征值：
Λ = [ λ 1 0 . . . 0 0 λ 2 . . . 0 ⋮ ⋮ ⋱ ⋮ 0 0 . . . λ n ] \Lambda = \begin{bmatrix} \lambda_1 & 0 & ... & 0 \\ 0 & \lambda_2 & ... & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & ... & \lambda_n \end{bmatrix} Λ= λ10⋮00λ2⋮0......⋱...00⋮λn

那么你会发现：
P Λ = [ v ⃗ 1 v ⃗ 2 . . . v ⃗ n ] [ λ 1 0 . . . 0 0 λ 2 . . . 0 ⋮ ⋮ ⋱ ⋮ 0 0 . . . λ n ] P\Lambda = [\vec{v}_1 \ \vec{v}_2 \ ... \ \vec{v}_n] \begin{bmatrix} \lambda_1 & 0 & ... & 0 \\ 0 & \lambda_2 & ... & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & ... & \lambda_n \end{bmatrix} PΛ=[v 1 v 2 ... v n] λ10⋮00λ2⋮0......⋱...00⋮λn

根据矩阵乘法的规则， P Λ P\Lambda PΛ的第一列就是 λ 1 \lambda_1 λ1乘以 P P P的第一列，即 λ 1 v ⃗ 1 \lambda_1\vec{v}_1 λ1v 1；第二列是 λ 2 v ⃗ 2 \lambda_2\vec{v}_2 λ2v 2，以此类推。这恰好就是 [ λ 1 v ⃗ 1 λ 2 v ⃗ 2 . . . λ n v ⃗ n ] [\lambda_1\vec{v}_1 \ \lambda_2\vec{v}_2 \ ... \ \lambda_n\vec{v}_n] [λ1v 1 λ2v 2 ... λnv n]。
得到核心等式 ：因此，我们得到了一个极其重要的等式：
A P = P Λ AP = P\Lambda AP=PΛ
对角化 ：由于 P P P的列是线性无关的，所以 P P P是可逆矩阵。我们可以在等式两边同时左乘 P − 1 P^{-1} P−1：
P − 1 A P = Λ P^{-1}AP = \Lambda P−1AP=Λ
这就完成了矩阵的对角化！

结论： 当我们用特征向量组成的矩阵 P P P作为基变换矩阵时，原来的矩阵 A A A在新基（即特征向量基）下的表示，就变成了一个非常简单的对角矩阵 Λ \Lambda Λ 。对角线上是特征值，它描述了 A A A在每个独立方向（特征向量方向）上的作用。

第三部分：如何进行解耦合

"解耦合"是工程和物理中一个非常重要的思想。它经常出现在微分方程组中。

耦合的状态：

考虑一个描述两个相互关联的物体（比如用弹簧连接的两个小球）运动的微分方程组：
{ d x 1 d t = a x 1 + b x 2 d x 2 d t = c x 1 + d x 2 \begin{cases} \frac{dx_1}{dt} = a x_1 + b x_2 \\ \frac{dx_2}{dt} = c x_1 + d x_2 \end{cases} {dtdx1=ax1+bx2dtdx2=cx1+dx2

在这个系统中， x 1 x_1 x1的变化率不仅取决于它自己，还取决于 x 2 x_2 x2；同样， x 2 x_2 x2的变化也受 x 1 x_1 x1影响。它们耦合在一起，很难单独求解。用矩阵形式表示就是：
d x ⃗ d t = A x ⃗ , 其中 x ⃗ = [ x 1 x 2 ] , A = [ a b c d ] \frac{d\vec{x}}{dt} = A\vec{x}, \quad 其中 \vec{x} = \begin{bmatrix} x_1 \\ x_2 \end{bmatrix}, A = \begin{bmatrix} a & b \\ c & d \end{bmatrix} dtdx =Ax ,其中x =[x1x2],A=[acbd]

这个矩阵 A A A的非对角线元素（ b , c b, c b,c）就是耦合项。

对角化如何解耦合？

引入新变量 ：我们利用之前找到的特征向量矩阵 P P P，引入一组新的变量 y ⃗ \vec{y} y ，让 x ⃗ = P y ⃗ \vec{x} = P\vec{y} x =Py 。这里的 y ⃗ \vec{y} y 代表的是系统在特征向量方向上的坐标。
代入原方程 ：
d ( P y ⃗ ) d t = A ( P y ⃗ ) \frac{d(P\vec{y})}{dt} = A(P\vec{y}) dtd(Py )=A(Py )

由于 P P P是常数矩阵，可以提到微分算子外面：
P d y ⃗ d t = A P y ⃗ P\frac{d\vec{y}}{dt} = AP\vec{y} Pdtdy =APy
利用对角化结果 ：在等式两边左乘 P − 1 P^{-1} P−1：
d y ⃗ d t = P − 1 A P y ⃗ \frac{d\vec{y}}{dt} = P^{-1}AP\vec{y} dtdy =P−1APy

而 P − 1 A P P^{-1}AP P−1AP正是我们之前得到的对角矩阵 Λ \Lambda Λ！
d y ⃗ d t = Λ y ⃗ \frac{d\vec{y}}{dt} = \Lambda \vec{y} dtdy =Λy
见证奇迹（解耦合） ：让我们把这个方程展开：
$d y 1 d t d y 2 d t \] = \[ λ 1 0 0 λ 2 \] \[ y 1 y 2 \] = \[ λ 1 y 1 λ 2 y 2 \] \\begin{bmatrix} \\frac{dy_1}{dt} \\\\ \\frac{dy_2}{dt} \\end{bmatrix} = \\begin{bmatrix} \\lambda_1 \& 0 \\\\ 0 \& \\lambda_2 \\end{bmatrix} \\begin{bmatrix} y_1 \\\\ y_2 \\end{bmatrix} = \\begin{bmatrix} \\lambda_1 y_1 \\\\ \\lambda_2 y_2 \\end{bmatrix} \[dtdy1dtdy2\]=\[λ100λ2\]\[y1y2\]=\[λ1y1λ2y2$
这等价于：
{ d y 1 d t = λ 1 y 1 d y 2 d t = λ 2 y 2 \begin{cases} \frac{dy_1}{dt} = \lambda_1 y_1 \\ \frac{dy_2}{dt} = \lambda_2 y_2 \end{cases} {dtdy1=λ1y1dtdy2=λ2y2

看！在新的变量 y ⃗ \vec{y} y （也就是特征向量坐标系）下，原来的方程组变成了两个完全独立 、互不影响 的方程。这就是解耦合 ！ y 1 y_1 y1和 y 2 y_2 y2各自按照自己的规律（由对应的特征值 λ \lambda λ决定）演化。

求解与回代 ：这种 d y d t = λ y \frac{dy}{dt} = \lambda y dtdy=λy形式的方程是极易求解的，解就是 y 1 ( t ) = C 1 e λ 1 t y_1(t) = C_1 e^{\lambda_1 t} y1(t)=C1eλ1t, y 2 ( t ) = C 2 e λ 2 t y_2(t) = C_2 e^{\lambda_2 t} y2(t)=C2eλ2t。最后，我们再通过 x ⃗ = P y ⃗ \vec{x} = P\vec{y} x =Py 把解变换回原始的物理变量 x ⃗ \vec{x} x ，就得到了原耦合系统的解。

补充

y ⃗ \vec{y} y 是什么？------ 新坐标系下的坐标

让我们回到数学定义： x ⃗ = P y ⃗ \vec{x} = P \vec{y} x =Py 。

x ⃗ \vec{x} x ：是我们原始的变量向量，比如 [ x 1 x 2 ] \begin{bmatrix} x_1 \\ x_2 \end{bmatrix} [x1x2]。它是在自然基 （比如 ( 1 , 0 ) (1,0) (1,0)和 ( 0 , 1 ) (0,1) (0,1)）下的坐标。
P P P：是特征向量矩阵 ，它的每一列都是一个特征向量，比如 v ⃗ 1 \vec{v}_1 v 1和 v ⃗ 2 \vec{v}_2 v 2。这些特征向量构成了一个新坐标系的基。因为它们是线性无关的，所以可以张成整个空间。
y ⃗ \vec{y} y ：是新坐标系下的坐标向量 ，比如 [ y 1 y 2 ] \begin{bmatrix} y_1 \\ y_2 \end{bmatrix} [y1y2]。

所以， y ⃗ \vec{y} y 的本质就是：用特征向量作为"尺子"去度量 x ⃗ \vec{x} x 得到的读数。

具体来说， x ⃗ = P y ⃗ \vec{x} = P\vec{y} x =Py 可以展开为：
x ⃗ = y 1 v ⃗ 1 + y 2 v ⃗ 2 + ⋯ + y n v ⃗ n \vec{x} = y_1 \vec{v}_1 + y_2 \vec{v}_2 + \dots + y_n \vec{v}_n x =y1v 1+y2v 2+⋯+ynv n

这意味着：原始的向量 x ⃗ \vec{x} x 等于 y 1 y_1 y1份的第一个特征向量，加上 y 2 y_2 y2份的第二个特征向量，以此类推。

y 1 y_1 y1就是 x ⃗ \vec{x} x 在 v ⃗ 1 \vec{v}_1 v 1方向上的"分量大小"。
y 2 y_2 y2就是 x ⃗ \vec{x} x 在 v ⃗ 2 \vec{v}_2 v 2方向上的"分量大小"。

在物理系统中， y i y_i yi通常被称为模态坐标 或简正坐标。它们代表的是系统在各个独立振动模式上的"参与程度"或"振幅"。

为什么这个变换能解耦合？

关键在于特征向量的一个核心性质：当一个线性变换 A A A作用在它的特征向量 v ⃗ i \vec{v}_i v i上时，结果仍然在 v ⃗ i \vec{v}_i v i的方向上，只是被拉长了 λ i \lambda_i λi倍。

换句话说，在由特征向量张成的坐标系里， A A A的作用变得非常简单：它不混合不同的坐标轴 。它只是把 y 1 y_1 y1轴上的分量乘以 λ 1 \lambda_1 λ1，把 y 2 y_2 y2轴上的分量乘以 λ 2 \lambda_2 λ2，等等。

现在，回到我们的微分方程 d x ⃗ d t = A x ⃗ \frac{d\vec{x}}{dt} = A\vec{x} dtdx =Ax 。如果我们想知道每个模态坐标 y i y_i yi是如何随时间变化的，我们可以这样做：

把 x ⃗ \vec{x} x 替换成它在模态坐标下的表示： x ⃗ = P y ⃗ \vec{x} = P\vec{y} x =Py 。
方程变成： d ( P y ⃗ ) d t = A ( P y ⃗ ) \frac{d(P\vec{y})}{dt} = A(P\vec{y}) dtd(Py )=A(Py )。
由于 P P P是常数矩阵，可以提到微分外面： P d y ⃗ d t = A P y ⃗ P\frac{d\vec{y}}{dt} = AP\vec{y} Pdtdy =APy 。
左乘 P − 1 P^{-1} P−1： d y ⃗ d t = P − 1 A P y ⃗ \frac{d\vec{y}}{dt} = P^{-1}AP \vec{y} dtdy =P−1APy 。
根据对角化， P − 1 A P = Λ P^{-1}AP = \Lambda P−1AP=Λ，是一个对角矩阵。

把这个结果写开：

d y 1 d t d y 2 d t \] = \[ λ 1 0 0 λ 2 \] \[ y 1 y 2 \] = \[ λ 1 y 1 λ 2 y 2 \] \\begin{bmatrix} \\frac{dy_1}{dt} \\\\ \\frac{dy_2}{dt} \\end{bmatrix} = \\begin{bmatrix} \\lambda_1 \& 0 \\\\ 0 \& \\lambda_2 \\end{bmatrix} \\begin{bmatrix} y_1 \\\\ y_2 \\end{bmatrix} = \\begin{bmatrix} \\lambda_1 y_1 \\\\ \\lambda_2 y_2 \\end{bmatrix} \[dtdy1dtdy2\]=\[λ100λ2\]\[y1y2\]=\[λ1y1λ2y2

关键点出现了： 第一个方程 d y 1 d t = λ 1 y 1 \frac{dy_1}{dt} = \lambda_1 y_1 dtdy1=λ1y1中，完全没有出现 y 2 y_2 y2！同样，第二个方程中也完全没有出现 y 1 y_1 y1。这意味着，每一个模态坐标 y i y_i yi的演化只取决于它自己，与其他模态坐标完全无关。 这就是解耦合------原本相互纠缠的变量，在新的坐标系下变成了多个独立的单变量系统。

解耦合实际方法

以矩阵 A = ( 1 1 4 − 2 ) A = \begin{pmatrix} 1 & 1 \\ 4 & -2 \end{pmatrix} A=(141−2)为例

求解特征值与特征向量

目标： 找到非零向量 v ⃗ \vec{v} v 和标量 λ \lambda λ，使得 A v ⃗ = λ v ⃗ A\vec{v} = \lambda\vec{v} Av =λv 。

步骤：

解特征方程 det ⁡ ( A − λ I ) = 0 \det(A - \lambda I) = 0 det(A−λI)=0：
A − λ I = ( 1 − λ 1 4 − 2 − λ ) A - \lambda I = \begin{pmatrix} 1-\lambda & 1 \\ 4 & -2-\lambda \end{pmatrix} A−λI=(1−λ41−2−λ)

行列式：
( 1 − λ ) ( − 2 − λ ) − 4 = λ 2 + λ − 6 = 0 (1-\lambda)(-2-\lambda) - 4 = \lambda^2 + \lambda - 6 = 0 (1−λ)(−2−λ)−4=λ2+λ−6=0

解得 λ 1 = 2 \lambda_1 = 2 λ1=2， λ 2 = − 3 \lambda_2 = -3 λ2=−3。
求 λ 1 = 2 \lambda_1 = 2 λ1=2的特征向量：

解 ( A − 2 I ) v ⃗ = 0 (A - 2I)\vec{v} = 0 (A−2I)v =0：
( − 1 1 4 − 4 ) ( x y ) = 0 ⇒ − x + y = 0 ⇒ y = x \begin{pmatrix} -1 & 1 \\ 4 & -4 \end{pmatrix} \begin{pmatrix} x \\ y \end{pmatrix} = 0 \quad \Rightarrow \quad -x + y = 0 \;\Rightarrow\; y = x (−141−4)(xy)=0⇒−x+y=0⇒y=x

取 v ⃗ 1 = ( 1 1 ) \vec{v}_1 = \begin{pmatrix} 1 \\ 1 \end{pmatrix} v 1=(11)（任意非零倍数均可）。
求 λ 2 = − 3 \lambda_2 = -3 λ2=−3的特征向量：

解 ( A + 3 I ) v ⃗ = 0 (A + 3I)\vec{v} = 0 (A+3I)v =0：
( 4 1 4 1 ) ( x y ) = 0 ⇒ 4 x + y = 0 ⇒ y = − 4 x \begin{pmatrix} 4 & 1 \\ 4 & 1 \end{pmatrix} \begin{pmatrix} x \\ y \end{pmatrix} = 0 \quad \Rightarrow \quad 4x + y = 0 \;\Rightarrow\; y = -4x (4411)(xy)=0⇒4x+y=0⇒y=−4x

取 v ⃗ 2 = ( 1 − 4 ) \vec{v}_2 = \begin{pmatrix} 1 \\ -4 \end{pmatrix} v 2=(1−4)。

讲解：

v ⃗ 1 \vec{v}_1 v 1和 v ⃗ 2 \vec{v}_2 v 2是矩阵 A A A的两个不变方向 ：当 A A A作用在 v ⃗ 1 \vec{v}_1 v 1上时，它只是被拉伸了 2 倍；作用在 v ⃗ 2 \vec{v}_2 v 2上时，被压缩并反向（-3 倍）。

它们线性无关，因此可以作为新坐标系的一组基。

构造变换矩阵 P P P并验证对角化

构造特征向量矩阵 P P P ：
P = ( v ⃗ 1 v ⃗ 2 ) = ( 1 1 1 − 4 ) P = \begin{pmatrix} \vec{v}_1 & \vec{v}_2 \end{pmatrix} = \begin{pmatrix} 1 & 1 \\ 1 & -4 \end{pmatrix} P=(v 1v 2)=(111−4)

求逆矩阵 P − 1 P^{-1} P−1 ：
det ⁡ ( P ) = 1 × ( − 4 ) − 1 × 1 = − 5 , P − 1 = 1 − 5 ( − 4 − 1 − 1 1 ) = ( 4 5 1 5 1 5 − 1 5 ) \det(P) = 1 \times (-4) - 1 \times 1 = -5, \quad P^{-1} = \frac{1}{-5} \begin{pmatrix} -4 & -1 \\ -1 & 1 \end{pmatrix} = \begin{pmatrix} \frac{4}{5} & \frac{1}{5} \\ \frac{1}{5} & -\frac{1}{5} \end{pmatrix} det(P)=1×(−4)−1×1=−5,P−1=−51(−4−1−11)=(545151−51)

验证对角化公式 P − 1 A P = Λ P^{-1}AP = \Lambda P−1AP=Λ ：

先计算 A P AP AP：
A P = ( 1 1 4 − 2 ) ( 1 1 1 − 4 ) = ( 2 − 3 2 12 ) AP = \begin{pmatrix} 1 & 1 \\ 4 & -2 \end{pmatrix} \begin{pmatrix} 1 & 1 \\ 1 & -4 \end{pmatrix} = \begin{pmatrix} 2 & -3 \\ 2 & 12 \end{pmatrix} AP=(141−2)(111−4)=(22−312)

再计算 P − 1 ( A P ) P^{-1}(AP) P−1(AP)：
P − 1 ( A P ) = ( 4 5 1 5 1 5 − 1 5 ) ( 2 − 3 2 12 ) = ( 4 5 ⋅ 2 + 1 5 ⋅ 2 4 5 ⋅ ( − 3 ) + 1 5 ⋅ 12 1 5 ⋅ 2 + ( − 1 5 ) ⋅ 2 1 5 ⋅ ( − 3 ) + ( − 1 5 ) ⋅ 12 ) = ( 2 0 0 − 3 ) = Λ P^{-1}(AP) = \begin{pmatrix} \frac{4}{5} & \frac{1}{5} \\ \frac{1}{5} & -\frac{1}{5} \end{pmatrix} \begin{pmatrix} 2 & -3 \\ 2 & 12 \end{pmatrix} = \begin{pmatrix} \frac{4}{5}\cdot2 + \frac{1}{5}\cdot2 & \frac{4}{5}\cdot(-3) + \frac{1}{5}\cdot12 \\[2mm] \frac{1}{5}\cdot2 + (-\frac{1}{5})\cdot2 & \frac{1}{5}\cdot(-3) + (-\frac{1}{5})\cdot12 \end{pmatrix} = \begin{pmatrix} 2 & 0 \\ 0 & -3 \end{pmatrix} = \Lambda P−1(AP)=(545151−51)(22−312)=(54⋅2+51⋅251⋅2+(−51)⋅254⋅(−3)+51⋅1251⋅(−3)+(−51)⋅12)=(200−3)=Λ

其中 Λ = ( 2 0 0 − 3 ) \Lambda = \begin{pmatrix} 2 & 0 \\ 0 & -3 \end{pmatrix} Λ=(200−3)是对角矩阵，对角线元素正是特征值。

讲解：

P P P是从标准基到特征向量基的坐标变换矩阵 。任何向量 x ⃗ \vec{x} x 在特征向量基下的坐标 y ⃗ \vec{y} y 满足 x ⃗ = P y ⃗ \vec{x} = P\vec{y} x =Py 。

对角化公式 P − 1 A P = Λ P^{-1}AP = \Lambda P−1AP=Λ表明：在特征向量基下，矩阵 A A A的作用变得非常简单------它只是将各个坐标分别乘以对应的特征值，而不再混合不同方向。这正是解耦合的数学根源。

应用于微分方程组：解耦合

考虑一个线性微分方程组：
d x ⃗ d t = A x ⃗ , x ⃗ ( t ) = ( x 1 ( t ) x 2 ( t ) ) \frac{d\vec{x}}{dt} = A \vec{x}, \quad \vec{x}(t) = \begin{pmatrix} x_1(t) \\ x_2(t) \end{pmatrix} dtdx =Ax ,x (t)=(x1(t)x2(t))

即：
{ d x 1 d t = x 1 + x 2 d x 2 d t = 4 x 1 − 2 x 2 \begin{cases} \dfrac{dx_1}{dt} = x_1 + x_2 \\[2mm] \dfrac{dx_2}{dt} = 4x_1 - 2x_2 \end{cases} ⎩ ⎨ ⎧dtdx1=x1+x2dtdx2=4x1−2x2

这是一个耦合系统，因为 x 1 x_1 x1的变化依赖于 x 2 x_2 x2，反之亦然。

引入新变量 y ⃗ \vec{y} y ：

令 x ⃗ = P y ⃗ \vec{x} = P \vec{y} x =Py ，即
( x 1 x 2 ) = ( 1 1 1 − 4 ) ( y 1 y 2 ) ⇒ { x 1 = y 1 + y 2 x 2 = y 1 − 4 y 2 \begin{pmatrix} x_1 \\ x_2 \end{pmatrix} = \begin{pmatrix} 1 & 1 \\ 1 & -4 \end{pmatrix} \begin{pmatrix} y_1 \\ y_2 \end{pmatrix} \quad \Rightarrow \quad \begin{cases} x_1 = y_1 + y_2 \\ x_2 = y_1 - 4y_2 \end{cases} (x1x2)=(111−4)(y1y2)⇒{x1=y1+y2x2=y1−4y2

这里 y ⃗ = ( y 1 , y 2 ) T \vec{y} = (y_1, y_2)^T y =(y1,y2)T是 x ⃗ \vec{x} x 在特征向量基下的坐标。直观上， y 1 y_1 y1代表系统在 v ⃗ 1 \vec{v}_1 v 1方向上的"分量"（即第一种振动模式的强度）， y 2 y_2 y2代表在 v ⃗ 2 \vec{v}_2 v 2方向上的分量。

代入原方程 ：
d d t ( P y ⃗ ) = A ( P y ⃗ ) ⇒ P d y ⃗ d t = A P y ⃗ \frac{d}{dt}(P\vec{y}) = A (P\vec{y}) \quad \Rightarrow \quad P \frac{d\vec{y}}{dt} = A P \vec{y} dtd(Py )=A(Py )⇒Pdtdy =APy

左乘 P − 1 P^{-1} P−1：
d y ⃗ d t = ( P − 1 A P ) y ⃗ = Λ y ⃗ \frac{d\vec{y}}{dt} = (P^{-1} A P) \vec{y} = \Lambda \vec{y} dtdy =(P−1AP)y =Λy

即：
( d y 1 d t d y 2 d t ) = ( 2 0 0 − 3 ) ( y 1 y 2 ) \begin{pmatrix} \frac{dy_1}{dt} \\ \frac{dy_2}{dt} \end{pmatrix} = \begin{pmatrix} 2 & 0 \\ 0 & -3 \end{pmatrix} \begin{pmatrix} y_1 \\ y_2 \end{pmatrix} (dtdy1dtdy2)=(200−3)(y1y2)

得到解耦合的方程 ：
{ d y 1 d t = 2 y 1 d y 2 d t = − 3 y 2 \begin{cases} \dfrac{dy_1}{dt} = 2y_1 \\[2mm] \dfrac{dy_2}{dt} = -3y_2 \end{cases} ⎩ ⎨ ⎧dtdy1=2y1dtdy2=−3y2

这两个方程完全独立， y 1 y_1 y1和 y 2 y_2 y2互不影响，因此可以轻松求解：
y 1 ( t ) = C 1 e 2 t , y 2 ( t ) = C 2 e − 3 t y_1(t) = C_1 e^{2t}, \quad y_2(t) = C_2 e^{-3t} y1(t)=C1e2t,y2(t)=C2e−3t

其中 C 1 , C 2 C_1, C_2 C1,C2由初始条件确定。

返回原变量 ：

利用 x ⃗ = P y ⃗ \vec{x} = P\vec{y} x =Py 得到原系统的解：
{ x 1 ( t ) = y 1 + y 2 = C 1 e 2 t + C 2 e − 3 t x 2 ( t ) = y 1 − 4 y 2 = C 1 e 2 t − 4 C 2 e − 3 t \begin{cases} x_1(t) = y_1 + y_2 = C_1 e^{2t} + C_2 e^{-3t} \\ x_2(t) = y_1 - 4y_2 = C_1 e^{2t} - 4C_2 e^{-3t} \end{cases} {x1(t)=y1+y2=C1e2t+C2e−3tx2(t)=y1−4y2=C1e2t−4C2e−3t

文章示例请查看控制理论前置知识------相平面数学基础2(示例部分)