工程数学速记手册（下）

第六部分：概率与统计

概率基础

概率空间与事件

概率空间 是概率论中的基本概念，用于描述随机试验的所有可能结果及其概率。一个概率空间可以表示为三元组 ( Ω , F , P ) (\Omega, \mathcal{F}, P) (Ω,F,P)，其中：

Ω \Omega Ω 是样本空间，表示所有可能的实验结果。
F \mathcal{F} F 是事件的集合，满足σ-代数的性质，即包含空集、对补集运算封闭、对可数并运算封闭。
P P P 是概率测度，将事件集合映射到 [ 0 , 1 ] [0,1] [0,1] 之间的数，满足概率公理。

事件是样本空间 Ω \Omega Ω 的子集，表示随机试验可能出现的结果组合。事件可以是简单事件（单个结果），也可以是复合事件（多个结果的集合）。事件运算包括并、交、补等，满足德摩根定律。

概率公理

概率公理是建立概率理论的基础，通常包括以下三个基本公理：

非负性公理 ：

对于任意事件 A A A，有：
P ( A ) ≥ 0 P(A) \geq 0 P(A)≥0
规范化公理 ：

整个样本空间的概率为 1，即：
P ( Ω ) = 1 P(\Omega) = 1 P(Ω)=1
可列可加公理 ：

对于一列两两互斥的事件 A 1 , A 2 , ... A_1, A_2, \ldots A1,A2,...，有：
P ( ⋃ i = 1 ∞ A i ) = ∑ i = 1 ∞ P ( A i ) P\left(\bigcup_{i=1}^{\infty} A_i\right) = \sum_{i=1}^{\infty} P(A_i) P(i=1⋃∞Ai)=i=1∑∞P(Ai)

推论：

P ( ∅ ) = 0 P(\emptyset) = 0 P(∅)=0
P ( A c ) = 1 − P ( A ) P(A^c) = 1 - P(A) P(Ac)=1−P(A)
若 A ⊆ B A \subseteq B A⊆B，则 P ( A ) ≤ P ( B ) P(A) \leq P(B) P(A)≤P(B)
P ( A ∪ B ) = P ( A ) + P ( B ) − P ( A ∩ B ) P(A \cup B) = P(A) + P(B) - P(A \cap B) P(A∪B)=P(A)+P(B)−P(A∩B)
容斥原理：对于任意n个事件，有：
P ( ⋃ i = 1 n A i ) = ∑ i = 1 n P ( A i ) − ∑ 1 ≤ i < j ≤ n P ( A i ∩ A j ) + ⋯ + ( − 1 ) n + 1 P ( ⋂ i = 1 n A i ) P\left(\bigcup_{i=1}^{n} A_i\right) = \sum_{i=1}^{n} P(A_i) - \sum_{1\leq i<j\leq n} P(A_i \cap A_j) + \cdots + (-1)^{n+1} P\left(\bigcap_{i=1}^{n} A_i\right) P(i=1⋃nAi)=i=1∑nP(Ai)−1≤i<j≤n∑P(Ai∩Aj)+⋯+(−1)n+1P(i=1⋂nAi)

随机变量

随机变量 是将样本空间 Ω \Omega Ω 映射到实数集的函数，用于量化随机试验的结果。根据随机变量取值的性质，随机变量可分为：

离散随机变量

如果随机变量 X X X 只能取有限或可数无限多个离散值，则称为离散随机变量。其概率质量函数（PMF）定义为：
P ( X = x i ) = p i P(X = x_i) = p_i P(X=xi)=pi

其中， x i x_i xi 是 X X X 的可能取值， p i p_i pi 满足 p i ≥ 0 p_i \geq 0 pi≥0 且 ∑ p i = 1 \sum p_i = 1 ∑pi=1。

常见分布：

伯努利分布 ：
P ( X = 1 ) = p , P ( X = 0 ) = 1 − p P(X = 1) = p, \quad P(X = 0) = 1 - p P(X=1)=p,P(X=0)=1−p
二项分布 （ n n n 次独立试验的成功次数）：
P ( X = k ) = ( n k ) p k ( 1 − p ) n − k , k = 0 , 1 , ... , n P(X = k) = \binom{n}{k} p^k (1 - p)^{n - k}, \quad k = 0,1,\ldots,n P(X=k)=(kn)pk(1−p)n−k,k=0,1,...,n
泊松分布 （单位时间内事件发生的次数）：
P ( X = k ) = λ k e − λ k ! , k = 0 , 1 , 2 , ... P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}, \quad k = 0,1,2,\ldots P(X=k)=k!λke−λ,k=0,1,2,...
几何分布 （首次成功所需的试验次数）：
P ( X = k ) = ( 1 − p ) k − 1 p , k = 1 , 2 , 3 , ... P(X = k) = (1 - p)^{k-1} p, \quad k = 1,2,3,\ldots P(X=k)=(1−p)k−1p,k=1,2,3,...

连续随机变量

如果随机变量 X X X 的取值为连续区间内的任意实数，则称为连续随机变量。其概率密度函数（PDF）定义为：
f X ( x ) = d d x P ( X ≤ x ) f_X(x) = \frac{d}{dx} P(X \leq x) fX(x)=dxdP(X≤x)

满足：
∫ − ∞ ∞ f X ( x ) d x = 1 \int_{-\infty}^{\infty} f_X(x) dx = 1 ∫−∞∞fX(x)dx=1

常见分布：

正态分布 ：
f X ( x ) = 1 2 π σ e − ( x − μ ) 2 2 σ 2 , x ∈ R f_X(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{ -\frac{(x - \mu)^2}{2\sigma^2} }, \quad x \in \mathbb{R} fX(x)=2π σ1e−2σ2(x−μ)2,x∈R

其中， μ \mu μ 为均值， σ \sigma σ 为标准差。
指数分布 ：
f X ( x ) = λ e − λ x , x ≥ 0 f_X(x) = \lambda e^{ -\lambda x }, \quad x \geq 0 fX(x)=λe−λx,x≥0

其中， λ > 0 \lambda > 0 λ>0 是参数。
均匀分布 ：
f X ( x ) = { 1 b − a a ≤ x ≤ b 0 其他 f_X(x) = \begin{cases} \frac{1}{b-a} & a \leq x \leq b \\ 0 & \text{其他} \end{cases} fX(x)={b−a10a≤x≤b其他
伽马分布 ：
f X ( x ) = β α Γ ( α ) x α − 1 e − β x , x > 0 f_X(x) = \frac{\beta^\alpha}{\Gamma(\alpha)} x^{\alpha-1} e^{-\beta x}, \quad x > 0 fX(x)=Γ(α)βαxα−1e−βx,x>0

其中， α > 0 \alpha > 0 α>0 为形状参数， β > 0 \beta > 0 β>0 为尺度参数。

统计分析

统计分析主要分为描述统计 和推断统计两大类，用于数据的整理与分析、参数估计与假设检验等。

描述统计

描述统计用于对收集到的数据进行总结和描述，主要通过计算各种统计量来体现数据的特征。

期望与方差

期望（均值） ：

表示随机变量取值的平均水平。对于离散随机变量 X X X，期望为：
E ( X ) = ∑ i x i P ( X = x i ) E(X) = \sum_{i} x_i P(X = x_i) E(X)=i∑xiP(X=xi)

对于连续随机变量 X X X，期望为：
E ( X ) = ∫ − ∞ ∞ x f X ( x ) d x E(X) = \int_{-\infty}^{\infty} x f_X(x) dx E(X)=∫−∞∞xfX(x)dx
方差：

描述随机变量围绕期望的离散程度。定义为：
Var ( X ) = E [ ( X − E ( X ) ) 2 ] = E ( X 2 ) − [ E ( X ) ] 2 \text{Var}(X) = E[(X - E(X))^2] = E(X^2) - [E(X)]^2 Var(X)=E[(X−E(X))2]=E(X2)−[E(X)]2

性质：

Var ( a X + b ) = a 2 Var ( X ) \text{Var}(aX + b) = a^2\text{Var}(X) Var(aX+b)=a2Var(X)
若 X X X 和 Y Y Y 独立，则 Var ( X + Y ) = Var ( X ) + Var ( Y ) \text{Var}(X + Y) = \text{Var}(X) + \text{Var}(Y) Var(X+Y)=Var(X)+Var(Y)
切比雪夫不等式：对于任意 k > 0 k > 0 k>0，
P ( ∣ X − μ ∣ ≥ k σ ) ≤ 1 k 2 P(|X - \mu| \geq k\sigma) \leq \frac{1}{k^2} P(∣X−μ∣≥kσ)≤k21

常用统计量

中位数：将数据分为上下两部分的数值。
众数：数据中出现次数最多的值。
标准差：方差的平方根，表示数据的离散程度。
偏度：描述数据分布的不对称性。
峰度：描述数据分布的尖峭程度。
分位数：将数据按比例划分的数值点，如四分位数、百分位数等。

推断统计

推断统计通过样本数据对总体参数进行估计和假设检验，主要包括参数估计和假设检验两部分。

参数估计

估计总体参数的常用方法包括点估计和区间估计。

点估计 ：用样本统计量直接估计总体参数。例如，样本均值 x ˉ = 1 n ∑ i = 1 n x i \bar{x} = \frac{1}{n}\sum_{i=1}^{n} x_i xˉ=n1∑i=1nxi 是总体均值 μ \mu μ 的点估计。
区间估计 ：在一定置信度下，建立参数的估计区间。例如，95%置信区间为：
x ˉ ± z α 2 σ n \bar{x} \pm z_{\frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}} xˉ±z2αn σ

其中， z α 2 z_{\frac{\alpha}{2}} z2α 是标准正态分布的临界值， σ \sigma σ 是总体标准差， n n n 是样本容量。

估计量的评价标准：

无偏性： E ( θ ^ ) = θ E(\hat{\theta}) = \theta E(θ^)=θ
有效性：方差最小
一致性：当 n → ∞ n \to \infty n→∞ 时， θ ^ → θ \hat{\theta} \to \theta θ^→θ
充分性：估计量包含样本中关于参数的所有信息

假设检验

假设检验用于根据样本数据对关于总体参数的假设进行判定。

基本步骤：

提出假设 ：包括原假设 H 0 H_0 H0 和备择假设 H 1 H_1 H1。
选择显著性水平 ：通常选用 α = 0.05 \alpha = 0.05 α=0.05。
计算检验统计量 ：根据样本数据计算统计量，例如 t t t 统计量。
做出决策：比较统计量与临界值，决定是否拒绝原假设。

实例：

假设要检验某工厂生产的零件直径是否符合设计要求（ μ = 10 \mu = 10 μ=10 mm），采样 n = 30 n = 30 n=30 个零件，计算样本均值 x ˉ = 10.2 \bar{x} = 10.2 xˉ=10.2 mm，样本标准差 s = 0.3 s = 0.3 s=0.3 mm，显著性水平 α = 0.05 \alpha = 0.05 α=0.05。

原假设 H 0 : μ = 10 H_0: \mu = 10 H0:μ=10，备择假设 H 1 : μ ≠ 10 H_1: \mu \neq 10 H1:μ=10。
计算 t t t 统计量：
t = x ˉ − μ s / n = 10.2 − 10 0.3 / 30 ≈ 3.65 t = \frac{\bar{x} - \mu}{s / \sqrt{n}} = \frac{10.2 - 10}{0.3 / \sqrt{30}} \approx 3.65 t=s/n xˉ−μ=0.3/30 10.2−10≈3.65
查找临界值 t α / 2 = 2.045 t_{\alpha/2} = 2.045 tα/2=2.045（自由度为29）。
由于 ∣ t ∣ = 3.65 > 2.045 |t| = 3.65 > 2.045 ∣t∣=3.65>2.045，拒绝原假设，认为生产过程中存在偏差。

注意事项：

第一类错误：拒绝正确的原假设
第二类错误：接受错误的原假设
检验功效：1 - 第二类错误概率

第七部分：傅里叶分析

傅里叶级数

级数展开

周期函数的傅里叶展开

傅里叶级数是法国数学家傅里叶提出的重要数学工具，它将周期函数表示为正弦和余弦函数的无穷级数之和。设 f ( x ) f(x) f(x) 是一个周期为 2 π 2\pi 2π 的函数，其傅里叶级数展开式为：
f ( x ) = a 0 2 + ∑ n = 1 ∞ ( a n cos ⁡ ( n x ) + b n sin ⁡ ( n x ) ) f(x) = \frac{a_0}{2} + \sum_{n=1}^{\infty} \left( a_n \cos(nx) + b_n \sin(nx) \right) f(x)=2a0+n=1∑∞(ancos(nx)+bnsin(nx))

其中， a 0 a_0 a0 表示直流分量， a n a_n an 和 b n b_n bn 分别表示各次谐波的余弦和正弦分量幅度。

对于一般周期 T T T 的函数，傅里叶级数可表示为：
f ( x ) = a 0 2 + ∑ n = 1 ∞ ( a n cos ⁡ ( 2 n π x T ) + b n sin ⁡ ( 2 n π x T ) ) f(x) = \frac{a_0}{2} + \sum_{n=1}^{\infty} \left( a_n \cos(\frac{2n\pi x}{T}) + b_n \sin(\frac{2n\pi x}{T}) \right) f(x)=2a0+n=1∑∞(ancos(T2nπx)+bnsin(T2nπx))

傅里叶级数的存在条件

傅里叶级数的收敛性由戴利克雷条件保证，要求函数 f ( x ) f(x) f(x) 满足：

在一个周期内有有限个极值
在一个周期内有有限个第一类间断点
在一个周期内绝对可积

当这些条件满足时，傅里叶级数在连续点收敛于函数值，在间断点收敛于左右极限的平均值。

傅里叶系数计算

正交性与系数求解

傅里叶系数的计算基于三角函数系的正交性。对于周期为 2 π 2\pi 2π 的函数 f ( x ) f(x) f(x)，其傅里叶系数计算公式为：
a n = 1 π ∫ − π π f ( x ) cos ⁡ ( n x ) d x ( n = 0 , 1 , 2 , ⋯ ) a_n = \frac{1}{\pi} \int_{-\pi}^{\pi} f(x) \cos(nx) dx \quad (n = 0,1,2,\cdots) an=π1∫−ππf(x)cos(nx)dx(n=0,1,2,⋯)
b n = 1 π ∫ − π π f ( x ) sin ⁡ ( n x ) d x ( n = 1 , 2 , 3 , ⋯ ) b_n = \frac{1}{\pi} \int_{-\pi}^{\pi} f(x) \sin(nx) dx \quad (n = 1,2,3,\cdots) bn=π1∫−ππf(x)sin(nx)dx(n=1,2,3,⋯)

对于奇函数和偶函数，傅里叶级数可以简化：

奇函数： a n = 0 a_n = 0 an=0，只有正弦项
偶函数： b n = 0 b_n = 0 bn=0，只有余弦项

正交性原理

三角函数系的正交性体现在：
∫ − π π cos ⁡ ( n x ) cos ⁡ ( m x ) d x = { 0 n ≠ m π n = m ≠ 0 2 π n = m = 0 \int_{-\pi}^{\pi} \cos(nx) \cos(mx) dx = \begin{cases} 0 & n \neq m \\ \pi & n = m \neq 0 \\ 2\pi & n = m = 0 \end{cases} ∫−ππcos(nx)cos(mx)dx=⎩ ⎨ ⎧0π2πn=mn=m=0n=m=0
∫ − π π sin ⁡ ( n x ) sin ⁡ ( m x ) d x = { 0 n ≠ m π n = m \int_{-\pi}^{\pi} \sin(nx) \sin(mx) dx = \begin{cases} 0 & n \neq m \\ \pi & n = m \end{cases} ∫−ππsin(nx)sin(mx)dx={0πn=mn=m
∫ − π π sin ⁡ ( n x ) cos ⁡ ( m x ) d x = 0 ∀ n , m \int_{-\pi}^{\pi} \sin(nx) \cos(mx) dx = 0 \quad \forall n, m ∫−ππsin(nx)cos(mx)dx=0∀n,m

这种正交性保证了傅里叶系数的唯一性，并简化了计算过程。

傅里叶变换

连续傅里叶变换

傅里叶变换将时域信号转换为频域表示，定义为：
F ( ω ) = ∫ − ∞ ∞ f ( t ) e − i ω t d t F(\omega) = \int_{-\infty}^{\infty} f(t) e^{-i\omega t} dt F(ω)=∫−∞∞f(t)e−iωtdt

其逆变换为：
f ( t ) = 1 2 π ∫ − ∞ ∞ F ( ω ) e i ω t d ω f(t) = \frac{1}{2\pi} \int_{-\infty}^{\infty} F(\omega) e^{i\omega t} d\omega f(t)=2π1∫−∞∞F(ω)eiωtdω

基本性质

线性性 ： F [ a f ( t ) + b g ( t ) ] = a F ( ω ) + b G ( ω ) \mathcal{F}[af(t)+bg(t)] = aF(\omega)+bG(\omega) F[af(t)+bg(t)]=aF(ω)+bG(ω)
时移性 ： F [ f ( t − t 0 ) ] = F ( ω ) e − i ω t 0 \mathcal{F}[f(t-t_0)] = F(\omega)e^{-i\omega t_0} F[f(t−t0)]=F(ω)e−iωt0
频移性 ： F [ f ( t ) e i ω 0 t ] = F ( ω − ω 0 ) \mathcal{F}[f(t)e^{i\omega_0 t}] = F(\omega-\omega_0) F[f(t)eiω0t]=F(ω−ω0)
尺度变换 ： F [ f ( a t ) ] = 1 ∣ a ∣ F ( ω a ) \mathcal{F}[f(at)] = \frac{1}{|a|}F(\frac{\omega}{a}) F[f(at)]=∣a∣1F(aω)
卷积定理：时域卷积对应频域乘积
Parseval定理：时域和频域能量守恒

应用

信号处理

傅里叶变换在信号处理中用于：

频谱分析：识别信号中的频率成分
滤波器设计：实现低通、高通、带通等滤波器
信号去噪：分离有用信号和噪声
调制解调：在通信系统中实现信号的调制与解调
图像处理：在频域进行图像增强和压缩

系统分析

在系统分析中，傅里叶变换用于：

研究LTI系统的频率响应
分析系统的稳定性和性能
设计控制系统
系统辨识：通过频域分析确定系统模型
故障诊断：通过频谱特征识别系统故障

实例应用

实例 1：信号的频谱分析

考虑信号 f ( t ) = 2 cos ⁡ ( 5 t ) + 3 sin ⁡ ( 2 t ) f(t) = 2\cos(5t) + 3\sin(2t) f(t)=2cos(5t)+3sin(2t)，其傅里叶变换为：
F ( ω ) = 2 π [ δ ( ω − 5 ) + δ ( ω + 5 ) ] + 3 π i [ δ ( ω − 2 ) − δ ( ω + 2 ) ] F(\omega) = 2\pi[\delta(\omega-5)+\delta(\omega+5)] + \frac{3\pi}{i}[\delta(\omega-2)-\delta(\omega+2)] F(ω)=2π[δ(ω−5)+δ(ω+5)]+i3π[δ(ω−2)−δ(ω+2)]

通过傅里叶变换，可以清晰地识别出信号中包含的5 rad/s和2 rad/s两个频率成分。

实例 2：系统的频率响应

对于RC低通滤波器，其传递函数为：
H ( ω ) = 1 1 + i ω R C H(\omega) = \frac{1}{1+i\omega RC} H(ω)=1+iωRC1

通过傅里叶变换，可以分析系统对不同频率信号的衰减特性，确定截止频率为 ω c = 1 R C \omega_c = \frac{1}{RC} ωc=RC1，为滤波器设计提供理论依据。

实例 3：图像压缩

在JPEG图像压缩中，首先对图像进行分块，然后对每个8×8的块进行离散余弦变换（DCT），将图像从空间域转换到频域。通过量化高频分量，保留主要低频信息，从而实现图像压缩。

实例 4：通信系统

在正交频分复用（OFDM）系统中，利用快速傅里叶变换（FFT）将高速数据流分解为多个低速子载波，提高了频谱利用率和抗干扰能力，广泛应用于4G/5G移动通信系统。

第八部分：矩阵理论

矩阵理论是工程数学的核心内容之一，为线性代数、优化理论等提供了重要的数学工具。本节将深入探讨矩阵分解、线性变换和最优化问题等关键内容，从基本概念到实际应用，由浅入深地展开讨论。

矩阵分解

矩阵分解是将复杂矩阵分解为若干更简单矩阵乘积的过程，这种分解不仅便于计算和分析，还能揭示矩阵的内在结构特征。常见的矩阵分解方法包括LU分解、QR分解和奇异值分解（SVD），每种方法都有其特定的应用场景和优势。

LU分解

LU分解是求解线性方程组的基础方法，它将一个方阵 A A A分解为一个下三角矩阵 L L L和一个上三角矩阵 U U U的乘积：
A = L U A = LU A=LU

其中， L L L为单位下三角矩阵（主对角线元素为1）， U U U为上三角矩阵。LU分解在求解线性方程组、计算行列式和逆矩阵等方面有广泛应用。

计算方法

LU分解通常通过高斯消元法实现，具体步骤如下：

对矩阵 A A A进行高斯消元，得到上三角矩阵 U U U
在消元过程中记录下每一步的系数，构造出下三角矩阵 L L L
若出现主元为零的情况，需要进行行交换（引入置换矩阵 P P P，即PLU分解）

实例

考虑矩阵

A = ( 2 3 1 4 7 7 6 18 22 ) A = \begin{pmatrix} 2 & 3 & 1 \\ 4 & 7 & 7 \\ 6 & 18 & 22 \end{pmatrix} A= 24637181722

通过LU分解，可以得到

L = ( 1 0 0 2 1 0 3 3 1 ) , U = ( 2 3 1 0 1 5 0 0 2 ) L = \begin{pmatrix} 1 & 0 & 0 \\ 2 & 1 & 0 \\ 3 & 3 & 1 \end{pmatrix}, \quad U = \begin{pmatrix} 2 & 3 & 1 \\ 0 & 1 & 5 \\ 0 & 0 & 2 \end{pmatrix} L= 123013001 ,U= 200310152

验证：

L U = ( 1 0 0 2 1 0 3 3 1 ) ( 2 3 1 0 1 5 0 0 2 ) = ( 2 3 1 4 7 7 6 18 22 ) = A LU = \begin{pmatrix} 1 & 0 & 0 \\ 2 & 1 & 0 \\ 3 & 3 & 1 \end{pmatrix} \begin{pmatrix} 2 & 3 & 1 \\ 0 & 1 & 5 \\ 0 & 0 & 2 \end{pmatrix} = \begin{pmatrix} 2 & 3 & 1 \\ 4 & 7 & 7 \\ 6 & 18 & 22 \end{pmatrix} = A LU= 123013001 200310152 = 24637181722 =A

QR分解

QR分解是解决最小二乘问题和计算特征值的重要工具，它将一个矩阵 A A A分解为一个正交矩阵 Q Q Q和一个上三角矩阵 R R R的乘积：
A = Q R A = QR A=QR

其中， Q Q Q满足 Q T Q = I Q^T Q = I QTQ=I， R R R为上三角矩阵。QR分解在数值线性代数中具有重要地位。

计算方法

QR分解的实现方法主要有：

格拉姆-施密特正交化：逐步构造正交基
豪斯霍尔德变换：通过反射变换实现正交化
吉文斯旋转：通过平面旋转实现正交化

实例

对于矩阵

A = ( 1 1 1 − 1 1 1 ) A = \begin{pmatrix} 1 & 1 \\ 1 & -1 \\ 1 & 1 \end{pmatrix} A= 1111−11

其QR分解为

Q = ( 1 3 1 2 1 3 − 1 2 1 3 0 ) , R = ( 3 1 2 0 2 ) Q = \begin{pmatrix} \frac{1}{\sqrt{3}} & \frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{3}} & -\frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{3}} & 0 \end{pmatrix}, \quad R = \begin{pmatrix} \sqrt{3} & \frac{1}{\sqrt{2}} \\ 0 & \sqrt{2} \end{pmatrix} Q= 3 13 13 12 1−2 10 ,R=(3 02 12 )

验证：

Q R = ( 1 3 1 2 1 3 − 1 2 1 3 0 ) ( 3 1 2 0 2 ) = ( 1 1 1 − 1 1 1 ) = A QR = \begin{pmatrix} \frac{1}{\sqrt{3}} & \frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{3}} & -\frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{3}} & 0 \end{pmatrix} \begin{pmatrix} \sqrt{3} & \frac{1}{\sqrt{2}} \\ 0 & \sqrt{2} \end{pmatrix}= \begin{pmatrix} 1 & 1 \\ 1 & -1 \\ 1 & 1 \end{pmatrix} = A QR= 3 13 13 12 1−2 10 (3 02 12 )= 1111−11 =A

奇异值分解（SVD）

奇异值分解是矩阵分析中最强大的工具之一，它将任意矩阵 A A A分解为三个矩阵的乘积：
A = U Σ V T A = U \Sigma V^T A=UΣVT

其中， U U U和 V V V是正交矩阵， Σ \Sigma Σ是一个对角矩阵，其对角线上的元素称为奇异值。SVD在数据压缩、噪声过滤、主成分分析等领域有广泛应用。

计算方法

SVD的计算通常通过：

双谱算法：适用于中小规模矩阵
雅可比旋转法：适用于对称矩阵
分治法：适用于大规模矩阵

实例

对于矩阵

A = ( 3 1 1 3 ) A = \begin{pmatrix} 3 & 1 \\ 1 & 3 \end{pmatrix} A=(3113)

其奇异值分解为

U = ( 1 2 − 1 2 1 2 1 2 ) , Σ = ( 4 0 0 2 ) , V T = U T U = \begin{pmatrix} \frac{1}{\sqrt{2}} & -\frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}} \end{pmatrix}, \quad \Sigma = \begin{pmatrix} 4 & 0 \\ 0 & 2 \end{pmatrix}, \quad V^T = U^T U=(2 12 1−2 12 1),Σ=(4002),VT=UT

验证：

U Σ V T = ( 1 2 − 1 2 1 2 1 2 ) ( 4 0 0 2 ) ( 1 2 1 2 − 1 2 1 2 ) = ( 3 1 1 3 ) = A U \Sigma V^T = \begin{pmatrix} \frac{1}{\sqrt{2}} & -\frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}} \end{pmatrix} \begin{pmatrix} 4 & 0 \\ 0 & 2 \end{pmatrix} \begin{pmatrix} \frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}} \\ -\frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}} \end{pmatrix}= \begin{pmatrix} 3 & 1 \\ 1 & 3 \end{pmatrix} = A UΣVT=(2 12 1−2 12 1)(4002)(2 1−2 12 12 1)=(3113)=A

应用

矩阵理论在工程领域中有广泛的应用，主要包括线性变换和最优化问题等。

线性变换

线性变换是保持向量加法和标量乘法的映射，其可以通过矩阵来表示和分析。

矩阵与线性映射

给定一个线性变换 T : R n → R m T: \mathbb{R}^n \to \mathbb{R}^m T:Rn→Rm，存在唯一的矩阵 A ∈ R m × n A \in \mathbb{R}^{m \times n} A∈Rm×n，使得
T ( x ) = A x T(\mathbf{x}) = A\mathbf{x} T(x)=Ax

其中， x ∈ R n \mathbf{x} \in \mathbb{R}^n x∈Rn为输入向量， A x ∈ R m A\mathbf{x} \in \mathbb{R}^m Ax∈Rm为输出向量。

基本性质

保持加法 ： T ( x + y ) = T ( x ) + T ( y ) T(\mathbf{x} + \mathbf{y}) = T(\mathbf{x}) + T(\mathbf{y}) T(x+y)=T(x)+T(y)
保持标量乘法 ： T ( c x ) = c T ( x ) T(c\mathbf{x}) = cT(\mathbf{x}) T(cx)=cT(x)
组合性 ：若 T 1 T_1 T1和 T 2 T_2 T2分别由矩阵 A A A和 B B B表示，则 T 1 ∘ T 2 T_1 \circ T_2 T1∘T2由矩阵 B A BA BA表示
核与像空间 ：核空间 ker ⁡ ( T ) \ker(T) ker(T)和像空间 im ⁡ ( T ) \operatorname{im}(T) im(T)是重要的子空间
秩-零度定理 ： dim ⁡ ( ker ⁡ ( T ) ) + dim ⁡ ( im ⁡ ( T ) ) = n \dim(\ker(T)) + \dim(\operatorname{im}(T)) = n dim(ker(T))+dim(im(T))=n

实例

考虑线性变换 T : R 2 → R 2 T: \mathbb{R}^2 \to \mathbb{R}^2 T:R2→R2，其矩阵表示为
A = ( 2 0 0 3 ) A = \begin{pmatrix} 2 & 0 \\ 0 & 3 \end{pmatrix} A=(2003)

则对于向量 x = ( x y ) \mathbf{x} = \begin{pmatrix} x \\ y \end{pmatrix} x=(xy)，有
T ( x ) = A x = ( 2 x 3 y ) T(\mathbf{x}) = A\mathbf{x} = \begin{pmatrix} 2x \\ 3y \end{pmatrix} T(x)=Ax=(2x3y)

此变换对应于 x x x轴方向的缩放因子为2， y y y轴方向的缩放因子为3。

最优化问题

最优化问题旨在找到一个目标函数的最优值（最小值或最大值），通常在一定约束条件下进行。

二次规划与拉格朗日乘数法

二次规划是一类特殊的最优化问题，其目标函数为二次函数，约束条件为线性不等式或等式。
min ⁡ x 1 2 x T Q x + c T x \min_{\mathbf{x}} \frac{1}{2}\mathbf{x}^T Q \mathbf{x} + \mathbf{c}^T \mathbf{x} xmin21xTQx+cTx

受限于
A x ≤ b A\mathbf{x} \leq \mathbf{b} Ax≤b

其中， Q Q Q是对称正定矩阵，确保目标函数的凸性。

拉格朗日乘数法

拉格朗日乘数法是一种用于求解带等式约束的最优化问题的方法。对于目标函数 f ( x ) f(\mathbf{x}) f(x)，约束条件 g ( x ) = 0 g(\mathbf{x}) = 0 g(x)=0，构建拉格朗日函数：
L ( x , λ ) = f ( x ) + λ g ( x ) \mathcal{L}(\mathbf{x}, \lambda) = f(\mathbf{x}) + \lambda g(\mathbf{x}) L(x,λ)=f(x)+λg(x)

通过对 L \mathcal{L} L分别对 x \mathbf{x} x和 λ \lambda λ求偏导并令其为零，得到最优解。

实例

求解以下二次规划问题：
min ⁡ x x 1 2 + x 2 2 \min_{\mathbf{x}} x_1^2 + x_2^2 xminx12+x22

受限于
x 1 + x 2 ≥ 1 x_1 + x_2 \geq 1 x1+x2≥1

通过构建拉格朗日函数：
L ( x 1 , x 2 , λ ) = x 1 2 + x 2 2 + λ ( 1 − x 1 − x 2 ) \mathcal{L}(x_1, x_2, \lambda) = x_1^2 + x_2^2 + \lambda (1 - x_1 - x_2) L(x1,x2,λ)=x12+x22+λ(1−x1−x2)

求解KKT条件：
∂ L ∂ x 1 = 2 x 1 − λ = 0 ∂ L ∂ x 2 = 2 x 2 − λ = 0 ∂ L ∂ λ = 1 − x 1 − x 2 = 0 \frac{\partial \mathcal{L}}{\partial x_1} = 2x_1 - \lambda = 0 \\ \frac{\partial \mathcal{L}}{\partial x_2} = 2x_2 - \lambda = 0 \\ \frac{\partial \mathcal{L}}{\partial \lambda} = 1 - x_1 - x_2 = 0 ∂x1∂L=2x1−λ=0∂x2∂L=2x2−λ=0∂λ∂L=1−x1−x2=0

解得：
x 1 = x 2 = 1 2 , λ = 1 x_1 = x_2 = \frac{1}{2}, \quad \lambda = 1 x1=x2=21,λ=1

对应的最小值为：
1 2 2 + 1 2 2 = 1 2 \frac{1}{2}^2 + \frac{1}{2}^2 = \frac{1}{2} 212+212=21

第九部分：偏微分方程

基本概念与分类

偏微分方程（Partial Differential Equations, PDEs）是描述多变量函数及其偏导数之间关系的方程，在工程、物理等领域有广泛应用。根据方程中最高阶导数的性质，偏微分方程可分为三类：

椭圆型方程

椭圆型偏微分方程通常用于描述稳态过程，如热传导、电场分布和流体力学中的势流问题。其标准形式为：
A ∂ 2 u ∂ x 2 + B ∂ 2 u ∂ x ∂ y + C ∂ 2 u ∂ y 2 + D ∂ u ∂ x + E ∂ u ∂ y + F u = G A \frac{\partial^2 u}{\partial x^2} + B \frac{\partial^2 u}{\partial x \partial y} + C \frac{\partial^2 u}{\partial y^2} + D \frac{\partial u}{\partial x} + E \frac{\partial u}{\partial y} + Fu = G A∂x2∂2u+B∂x∂y∂2u+C∂y2∂2u+D∂x∂u+E∂y∂u+Fu=G

其中，系数满足判别式 B 2 − 4 A C < 0 B^2 - 4AC < 0 B2−4AC<0。典型的椭圆型方程包括：

拉普拉斯方程：
Δ u = ∂ 2 u ∂ x 2 + ∂ 2 u ∂ y 2 = 0 \Delta u = \frac{\partial^2 u}{\partial x^2} + \frac{\partial^2 u}{\partial y^2} = 0 Δu=∂x2∂2u+∂y2∂2u=0
泊松方程：
Δ u = f ( x , y ) \Delta u = f(x,y) Δu=f(x,y)
亥姆霍兹方程：
Δ u + k 2 u = 0 \Delta u + k^2u = 0 Δu+k2u=0
应用实例：

稳态热传导问题中的温度分布
静电场中的电势分布
不可压缩流体的势流问题
弹性力学中的平面应力问题

抛物型方程

抛物型偏微分方程常用于描述扩散过程，如热传导、物质扩散和金融数学中的期权定价。其标准形式为：
A ∂ 2 u ∂ x 2 + B ∂ u ∂ t + C ∂ u ∂ x + D u = E A \frac{\partial^2 u}{\partial x^2} + B \frac{\partial u}{\partial t} + C \frac{\partial u}{\partial x} + Du = E A∂x2∂2u+B∂t∂u+C∂x∂u+Du=E

判别式满足 B 2 − 4 A C = 0 B^2 - 4AC = 0 B2−4AC=0。典型的抛物型方程包括：

热传导方程：
∂ u ∂ t = α ∂ 2 u ∂ x 2 \frac{\partial u}{\partial t} = \alpha \frac{\partial^2 u}{\partial x^2} ∂t∂u=α∂x2∂2u
扩散方程：
∂ u ∂ t = D ∂ 2 u ∂ x 2 \frac{\partial u}{\partial t} = D \frac{\partial^2 u}{\partial x^2} ∂t∂u=D∂x2∂2u
Fokker-Planck方程：
∂ u ∂ t = − ∂ ∂ x ( a ( x ) u ) + 1 2 ∂ 2 ∂ x 2 ( b ( x ) u ) \frac{\partial u}{\partial t} = -\frac{\partial}{\partial x}(a(x)u) + \frac{1}{2}\frac{\partial^2}{\partial x^2}(b(x)u) ∂t∂u=−∂x∂(a(x)u)+21∂x2∂2(b(x)u)
应用实例：

物体内部温度随时间的变化
污染物在环境中的扩散
Black-Scholes期权定价模型
粒子在势场中的运动

双曲型方程

双曲型偏微分方程主要用于描述波动现象，如声波、电磁波和弹性力学中的振动问题。其标准形式为：
A ∂ 2 u ∂ t 2 + B ∂ 2 u ∂ x 2 + C ∂ u ∂ t + D ∂ u ∂ x + E u = F A \frac{\partial^2 u}{\partial t^2} + B \frac{\partial^2 u}{\partial x^2} + C \frac{\partial u}{\partial t} + D \frac{\partial u}{\partial x} + Eu = F A∂t2∂2u+B∂x2∂2u+C∂t∂u+D∂x∂u+Eu=F

判别式满足 B 2 − 4 A C > 0 B^2 - 4AC > 0 B2−4AC>0。典型的双曲型方程包括：

波动方程：
∂ 2 u ∂ t 2 = c 2 ∂ 2 u ∂ x 2 \frac{\partial^2 u}{\partial t^2} = c^2 \frac{\partial^2 u}{\partial x^2} ∂t2∂2u=c2∂x2∂2u
电报方程：
∂ 2 u ∂ t 2 + 2 α ∂ u ∂ t + β 2 u = c 2 ∂ 2 u ∂ x 2 \frac{\partial^2 u}{\partial t^2} + 2\alpha \frac{\partial u}{\partial t} + \beta^2 u = c^2 \frac{\partial^2 u}{\partial x^2} ∂t2∂2u+2α∂t∂u+β2u=c2∂x2∂2u
Klein-Gordon方程：
∂ 2 u ∂ t 2 − Δ u + m 2 u = 0 \frac{\partial^2 u}{\partial t^2} - \Delta u + m^2u = 0 ∂t2∂2u−Δu+m2u=0
应用实例：

声波在空气中的传播
电磁波在介质中的传播
弹性体的振动问题
量子场论中的标量场

求解方法

分离变量法

分离变量法是求解线性偏微分方程的经典方法，适用于具有齐次边界条件的问题。基本步骤如下：

假设解可以表示为各变量的乘积形式，即 u ( x , y ) = X ( x ) Y ( y ) u(x, y) = X(x)Y(y) u(x,y)=X(x)Y(y)。
将假设代入原方程，分离变量，使得两边只含有单一变量的函数。
得到两个常微分方程，分别关于 X ( x ) X(x) X(x) 和 Y ( y ) Y(y) Y(y)。
求解这两个常微分方程，得到通解。
根据边界条件确定常数，得到特定解。

实例：求解一维热传导方程
∂ u ∂ t = α ∂ 2 u ∂ x 2 \frac{\partial u}{\partial t} = \alpha \frac{\partial^2 u}{\partial x^2} ∂t∂u=α∂x2∂2u

假设解为 u ( x , t ) = X ( x ) T ( t ) u(x, t) = X(x)T(t) u(x,t)=X(x)T(t)，代入方程后可得到
1 α T d T d t = 1 X d 2 X d x 2 = − λ \frac{1}{\alpha T} \frac{dT}{dt} = \frac{1}{X} \frac{d^2 X}{dx^2} = -\lambda αT1dtdT=X1dx2d2X=−λ

从而得到两个常微分方程：
d T d t + α λ T = 0 \frac{dT}{dt} + \alpha \lambda T = 0 dtdT+αλT=0
d 2 X d x 2 + λ X = 0 \frac{d^2 X}{dx^2} + \lambda X = 0 dx2d2X+λX=0

根据边界条件求解，得到温度分布随时间的变化规律。

特征线法

特征线法适用于一阶偏微分方程，通过寻找特征线将偏微分方程转化为常微分方程。基本步骤：

将偏微分方程写成标准形式：
a ( x , y ) ∂ u ∂ x + b ( x , y ) ∂ u ∂ y = c ( x , y ) a(x, y) \frac{\partial u}{\partial x} + b(x, y) \frac{\partial u}{\partial y} = c(x, y) a(x,y)∂x∂u+b(x,y)∂y∂u=c(x,y)
构造特征方程组：
d x d s = a ( x , y ) , d y d s = b ( x , y ) , d u d s = c ( x , y ) \frac{dx}{ds} = a(x, y), \quad \frac{dy}{ds} = b(x, y), \quad \frac{du}{ds} = c(x, y) dsdx=a(x,y),dsdy=b(x,y),dsdu=c(x,y)
解特征方程组，得到特征曲线。
在特征曲线上求解 u u u。

实例：求解一阶线性偏微分方程
∂ u ∂ x + ∂ u ∂ y = 0 \frac{\partial u}{\partial x} + \frac{\partial u}{\partial y} = 0 ∂x∂u+∂y∂u=0

特征方程为：
d x d s = 1 , d y d s = 1 , d u d s = 0 \frac{dx}{ds} = 1, \quad \frac{dy}{ds} = 1, \quad \frac{du}{ds} = 0 dsdx=1,dsdy=1,dsdu=0

解得特征线为 y − x = const y - x = \text{const} y−x=const，因此解为 u ( x , y ) = f ( y − x ) u(x, y) = f(y - x) u(x,y)=f(y−x)。

数值解法

对于无法通过解析方法求解的复杂偏微分方程，数值解法是重要的求解工具。常见的方法包括：

有限差分法：
- 将连续的偏微分方程离散化，转化为代数方程
- 构建差分网格，定义网格点
- 在网格点上应用差分近似，得到离散方程组
- 使用数值方法（如迭代法）求解方程组
- 优点：简单直观，易于实现
- 缺点：对复杂几何形状适应性差
有限元法：
- 将求解区域划分为有限个单元
- 在每个单元上构造近似函数
- 通过变分原理或加权残值法建立代数方程组
- 求解方程组得到近似解
- 优点：适应复杂几何形状，精度高
- 缺点：计算量大，实现复杂
谱方法：
- 使用全局基函数（如傅里叶级数或切比雪夫多项式）近似解
- 通过Galerkin方法或配点法建立代数方程组
- 求解方程组得到高精度近似解
- 优点：高精度，收敛快
- 缺点：对非光滑解适应性差

实例：使用有限差分法求解热传导方程
∂ u ∂ t = α ∂ 2 u ∂ x 2 \frac{\partial u}{\partial t} = \alpha \frac{\partial^2 u}{\partial x^2} ∂t∂u=α∂x2∂2u

离散化后得到：
u i n + 1 − u i n Δ t = α u i + 1 n − 2 u i n + u i − 1 n ( Δ x ) 2 \frac{u_i^{n+1} - u_i^n}{\Delta t} = \alpha \frac{u_{i+1}^n - 2u_i^n + u_{i-1}^n}{(\Delta x)^2} Δtuin+1−uin=α(Δx)2ui+1n−2uin+ui−1n

通过迭代计算，可以获得 u u u 在离散网格上的近似值。

边界条件与适定性

偏微分方程的求解需要考虑边界条件和初始条件，常见边界条件包括：

狄利克雷边界条件：指定函数在边界上的值
诺伊曼边界条件：指定函数在边界上的法向导数
混合边界条件：同时包含函数值及其导数的条件
周期边界条件：函数在边界上满足周期性条件

偏微分方程的适定性要求解满足：

存在性：至少存在一个解
唯一性：解是唯一的
稳定性：解对初始条件和边界条件连续依赖

补充说明：

对于不同类型的偏微分方程，需要采用不同的边界条件组合
适定性是偏微分方程理论研究的核心问题之一
在实际应用中，还需要考虑数值稳定性和收敛性等问题

第十部分：非线性系统分析

非线性系统广泛存在于工程实践中，其分析与线性系统有显著不同。本节将系统介绍非线性系统分析的三大核心方法：稳定性理论、相平面分析和混沌理论。

稳定性理论

李雅普诺夫方法

李雅普诺夫方法是分析非线性动态系统稳定性的强大工具，由俄罗斯数学家亚历山大·李雅普诺夫于1892年提出。其核心思想是通过构造一个李雅普诺夫函数 V ( x ) V(x) V(x) 来研究系统的稳定性，而无需求解系统的具体解。

李雅普诺夫函数的定义

对于一个自治非线性系统：
d x d t = f ( x ) \frac{dx}{dt} = f(x) dtdx=f(x)

其中， x ∈ R n x \in \mathbb{R}^n x∈Rn， f ( x ) f(x) f(x) 是连续可微函数。李雅普诺夫函数 V ( x ) V(x) V(x) 需要满足以下条件：

正定性： V ( x ) V(x) V(x) 在平衡点 x = 0 x = 0 x=0 处有极小值，即 V ( 0 ) = 0 V(0) = 0 V(0)=0 且 V ( x ) > 0 V(x) > 0 V(x)>0 对于所有 x ≠ 0 x \neq 0 x=0。
导数条件： V ( x ) V(x) V(x) 关于时间的导数 d V d t \frac{dV}{dt} dtdV 满足：
d V d t = ∇ V ( x ) ⋅ f ( x ) ≤ 0 \frac{dV}{dt} = \nabla V(x) \cdot f(x) \leq 0 dtdV=∇V(x)⋅f(x)≤0

稳定性判据

稳定性 ：

如果存在李雅普诺夫函数 V ( x ) V(x) V(x) 使得 d V d t ≤ 0 \frac{dV}{dt} \leq 0 dtdV≤0，则平衡点 x = 0 x = 0 x=0 是稳定的。
渐近稳定性 ：

如果 d V d t < 0 \frac{dV}{dt} < 0 dtdV<0 除 x = 0 x = 0 x=0 外，则平衡点是渐近稳定的，即系统状态将随着时间趋向于平衡点。
全局渐近稳定性 ：

如果李雅普诺夫函数 V ( x ) V(x) V(x) 满足 V ( x ) → ∞ V(x) \to \infty V(x)→∞ 当 ∣ ∣ x ∣ ∣ → ∞ ||x|| \to \infty ∣∣x∣∣→∞，且 d V d t < 0 \frac{dV}{dt} < 0 dtdV<0 对所有 x ≠ 0 x \neq 0 x=0 成立，则平衡点是全局渐近稳定的。

应用实例

实例 1 ：考虑一维线性系统
d x d t = − k x \frac{dx}{dt} = -kx dtdx=−kx

其中 k > 0 k > 0 k>0。选择李雅普诺夫函数 V ( x ) = 1 2 x 2 V(x) = \frac{1}{2}x^2 V(x)=21x2，则
d V d t = x ⋅ ( − k x ) = − k x 2 ≤ 0 \frac{dV}{dt} = x \cdot (-kx) = -kx^2 \leq 0 dtdV=x⋅(−kx)=−kx2≤0

因此，系统在 x = 0 x = 0 x=0 处是渐近稳定的。

实例 2 ：考虑非线性系统
d x d t = − x 3 \frac{dx}{dt} = -x^3 dtdx=−x3

选择 V ( x ) = 1 2 x 2 V(x) = \frac{1}{2}x^2 V(x)=21x2，则
d V d t = x ⋅ ( − x 3 ) = − x 4 < 0 ( x ≠ 0 ) \frac{dV}{dt} = x \cdot (-x^3) = -x^4 < 0 \quad (x \neq 0) dtdV=x⋅(−x3)=−x4<0(x=0)

系统在 x = 0 x = 0 x=0 处是全局渐近稳定的。

相平面分析

相平面分析是一种直观的方法，用于研究二维非线性动态系统的行为。通过在相平面上绘制系统的轨道，可以直观地观察系统的稳定性和长期行为。

系统方程

考虑二维非线性系统：
{ d x d t = f ( x , y ) d y d t = g ( x , y ) \begin{cases} \frac{dx}{dt} = f(x, y) \\ \frac{dy}{dt} = g(x, y) \end{cases} {dtdx=f(x,y)dtdy=g(x,y)

平衡点与稳定性

平衡点 ：满足 f ( x , y ) = 0 f(x, y) = 0 f(x,y)=0 和 g ( x , y ) = 0 g(x, y) = 0 g(x,y)=0 的点，表示系统在该点处保持不变。
稳定性分析 ：

通过线性化系统，可以分析平衡点的稳定性。线性化系统的雅可比矩阵为：
J = ( ∂ f ∂ x ∂ f ∂ y ∂ g ∂ x ∂ g ∂ y ) J = \begin{pmatrix} \frac{\partial f}{\partial x} & \frac{\partial f}{\partial y} \\ \frac{\partial g}{\partial x} & \frac{\partial g}{\partial y} \end{pmatrix} J=(∂x∂f∂x∂g∂y∂f∂y∂g)

计算雅可比矩阵的特征值，可以判断平衡点的类型和稳定性。

稳定性分类

稳定节点：两个实负特征值，系统状态趋向平衡点。
不稳定节点：两个实正特征值，系统状态远离平衡点。
鞍点：特征值一正一负，系统在某些方向稳定，某些方向不稳定。
稳定焦点：复特征值，实部为负，系统状态呈螺旋趋向平衡点。
不稳定焦点：复特征值，实部为正，系统状态呈螺旋远离平衡点。

应用实例

实例 1 ：分析系统
{ d x d t = y d y d t = − x − y \begin{cases} \frac{dx}{dt} = y \\ \frac{dy}{dt} = -x - y \end{cases} {dtdx=ydtdy=−x−y

平衡点为 ( 0 , 0 ) (0, 0) (0,0)。雅可比矩阵为：
J = ( 0 1 − 1 − 1 ) J = \begin{pmatrix} 0 & 1 \\ -1 & -1 \end{pmatrix} J=(0−11−1)

特征方程为：
λ 2 + λ + 1 = 0 \lambda^2 + \lambda + 1 = 0 λ2+λ+1=0

解得特征值为 λ = − 1 ± − 3 2 \lambda = \frac{-1 \pm \sqrt{-3}}{2} λ=2−1±−3 ，实部为负，系统在原点为稳定焦点，系统状态将以螺旋方式趋向于平衡点。

实例 2 ：Van der Pol 振子
{ d x d t = y d y d t = μ ( 1 − x 2 ) y − x \begin{cases} \frac{dx}{dt} = y \\ \frac{dy}{dt} = \mu(1-x^2)y - x \end{cases} {dtdx=ydtdy=μ(1−x2)y−x

当 μ > 0 \mu > 0 μ>0 时，系统存在稳定的极限环，表现出自激振荡行为。

混沌理论

混沌理论研究的是非线性系统中高度敏感的动态行为，即微小的初始条件变化会引起系统状态的巨大差异。混沌系统在许多自然现象和工程应用中普遍存在。

混沌系统的特征

敏感依赖初值 ：

混沌系统对初始条件极为敏感，即使是极小的初始差异也会随着时间的推移迅速放大，导致系统行为的不可预测性。数学上，混沌系统的李雅普诺夫指数 λ \lambda λ 满足 λ > 0 \lambda > 0 λ>0。
拓扑混合性 ：

任意两个区域内的轨道随着时间的推移会相互交织，系统的轨道在相空间中复杂交错。
密集不稳定周期轨道 ：

混沌吸引子中包含无限多个周期轨道，这些周期轨道在相空间中密集分布。

李雅普诺夫指数

李雅普诺夫指数是衡量系统对初始条件敏感性的指标。对于一个 n n n 维系统，存在 n n n 个李雅普诺夫指数，其中最大的一个决定了系统是否具有混沌性。

定义：
λ = lim ⁡ t → ∞ 1 t ln ⁡ ∣ ∣ δ x ( t ) ∣ ∣ ∣ ∣ δ x ( 0 ) ∣ ∣ \lambda = \lim_{t \to \infty} \frac{1}{t} \ln \frac{||\delta x(t)||}{||\delta x(0)||} λ=t→∞limt1ln∣∣δx(0)∣∣∣∣δx(t)∣∣

如果 λ > 0 \lambda > 0 λ>0，则系统对初始条件敏感，可能表现出混沌行为。

分岔现象

分岔指的是随着系统参数的变化，系统动力学行为发生质的变化。分岔是混沌生成的前兆，它标志着系统从简单行为向复杂行为的过渡。

常见的分岔类型

鞍结分岔 ：

系统通过参数变化，从稳定状态转变为不稳定状态，通常伴随着周期轨道的出现。
Hopf 分岔 ：

当系统参数达到临界值时，平衡点由稳定变为不稳定，并产生一个或多个极限环。
周期倍增分岔 ：

系统通过一系列的周期倍增过程，最终走向混沌。例如，随着参数的不断增加，系统的周期性行为会变为双周期、四周期，最终演变为不规则的混沌轨道。

应用实例

实例：Lorenz 系统
{ d x d t = σ ( y − x ) d y d t = x ( ρ − z ) − y d z d t = x y − β z \begin{cases} \frac{dx}{dt} = \sigma (y - x) \\ \frac{dy}{dt} = x (\rho - z) - y \\ \frac{dz}{dt} = xy - \beta z \end{cases} ⎩ ⎨ ⎧dtdx=σ(y−x)dtdy=x(ρ−z)−ydtdz=xy−βz

当参数 ρ \rho ρ 增加时，系统经历从稳定点到极限环，再到混沌的分岔过程。例如，当 ρ > ρ c r i t i c a l \rho > \rho_{critical} ρ>ρcritical，系统表现出混沌行为，轨道在相空间中呈现出复杂的吸引子结构，即著名的"蝴蝶效应"。

附录

符号表与术语解释

f ′ ( x ) f'(x) f′(x) ：函数 f ( x ) f(x) f(x) 在点 x x x 处的导数，表示瞬时变化率。在微分方程和优化问题中广泛应用。
∫ f ( x ) d x \int f(x) dx ∫f(x)dx ：函数 f ( x ) f(x) f(x) 的不定积分，表示所有原函数的集合。在求解微分方程和计算面积、体积等问题中起关键作用。
det ⁡ ( A ) \det(A) det(A) ：矩阵 A A A 的行列式，用于判断矩阵是否可逆及其他性质。在矩阵分解和线性方程组求解中具有重要意义。
S n S_n Sn ：全排列的集合，包含所有长度为 n n n 的排列。在组合数学和概率论中经常使用。
P ( x ) P(x) P(x)， Q ( x ) Q(x) Q(x)：一阶线性微分方程中的系数函数，视具体方程而定。在求解微分方程时用于描述方程的结构。
C 1 , C 2 C_1, C_2 C1,C2：常数，通常由初始条件或边界条件确定。在求解微分方程时表示通解中的任意常数。
李雅普诺夫指数 λ \lambda λ ：衡量系统对初始条件敏感性的指标， λ > 0 \lambda > 0 λ>0 表示系统可能具有混沌行为。在非线性系统分析中用于判断系统的稳定性。
α , β \alpha, \beta α,β：在解决二阶常系数齐次微分方程时，表示特征方程的复数根的实部和虚部。在振动系统和热传导问题中常见。
Λ \Lambda Λ：通常用于表示拉格朗日乘数或其他特定参数，根据上下文定义。在优化问题和约束系统中使用。
V ( x ) V(x) V(x)：李雅普诺夫函数，用于分析系统的稳定性。在非线性系统稳定性理论中起核心作用。
A , B , C A, B, C A,B,C：在不同的数学公式和方程中表示不同的变量或系数，具体含义依上下文而定。在矩阵理论、微分方程和傅里叶分析中广泛使用。
γ \gamma γ：通常表示路径或曲线，在复变函数中用于表示积分路径。
μ \mu μ：在概率论中表示期望值，在热传导方程中表示热扩散系数。
σ \sigma σ：在概率论中表示标准差，在Lorenz系统中表示普朗特数。
ρ \rho ρ：在Lorenz系统中表示瑞利数，在矩阵理论中表示谱半径。
ω \omega ω：在傅里叶变换中表示角频率，在振动系统中表示固有频率。
t t t：通常表示时间变量，在微分方程和动力系统中作为独立变量。
x , y , z x, y, z x,y,z：通常表示空间变量或状态变量，在偏微分方程和动力系统中使用。
n n n：在级数中表示项数，在矩阵中表示维度，在概率论中表示样本容量。
k k k：在微分方程中表示常数，在傅里叶级数中表示波数。
i i i ：虚数单位， i 2 = − 1 i^2 = -1 i2=−1，在复变函数和傅里叶变换中使用。
λ \lambda λ：在特征值问题中表示特征值，在偏微分方程中表示分离变量常数。在矩阵理论和微分方程中广泛使用。
ϕ \phi ϕ：在傅里叶分析中表示相位角，在流体力学中表示速度势函数。在信号处理和流体力学中常见。
θ \theta θ：在极坐标中表示角度，在旋转矩阵中表示旋转角度。在几何变换和坐标转换中使用。
ϵ \epsilon ϵ：在极限理论中表示无穷小量，在优化问题中表示收敛精度。在微积分和数值分析中常见。
δ \delta δ：在狄拉克函数中表示脉冲函数，在变分法中表示微小变化。在信号处理和变分法中使用。
∇ \nabla ∇：表示梯度算子，用于计算标量场的梯度。在向量分析和场论中广泛使用。
∂ \partial ∂：表示偏导数，用于多元函数的微分。在偏微分方程和多变量微积分中使用。
∑ \sum ∑：表示求和符号，用于级数和离散求和。在级数理论和概率论中常见。
∏ \prod ∏：表示连乘积符号，用于序列的乘积。在组合数学和概率论中使用。
∞ \infty ∞：表示无穷大，用于描述极限和积分区间。在微积分和实分析中广泛使用。
∈ \in ∈：表示属于关系，用于描述元素与集合的关系。在集合论和数学分析中使用。
⊂ \subset ⊂：表示子集关系，用于描述集合之间的包含关系。在集合论和拓扑学中常见。
⇒ \Rightarrow ⇒：表示逻辑蕴含，用于描述命题之间的推理关系。在逻辑推理和数学证明中使用。
⇔ \Leftrightarrow ⇔：表示逻辑等价，用于描述命题之间的双向关系。在逻辑推理和数学证明中常见。
∀ \forall ∀：表示全称量词，用于描述对所有元素都成立的命题。在逻辑推理和数学证明中使用。
∃ \exists ∃：表示存在量词，用于描述存在某个元素满足的命题。在逻辑推理和数学证明中常见。
A \mathbf{A} A：表示矩阵，在矩阵理论和线性代数中广泛使用。用于表示线性变换、方程组系数等。
b \mathbf{b} b：在矩阵方程中表示常数向量，在线性方程组中表示右侧向量。在数值计算和优化问题中常见。
c \mathbf{c} c：在优化问题中表示目标函数系数向量，在傅里叶级数中表示余弦系数。在数学建模和信号处理中使用。
Q \mathbf{Q} Q：在二次规划中表示二次项系数矩阵，在矩阵分解中表示正交矩阵。在最优化和数值分析中广泛使用。
R \mathbf{R} R：在QR分解中表示上三角矩阵，在控制理论中表示状态空间矩阵。在数值计算和系统分析中使用。
U , V \mathbf{U}, \mathbf{V} U,V：在奇异值分解中表示正交矩阵，在矩阵理论中表示特征向量矩阵。在数据分析和降维技术中常见。
Σ \Sigma Σ：在奇异值分解中表示对角矩阵，在概率论中表示协方差矩阵。在统计分析和机器学习中广泛使用。
x \mathbf{x} x：在优化问题中表示决策变量，在微分方程中表示状态变量。在数学建模和系统分析中常见。
y \mathbf{y} y：在控制系统中表示输出变量，在回归分析中表示响应变量。在系统识别和数据分析中使用。
z \mathbf{z} z：在复变函数中表示复变量，在状态空间模型中表示测量变量。在信号处理和系统控制中常见。
f \mathbf{f} f：在微分方程中表示向量场，在优化问题中表示目标函数。在动力系统和数学建模中使用。
g \mathbf{g} g：在约束优化中表示约束函数，在微分方程中表示非线性项。在最优化和系统分析中常见。
h \mathbf{h} h：在控制系统中表示观测函数，在机器学习中表示假设函数。在系统识别和人工智能中使用。
J \mathbf{J} J：在优化问题中表示雅可比矩阵，在控制理论中表示性能指标。在数值计算和系统优化中广泛使用。
H \mathbf{H} H：在优化问题中表示海森矩阵，在控制理论中表示哈密顿函数。在数值优化和物理建模中使用。
P \mathbf{P} P：在控制理论中表示李雅普诺夫函数矩阵，在概率论中表示转移概率矩阵。在系统稳定性和马尔可夫链分析中常见。
K \mathbf{K} K：在控制理论中表示反馈增益矩阵，在优化问题中表示核矩阵。在控制系统设计和机器学习中使用。
L \mathbf{L} L：在矩阵分解中表示下三角矩阵，在图论中表示拉普拉斯矩阵。在数值计算和网络分析中常见。
M \mathbf{M} M：在力学系统中表示质量矩阵，在数值分析中表示预处理矩阵。在物理建模和数值计算中使用。
N \mathbf{N} N：在数值分析中表示迭代矩阵，在概率论中表示正态分布矩阵。在数值计算和统计分析中常见。
D \mathbf{D} D：在矩阵理论中表示对角矩阵，在微分方程中表示阻尼矩阵。在数值计算和物理建模中使用。
E \mathbf{E} E：在误差分析中表示误差矩阵，在控制理论中表示状态估计矩阵。在系统识别和数值分析中常见。
F \mathbf{F} F：在控制理论中表示状态转移矩阵，在数值分析中表示迭代矩阵。在系统分析和数值计算中使用。
G \mathbf{G} G：在控制理论中表示控制增益矩阵，在优化问题中表示梯度矩阵。在控制系统设计和数值优化中常见。
I \mathbf{I} I：在矩阵理论中表示单位矩阵，在控制理论中表示惯性矩阵。在数值计算和物理建模中使用。
O \mathbf{O} O：在矩阵理论中表示零矩阵，在控制理论中表示观测矩阵。在数值计算和系统分析中常见。
S \mathbf{S} S：在矩阵理论中表示对称矩阵，在控制理论中表示灵敏度矩阵。在数值优化和系统分析中使用。
T \mathbf{T} T：在矩阵理论中表示变换矩阵，在控制理论中表示传递函数矩阵。在数值计算和系统分析中常见。
W \mathbf{W} W：在优化问题中表示权重矩阵，在控制理论中表示噪声协方差矩阵。在数值优化和系统识别中使用。
X \mathbf{X} X：在状态空间模型中表示状态矩阵，在优化问题中表示决策变量矩阵。在系统分析和数学建模中常见。
Y \mathbf{Y} Y：在控制理论中表示输出矩阵，在优化问题中表示对偶变量矩阵。在系统识别和数值优化中使用。
Z \mathbf{Z} Z：在控制理论中表示测量矩阵，在优化问题中表示拉格朗日乘子矩阵。在系统分析和数值优化中常见。
α \mathbf{\alpha} α：在优化问题中表示步长参数，在控制理论中表示衰减系数。在数值计算和系统分析中使用。
β \mathbf{\beta} β：在回归分析中表示回归系数，在控制理论中表示阻尼系数。在统计分析和系统建模中常见。
γ \mathbf{\gamma} γ：在优化问题中表示惩罚参数，在控制理论中表示增益系数。在数值优化和系统设计中使用。
δ \mathbf{\delta} δ：在数值分析中表示扰动参数，在控制理论中表示偏差系数。在数值计算和系统分析中常见。
ϵ \mathbf{\epsilon} ϵ：在数值分析中表示误差项，在优化问题中表示收敛阈值。在数值计算和数学建模中使用。
ζ \mathbf{\zeta} ζ：在控制理论中表示阻尼比，在数值分析中表示迭代参数。在系统分析和数值计算中常见。
η \mathbf{\eta} η：在优化问题中表示学习率，在控制理论中表示效率系数。在数值优化和系统设计中使用。
θ \mathbf{\theta} θ：在控制理论中表示角度变量，在优化问题中表示参数向量。在系统分析和数学建模中常见。