工程数学速记手册(下)
第六部分:概率与统计
概率基础
概率空间与事件
概率空间 是概率论中的基本概念,用于描述随机试验的所有可能结果及其概率。一个概率空间可以表示为三元组 ( Ω , F , P ) (\Omega, \mathcal{F}, P) (Ω,F,P),其中:
- Ω \Omega Ω 是样本空间,表示所有可能的实验结果。
- F \mathcal{F} F 是事件的集合,满足σ-代数的性质,即包含空集、对补集运算封闭、对可数并运算封闭。
- P P P 是概率测度,将事件集合映射到 [ 0 , 1 ] [0,1] [0,1] 之间的数,满足概率公理。
事件 是样本空间 Ω \Omega Ω 的子集,表示随机试验可能出现的结果组合。事件可以是简单事件(单个结果),也可以是复合事件(多个结果的集合)。事件运算包括并、交、补等,满足德摩根定律。
概率公理
概率公理是建立概率理论的基础,通常包括以下三个基本公理:
-
非负性公理 :
对于任意事件 A A A,有:
P ( A ) ≥ 0 P(A) \geq 0 P(A)≥0 -
规范化公理 :
整个样本空间的概率为 1,即:
P ( Ω ) = 1 P(\Omega) = 1 P(Ω)=1 -
可列可加公理 :
对于一列两两互斥的事件 A 1 , A 2 , ... A_1, A_2, \ldots A1,A2,...,有:
P ( ⋃ i = 1 ∞ A i ) = ∑ i = 1 ∞ P ( A i ) P\left(\bigcup_{i=1}^{\infty} A_i\right) = \sum_{i=1}^{\infty} P(A_i) P(i=1⋃∞Ai)=i=1∑∞P(Ai)
推论:
- P ( ∅ ) = 0 P(\emptyset) = 0 P(∅)=0
- P ( A c ) = 1 − P ( A ) P(A^c) = 1 - P(A) P(Ac)=1−P(A)
- 若 A ⊆ B A \subseteq B A⊆B,则 P ( A ) ≤ P ( B ) P(A) \leq P(B) P(A)≤P(B)
- P ( A ∪ B ) = P ( A ) + P ( B ) − P ( A ∩ B ) P(A \cup B) = P(A) + P(B) - P(A \cap B) P(A∪B)=P(A)+P(B)−P(A∩B)
- 容斥原理:对于任意n个事件,有:
P ( ⋃ i = 1 n A i ) = ∑ i = 1 n P ( A i ) − ∑ 1 ≤ i < j ≤ n P ( A i ∩ A j ) + ⋯ + ( − 1 ) n + 1 P ( ⋂ i = 1 n A i ) P\left(\bigcup_{i=1}^{n} A_i\right) = \sum_{i=1}^{n} P(A_i) - \sum_{1\leq i<j\leq n} P(A_i \cap A_j) + \cdots + (-1)^{n+1} P\left(\bigcap_{i=1}^{n} A_i\right) P(i=1⋃nAi)=i=1∑nP(Ai)−1≤i<j≤n∑P(Ai∩Aj)+⋯+(−1)n+1P(i=1⋂nAi)
随机变量
随机变量 是将样本空间 Ω \Omega Ω 映射到实数集的函数,用于量化随机试验的结果。根据随机变量取值的性质,随机变量可分为:
离散随机变量
如果随机变量 X X X 只能取有限或可数无限多个离散值,则称为离散随机变量。其概率质量函数(PMF)定义为:
P ( X = x i ) = p i P(X = x_i) = p_i P(X=xi)=pi
其中, x i x_i xi 是 X X X 的可能取值, p i p_i pi 满足 p i ≥ 0 p_i \geq 0 pi≥0 且 ∑ p i = 1 \sum p_i = 1 ∑pi=1。
常见分布:
-
伯努利分布 :
P ( X = 1 ) = p , P ( X = 0 ) = 1 − p P(X = 1) = p, \quad P(X = 0) = 1 - p P(X=1)=p,P(X=0)=1−p -
二项分布 ( n n n 次独立试验的成功次数):
P ( X = k ) = ( n k ) p k ( 1 − p ) n − k , k = 0 , 1 , ... , n P(X = k) = \binom{n}{k} p^k (1 - p)^{n - k}, \quad k = 0,1,\ldots,n P(X=k)=(kn)pk(1−p)n−k,k=0,1,...,n -
泊松分布 (单位时间内事件发生的次数):
P ( X = k ) = λ k e − λ k ! , k = 0 , 1 , 2 , ... P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}, \quad k = 0,1,2,\ldots P(X=k)=k!λke−λ,k=0,1,2,... -
几何分布 (首次成功所需的试验次数):
P ( X = k ) = ( 1 − p ) k − 1 p , k = 1 , 2 , 3 , ... P(X = k) = (1 - p)^{k-1} p, \quad k = 1,2,3,\ldots P(X=k)=(1−p)k−1p,k=1,2,3,...
连续随机变量
如果随机变量 X X X 的取值为连续区间内的任意实数,则称为连续随机变量。其概率密度函数(PDF)定义为:
f X ( x ) = d d x P ( X ≤ x ) f_X(x) = \frac{d}{dx} P(X \leq x) fX(x)=dxdP(X≤x)
满足:
∫ − ∞ ∞ f X ( x ) d x = 1 \int_{-\infty}^{\infty} f_X(x) dx = 1 ∫−∞∞fX(x)dx=1
常见分布:
-
正态分布 :
f X ( x ) = 1 2 π σ e − ( x − μ ) 2 2 σ 2 , x ∈ R f_X(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{ -\frac{(x - \mu)^2}{2\sigma^2} }, \quad x \in \mathbb{R} fX(x)=2π σ1e−2σ2(x−μ)2,x∈R其中, μ \mu μ 为均值, σ \sigma σ 为标准差。
-
指数分布 :
f X ( x ) = λ e − λ x , x ≥ 0 f_X(x) = \lambda e^{ -\lambda x }, \quad x \geq 0 fX(x)=λe−λx,x≥0其中, λ > 0 \lambda > 0 λ>0 是参数。
-
均匀分布 :
f X ( x ) = { 1 b − a a ≤ x ≤ b 0 其他 f_X(x) = \begin{cases} \frac{1}{b-a} & a \leq x \leq b \\ 0 & \text{其他} \end{cases} fX(x)={b−a10a≤x≤b其他 -
伽马分布 :
f X ( x ) = β α Γ ( α ) x α − 1 e − β x , x > 0 f_X(x) = \frac{\beta^\alpha}{\Gamma(\alpha)} x^{\alpha-1} e^{-\beta x}, \quad x > 0 fX(x)=Γ(α)βαxα−1e−βx,x>0其中, α > 0 \alpha > 0 α>0 为形状参数, β > 0 \beta > 0 β>0 为尺度参数。
统计分析
统计分析主要分为描述统计 和推断统计两大类,用于数据的整理与分析、参数估计与假设检验等。
描述统计
描述统计用于对收集到的数据进行总结和描述,主要通过计算各种统计量来体现数据的特征。
期望与方差
-
期望(均值) :
表示随机变量取值的平均水平。对于离散随机变量 X X X,期望为:
E ( X ) = ∑ i x i P ( X = x i ) E(X) = \sum_{i} x_i P(X = x_i) E(X)=i∑xiP(X=xi)对于连续随机变量 X X X,期望为:
E ( X ) = ∫ − ∞ ∞ x f X ( x ) d x E(X) = \int_{-\infty}^{\infty} x f_X(x) dx E(X)=∫−∞∞xfX(x)dx -
方差 :
描述随机变量围绕期望的离散程度。定义为:
Var ( X ) = E [ ( X − E ( X ) ) 2 ] = E ( X 2 ) − [ E ( X ) ] 2 \text{Var}(X) = E[(X - E(X))^2] = E(X^2) - [E(X)]^2 Var(X)=E[(X−E(X))2]=E(X2)−[E(X)]2
性质:
- Var ( a X + b ) = a 2 Var ( X ) \text{Var}(aX + b) = a^2\text{Var}(X) Var(aX+b)=a2Var(X)
- 若 X X X 和 Y Y Y 独立,则 Var ( X + Y ) = Var ( X ) + Var ( Y ) \text{Var}(X + Y) = \text{Var}(X) + \text{Var}(Y) Var(X+Y)=Var(X)+Var(Y)
- 切比雪夫不等式:对于任意 k > 0 k > 0 k>0,
P ( ∣ X − μ ∣ ≥ k σ ) ≤ 1 k 2 P(|X - \mu| \geq k\sigma) \leq \frac{1}{k^2} P(∣X−μ∣≥kσ)≤k21
常用统计量
- 中位数:将数据分为上下两部分的数值。
- 众数:数据中出现次数最多的值。
- 标准差:方差的平方根,表示数据的离散程度。
- 偏度:描述数据分布的不对称性。
- 峰度:描述数据分布的尖峭程度。
- 分位数:将数据按比例划分的数值点,如四分位数、百分位数等。
推断统计
推断统计通过样本数据对总体参数进行估计和假设检验,主要包括参数估计和假设检验两部分。
参数估计
估计总体参数的常用方法包括点估计和区间估计。
-
点估计 :用样本统计量直接估计总体参数。例如,样本均值 x ˉ = 1 n ∑ i = 1 n x i \bar{x} = \frac{1}{n}\sum_{i=1}^{n} x_i xˉ=n1∑i=1nxi 是总体均值 μ \mu μ 的点估计。
-
区间估计 :在一定置信度下,建立参数的估计区间。例如,95%置信区间为:
x ˉ ± z α 2 σ n \bar{x} \pm z_{\frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}} xˉ±z2αn σ其中, z α 2 z_{\frac{\alpha}{2}} z2α 是标准正态分布的临界值, σ \sigma σ 是总体标准差, n n n 是样本容量。
估计量的评价标准:
- 无偏性: E ( θ ^ ) = θ E(\hat{\theta}) = \theta E(θ^)=θ
- 有效性:方差最小
- 一致性:当 n → ∞ n \to \infty n→∞ 时, θ ^ → θ \hat{\theta} \to \theta θ^→θ
- 充分性:估计量包含样本中关于参数的所有信息
假设检验
假设检验用于根据样本数据对关于总体参数的假设进行判定。
基本步骤:
- 提出假设 :包括原假设 H 0 H_0 H0 和备择假设 H 1 H_1 H1。
- 选择显著性水平 :通常选用 α = 0.05 \alpha = 0.05 α=0.05。
- 计算检验统计量 :根据样本数据计算统计量,例如 t t t 统计量。
- 做出决策:比较统计量与临界值,决定是否拒绝原假设。
实例:
假设要检验某工厂生产的零件直径是否符合设计要求( μ = 10 \mu = 10 μ=10 mm),采样 n = 30 n = 30 n=30 个零件,计算样本均值 x ˉ = 10.2 \bar{x} = 10.2 xˉ=10.2 mm,样本标准差 s = 0.3 s = 0.3 s=0.3 mm,显著性水平 α = 0.05 \alpha = 0.05 α=0.05。
- 原假设 H 0 : μ = 10 H_0: \mu = 10 H0:μ=10,备择假设 H 1 : μ ≠ 10 H_1: \mu \neq 10 H1:μ=10。
- 计算 t t t 统计量:
t = x ˉ − μ s / n = 10.2 − 10 0.3 / 30 ≈ 3.65 t = \frac{\bar{x} - \mu}{s / \sqrt{n}} = \frac{10.2 - 10}{0.3 / \sqrt{30}} \approx 3.65 t=s/n xˉ−μ=0.3/30 10.2−10≈3.65 - 查找临界值 t α / 2 = 2.045 t_{\alpha/2} = 2.045 tα/2=2.045(自由度为29)。
- 由于 ∣ t ∣ = 3.65 > 2.045 |t| = 3.65 > 2.045 ∣t∣=3.65>2.045,拒绝原假设,认为生产过程中存在偏差。
注意事项:
- 第一类错误:拒绝正确的原假设
- 第二类错误:接受错误的原假设
- 检验功效:1 - 第二类错误概率
第七部分:傅里叶分析
傅里叶级数
级数展开
周期函数的傅里叶展开
傅里叶级数是法国数学家傅里叶提出的重要数学工具,它将周期函数表示为正弦和余弦函数的无穷级数之和。设 f ( x ) f(x) f(x) 是一个周期为 2 π 2\pi 2π 的函数,其傅里叶级数展开式为:
f ( x ) = a 0 2 + ∑ n = 1 ∞ ( a n cos ( n x ) + b n sin ( n x ) ) f(x) = \frac{a_0}{2} + \sum_{n=1}^{\infty} \left( a_n \cos(nx) + b_n \sin(nx) \right) f(x)=2a0+n=1∑∞(ancos(nx)+bnsin(nx))
其中, a 0 a_0 a0 表示直流分量, a n a_n an 和 b n b_n bn 分别表示各次谐波的余弦和正弦分量幅度。
对于一般周期 T T T 的函数,傅里叶级数可表示为:
f ( x ) = a 0 2 + ∑ n = 1 ∞ ( a n cos ( 2 n π x T ) + b n sin ( 2 n π x T ) ) f(x) = \frac{a_0}{2} + \sum_{n=1}^{\infty} \left( a_n \cos(\frac{2n\pi x}{T}) + b_n \sin(\frac{2n\pi x}{T}) \right) f(x)=2a0+n=1∑∞(ancos(T2nπx)+bnsin(T2nπx))
傅里叶级数的存在条件
傅里叶级数的收敛性由戴利克雷条件保证,要求函数 f ( x ) f(x) f(x) 满足:
- 在一个周期内有有限个极值
- 在一个周期内有有限个第一类间断点
- 在一个周期内绝对可积
当这些条件满足时,傅里叶级数在连续点收敛于函数值,在间断点收敛于左右极限的平均值。
傅里叶系数计算
正交性与系数求解
傅里叶系数的计算基于三角函数系的正交性。对于周期为 2 π 2\pi 2π 的函数 f ( x ) f(x) f(x),其傅里叶系数计算公式为:
a n = 1 π ∫ − π π f ( x ) cos ( n x ) d x ( n = 0 , 1 , 2 , ⋯ ) a_n = \frac{1}{\pi} \int_{-\pi}^{\pi} f(x) \cos(nx) dx \quad (n = 0,1,2,\cdots) an=π1∫−ππf(x)cos(nx)dx(n=0,1,2,⋯)
b n = 1 π ∫ − π π f ( x ) sin ( n x ) d x ( n = 1 , 2 , 3 , ⋯ ) b_n = \frac{1}{\pi} \int_{-\pi}^{\pi} f(x) \sin(nx) dx \quad (n = 1,2,3,\cdots) bn=π1∫−ππf(x)sin(nx)dx(n=1,2,3,⋯)
对于奇函数和偶函数,傅里叶级数可以简化:
- 奇函数: a n = 0 a_n = 0 an=0,只有正弦项
- 偶函数: b n = 0 b_n = 0 bn=0,只有余弦项
正交性原理
三角函数系的正交性体现在:
∫ − π π cos ( n x ) cos ( m x ) d x = { 0 n ≠ m π n = m ≠ 0 2 π n = m = 0 \int_{-\pi}^{\pi} \cos(nx) \cos(mx) dx = \begin{cases} 0 & n \neq m \\ \pi & n = m \neq 0 \\ 2\pi & n = m = 0 \end{cases} ∫−ππcos(nx)cos(mx)dx=⎩ ⎨ ⎧0π2πn=mn=m=0n=m=0
∫ − π π sin ( n x ) sin ( m x ) d x = { 0 n ≠ m π n = m \int_{-\pi}^{\pi} \sin(nx) \sin(mx) dx = \begin{cases} 0 & n \neq m \\ \pi & n = m \end{cases} ∫−ππsin(nx)sin(mx)dx={0πn=mn=m
∫ − π π sin ( n x ) cos ( m x ) d x = 0 ∀ n , m \int_{-\pi}^{\pi} \sin(nx) \cos(mx) dx = 0 \quad \forall n, m ∫−ππsin(nx)cos(mx)dx=0∀n,m
这种正交性保证了傅里叶系数的唯一性,并简化了计算过程。
傅里叶变换
连续傅里叶变换
傅里叶变换将时域信号转换为频域表示,定义为:
F ( ω ) = ∫ − ∞ ∞ f ( t ) e − i ω t d t F(\omega) = \int_{-\infty}^{\infty} f(t) e^{-i\omega t} dt F(ω)=∫−∞∞f(t)e−iωtdt
其逆变换为:
f ( t ) = 1 2 π ∫ − ∞ ∞ F ( ω ) e i ω t d ω f(t) = \frac{1}{2\pi} \int_{-\infty}^{\infty} F(\omega) e^{i\omega t} d\omega f(t)=2π1∫−∞∞F(ω)eiωtdω
基本性质
- 线性性 : F [ a f ( t ) + b g ( t ) ] = a F ( ω ) + b G ( ω ) \mathcal{F}[af(t)+bg(t)] = aF(\omega)+bG(\omega) F[af(t)+bg(t)]=aF(ω)+bG(ω)
- 时移性 : F [ f ( t − t 0 ) ] = F ( ω ) e − i ω t 0 \mathcal{F}[f(t-t_0)] = F(\omega)e^{-i\omega t_0} F[f(t−t0)]=F(ω)e−iωt0
- 频移性 : F [ f ( t ) e i ω 0 t ] = F ( ω − ω 0 ) \mathcal{F}[f(t)e^{i\omega_0 t}] = F(\omega-\omega_0) F[f(t)eiω0t]=F(ω−ω0)
- 尺度变换 : F [ f ( a t ) ] = 1 ∣ a ∣ F ( ω a ) \mathcal{F}[f(at)] = \frac{1}{|a|}F(\frac{\omega}{a}) F[f(at)]=∣a∣1F(aω)
- 卷积定理:时域卷积对应频域乘积
- Parseval定理:时域和频域能量守恒
应用
信号处理
傅里叶变换在信号处理中用于:
- 频谱分析:识别信号中的频率成分
- 滤波器设计:实现低通、高通、带通等滤波器
- 信号去噪:分离有用信号和噪声
- 调制解调:在通信系统中实现信号的调制与解调
- 图像处理:在频域进行图像增强和压缩
系统分析
在系统分析中,傅里叶变换用于:
- 研究LTI系统的频率响应
- 分析系统的稳定性和性能
- 设计控制系统
- 系统辨识:通过频域分析确定系统模型
- 故障诊断:通过频谱特征识别系统故障
实例应用
实例 1:信号的频谱分析
考虑信号 f ( t ) = 2 cos ( 5 t ) + 3 sin ( 2 t ) f(t) = 2\cos(5t) + 3\sin(2t) f(t)=2cos(5t)+3sin(2t),其傅里叶变换为:
F ( ω ) = 2 π [ δ ( ω − 5 ) + δ ( ω + 5 ) ] + 3 π i [ δ ( ω − 2 ) − δ ( ω + 2 ) ] F(\omega) = 2\pi[\delta(\omega-5)+\delta(\omega+5)] + \frac{3\pi}{i}[\delta(\omega-2)-\delta(\omega+2)] F(ω)=2π[δ(ω−5)+δ(ω+5)]+i3π[δ(ω−2)−δ(ω+2)]
通过傅里叶变换,可以清晰地识别出信号中包含的5 rad/s和2 rad/s两个频率成分。
实例 2:系统的频率响应
对于RC低通滤波器,其传递函数为:
H ( ω ) = 1 1 + i ω R C H(\omega) = \frac{1}{1+i\omega RC} H(ω)=1+iωRC1
通过傅里叶变换,可以分析系统对不同频率信号的衰减特性,确定截止频率为 ω c = 1 R C \omega_c = \frac{1}{RC} ωc=RC1,为滤波器设计提供理论依据。
实例 3:图像压缩
在JPEG图像压缩中,首先对图像进行分块,然后对每个8×8的块进行离散余弦变换(DCT),将图像从空间域转换到频域。通过量化高频分量,保留主要低频信息,从而实现图像压缩。
实例 4:通信系统
在正交频分复用(OFDM)系统中,利用快速傅里叶变换(FFT)将高速数据流分解为多个低速子载波,提高了频谱利用率和抗干扰能力,广泛应用于4G/5G移动通信系统。
第八部分:矩阵理论
矩阵理论是工程数学的核心内容之一,为线性代数、优化理论等提供了重要的数学工具。本节将深入探讨矩阵分解、线性变换和最优化问题等关键内容,从基本概念到实际应用,由浅入深地展开讨论。
矩阵分解
矩阵分解是将复杂矩阵分解为若干更简单矩阵乘积的过程,这种分解不仅便于计算和分析,还能揭示矩阵的内在结构特征。常见的矩阵分解方法包括LU分解、QR分解和奇异值分解(SVD),每种方法都有其特定的应用场景和优势。
LU分解
LU分解是求解线性方程组的基础方法,它将一个方阵 A A A分解为一个下三角矩阵 L L L和一个上三角矩阵 U U U的乘积:
A = L U A = LU A=LU
其中, L L L为单位下三角矩阵(主对角线元素为1), U U U为上三角矩阵。LU分解在求解线性方程组、计算行列式和逆矩阵等方面有广泛应用。
计算方法
LU分解通常通过高斯消元法实现,具体步骤如下:
- 对矩阵 A A A进行高斯消元,得到上三角矩阵 U U U
- 在消元过程中记录下每一步的系数,构造出下三角矩阵 L L L
- 若出现主元为零的情况,需要进行行交换(引入置换矩阵 P P P,即PLU分解)
实例
考虑矩阵
A = ( 2 3 1 4 7 7 6 18 22 ) A = \begin{pmatrix} 2 & 3 & 1 \\ 4 & 7 & 7 \\ 6 & 18 & 22 \end{pmatrix} A= 24637181722
通过LU分解,可以得到
L = ( 1 0 0 2 1 0 3 3 1 ) , U = ( 2 3 1 0 1 5 0 0 2 ) L = \begin{pmatrix} 1 & 0 & 0 \\ 2 & 1 & 0 \\ 3 & 3 & 1 \end{pmatrix}, \quad U = \begin{pmatrix} 2 & 3 & 1 \\ 0 & 1 & 5 \\ 0 & 0 & 2 \end{pmatrix} L= 123013001 ,U= 200310152
验证:
L U = ( 1 0 0 2 1 0 3 3 1 ) ( 2 3 1 0 1 5 0 0 2 ) = ( 2 3 1 4 7 7 6 18 22 ) = A LU = \begin{pmatrix} 1 & 0 & 0 \\ 2 & 1 & 0 \\ 3 & 3 & 1 \end{pmatrix} \begin{pmatrix} 2 & 3 & 1 \\ 0 & 1 & 5 \\ 0 & 0 & 2 \end{pmatrix} = \begin{pmatrix} 2 & 3 & 1 \\ 4 & 7 & 7 \\ 6 & 18 & 22 \end{pmatrix} = A LU= 123013001 200310152 = 24637181722 =A
QR分解
QR分解是解决最小二乘问题和计算特征值的重要工具,它将一个矩阵 A A A分解为一个正交矩阵 Q Q Q和一个上三角矩阵 R R R的乘积:
A = Q R A = QR A=QR
其中, Q Q Q满足 Q T Q = I Q^T Q = I QTQ=I, R R R为上三角矩阵。QR分解在数值线性代数中具有重要地位。
计算方法
QR分解的实现方法主要有:
- 格拉姆-施密特正交化:逐步构造正交基
- 豪斯霍尔德变换:通过反射变换实现正交化
- 吉文斯旋转:通过平面旋转实现正交化
实例
对于矩阵
A = ( 1 1 1 − 1 1 1 ) A = \begin{pmatrix} 1 & 1 \\ 1 & -1 \\ 1 & 1 \end{pmatrix} A= 1111−11
其QR分解为
Q = ( 1 3 1 2 1 3 − 1 2 1 3 0 ) , R = ( 3 1 2 0 2 ) Q = \begin{pmatrix} \frac{1}{\sqrt{3}} & \frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{3}} & -\frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{3}} & 0 \end{pmatrix}, \quad R = \begin{pmatrix} \sqrt{3} & \frac{1}{\sqrt{2}} \\ 0 & \sqrt{2} \end{pmatrix} Q= 3 13 13 12 1−2 10 ,R=(3 02 12 )
验证:
Q R = ( 1 3 1 2 1 3 − 1 2 1 3 0 ) ( 3 1 2 0 2 ) = ( 1 1 1 − 1 1 1 ) = A QR = \begin{pmatrix} \frac{1}{\sqrt{3}} & \frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{3}} & -\frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{3}} & 0 \end{pmatrix} \begin{pmatrix} \sqrt{3} & \frac{1}{\sqrt{2}} \\ 0 & \sqrt{2} \end{pmatrix}= \begin{pmatrix} 1 & 1 \\ 1 & -1 \\ 1 & 1 \end{pmatrix} = A QR= 3 13 13 12 1−2 10 (3 02 12 )= 1111−11 =A
奇异值分解(SVD)
奇异值分解是矩阵分析中最强大的工具之一,它将任意矩阵 A A A分解为三个矩阵的乘积:
A = U Σ V T A = U \Sigma V^T A=UΣVT
其中, U U U和 V V V是正交矩阵, Σ \Sigma Σ是一个对角矩阵,其对角线上的元素称为奇异值。SVD在数据压缩、噪声过滤、主成分分析等领域有广泛应用。
计算方法
SVD的计算通常通过:
- 双谱算法:适用于中小规模矩阵
- 雅可比旋转法:适用于对称矩阵
- 分治法:适用于大规模矩阵
实例
对于矩阵
A = ( 3 1 1 3 ) A = \begin{pmatrix} 3 & 1 \\ 1 & 3 \end{pmatrix} A=(3113)
其奇异值分解为
U = ( 1 2 − 1 2 1 2 1 2 ) , Σ = ( 4 0 0 2 ) , V T = U T U = \begin{pmatrix} \frac{1}{\sqrt{2}} & -\frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}} \end{pmatrix}, \quad \Sigma = \begin{pmatrix} 4 & 0 \\ 0 & 2 \end{pmatrix}, \quad V^T = U^T U=(2 12 1−2 12 1),Σ=(4002),VT=UT
验证:
U Σ V T = ( 1 2 − 1 2 1 2 1 2 ) ( 4 0 0 2 ) ( 1 2 1 2 − 1 2 1 2 ) = ( 3 1 1 3 ) = A U \Sigma V^T = \begin{pmatrix} \frac{1}{\sqrt{2}} & -\frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}} \end{pmatrix} \begin{pmatrix} 4 & 0 \\ 0 & 2 \end{pmatrix} \begin{pmatrix} \frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}} \\ -\frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}} \end{pmatrix}= \begin{pmatrix} 3 & 1 \\ 1 & 3 \end{pmatrix} = A UΣVT=(2 12 1−2 12 1)(4002)(2 1−2 12 12 1)=(3113)=A
应用
矩阵理论在工程领域中有广泛的应用,主要包括线性变换和最优化问题等。
线性变换
线性变换是保持向量加法和标量乘法的映射,其可以通过矩阵来表示和分析。
矩阵与线性映射
给定一个线性变换 T : R n → R m T: \mathbb{R}^n \to \mathbb{R}^m T:Rn→Rm,存在唯一的矩阵 A ∈ R m × n A \in \mathbb{R}^{m \times n} A∈Rm×n,使得
T ( x ) = A x T(\mathbf{x}) = A\mathbf{x} T(x)=Ax
其中, x ∈ R n \mathbf{x} \in \mathbb{R}^n x∈Rn为输入向量, A x ∈ R m A\mathbf{x} \in \mathbb{R}^m Ax∈Rm为输出向量。
基本性质
- 保持加法 : T ( x + y ) = T ( x ) + T ( y ) T(\mathbf{x} + \mathbf{y}) = T(\mathbf{x}) + T(\mathbf{y}) T(x+y)=T(x)+T(y)
- 保持标量乘法 : T ( c x ) = c T ( x ) T(c\mathbf{x}) = cT(\mathbf{x}) T(cx)=cT(x)
- 组合性 :若 T 1 T_1 T1和 T 2 T_2 T2分别由矩阵 A A A和 B B B表示,则 T 1 ∘ T 2 T_1 \circ T_2 T1∘T2由矩阵 B A BA BA表示
- 核与像空间 :核空间 ker ( T ) \ker(T) ker(T)和像空间 im ( T ) \operatorname{im}(T) im(T)是重要的子空间
- 秩-零度定理 : dim ( ker ( T ) ) + dim ( im ( T ) ) = n \dim(\ker(T)) + \dim(\operatorname{im}(T)) = n dim(ker(T))+dim(im(T))=n
实例
考虑线性变换 T : R 2 → R 2 T: \mathbb{R}^2 \to \mathbb{R}^2 T:R2→R2,其矩阵表示为
A = ( 2 0 0 3 ) A = \begin{pmatrix} 2 & 0 \\ 0 & 3 \end{pmatrix} A=(2003)
则对于向量 x = ( x y ) \mathbf{x} = \begin{pmatrix} x \\ y \end{pmatrix} x=(xy),有
T ( x ) = A x = ( 2 x 3 y ) T(\mathbf{x}) = A\mathbf{x} = \begin{pmatrix} 2x \\ 3y \end{pmatrix} T(x)=Ax=(2x3y)
此变换对应于 x x x轴方向的缩放因子为2, y y y轴方向的缩放因子为3。
最优化问题
最优化问题旨在找到一个目标函数的最优值(最小值或最大值),通常在一定约束条件下进行。
二次规划与拉格朗日乘数法
二次规划是一类特殊的最优化问题,其目标函数为二次函数,约束条件为线性不等式或等式。
min x 1 2 x T Q x + c T x \min_{\mathbf{x}} \frac{1}{2}\mathbf{x}^T Q \mathbf{x} + \mathbf{c}^T \mathbf{x} xmin21xTQx+cTx
受限于
A x ≤ b A\mathbf{x} \leq \mathbf{b} Ax≤b
其中, Q Q Q是对称正定矩阵,确保目标函数的凸性。
拉格朗日乘数法
拉格朗日乘数法是一种用于求解带等式约束的最优化问题的方法。对于目标函数 f ( x ) f(\mathbf{x}) f(x),约束条件 g ( x ) = 0 g(\mathbf{x}) = 0 g(x)=0,构建拉格朗日函数:
L ( x , λ ) = f ( x ) + λ g ( x ) \mathcal{L}(\mathbf{x}, \lambda) = f(\mathbf{x}) + \lambda g(\mathbf{x}) L(x,λ)=f(x)+λg(x)
通过对 L \mathcal{L} L分别对 x \mathbf{x} x和 λ \lambda λ求偏导并令其为零,得到最优解。
实例
求解以下二次规划问题:
min x x 1 2 + x 2 2 \min_{\mathbf{x}} x_1^2 + x_2^2 xminx12+x22
受限于
x 1 + x 2 ≥ 1 x_1 + x_2 \geq 1 x1+x2≥1
通过构建拉格朗日函数:
L ( x 1 , x 2 , λ ) = x 1 2 + x 2 2 + λ ( 1 − x 1 − x 2 ) \mathcal{L}(x_1, x_2, \lambda) = x_1^2 + x_2^2 + \lambda (1 - x_1 - x_2) L(x1,x2,λ)=x12+x22+λ(1−x1−x2)
求解KKT条件:
∂ L ∂ x 1 = 2 x 1 − λ = 0 ∂ L ∂ x 2 = 2 x 2 − λ = 0 ∂ L ∂ λ = 1 − x 1 − x 2 = 0 \frac{\partial \mathcal{L}}{\partial x_1} = 2x_1 - \lambda = 0 \\ \frac{\partial \mathcal{L}}{\partial x_2} = 2x_2 - \lambda = 0 \\ \frac{\partial \mathcal{L}}{\partial \lambda} = 1 - x_1 - x_2 = 0 ∂x1∂L=2x1−λ=0∂x2∂L=2x2−λ=0∂λ∂L=1−x1−x2=0
解得:
x 1 = x 2 = 1 2 , λ = 1 x_1 = x_2 = \frac{1}{2}, \quad \lambda = 1 x1=x2=21,λ=1
对应的最小值为:
1 2 2 + 1 2 2 = 1 2 \frac{1}{2}^2 + \frac{1}{2}^2 = \frac{1}{2} 212+212=21
第九部分:偏微分方程
基本概念与分类
偏微分方程(Partial Differential Equations, PDEs)是描述多变量函数及其偏导数之间关系的方程,在工程、物理等领域有广泛应用。根据方程中最高阶导数的性质,偏微分方程可分为三类:
椭圆型方程
椭圆型偏微分方程通常用于描述稳态过程,如热传导、电场分布和流体力学中的势流问题。其标准形式为:
A ∂ 2 u ∂ x 2 + B ∂ 2 u ∂ x ∂ y + C ∂ 2 u ∂ y 2 + D ∂ u ∂ x + E ∂ u ∂ y + F u = G A \frac{\partial^2 u}{\partial x^2} + B \frac{\partial^2 u}{\partial x \partial y} + C \frac{\partial^2 u}{\partial y^2} + D \frac{\partial u}{\partial x} + E \frac{\partial u}{\partial y} + Fu = G A∂x2∂2u+B∂x∂y∂2u+C∂y2∂2u+D∂x∂u+E∂y∂u+Fu=G
其中,系数满足判别式 B 2 − 4 A C < 0 B^2 - 4AC < 0 B2−4AC<0。典型的椭圆型方程包括:
- 拉普拉斯方程:
Δ u = ∂ 2 u ∂ x 2 + ∂ 2 u ∂ y 2 = 0 \Delta u = \frac{\partial^2 u}{\partial x^2} + \frac{\partial^2 u}{\partial y^2} = 0 Δu=∂x2∂2u+∂y2∂2u=0 - 泊松方程:
Δ u = f ( x , y ) \Delta u = f(x,y) Δu=f(x,y) - 亥姆霍兹方程:
Δ u + k 2 u = 0 \Delta u + k^2u = 0 Δu+k2u=0
应用实例:
- 稳态热传导问题中的温度分布
- 静电场中的电势分布
- 不可压缩流体的势流问题
- 弹性力学中的平面应力问题
抛物型方程
抛物型偏微分方程常用于描述扩散过程,如热传导、物质扩散和金融数学中的期权定价。其标准形式为:
A ∂ 2 u ∂ x 2 + B ∂ u ∂ t + C ∂ u ∂ x + D u = E A \frac{\partial^2 u}{\partial x^2} + B \frac{\partial u}{\partial t} + C \frac{\partial u}{\partial x} + Du = E A∂x2∂2u+B∂t∂u+C∂x∂u+Du=E
判别式满足 B 2 − 4 A C = 0 B^2 - 4AC = 0 B2−4AC=0。典型的抛物型方程包括:
- 热传导方程:
∂ u ∂ t = α ∂ 2 u ∂ x 2 \frac{\partial u}{\partial t} = \alpha \frac{\partial^2 u}{\partial x^2} ∂t∂u=α∂x2∂2u - 扩散方程:
∂ u ∂ t = D ∂ 2 u ∂ x 2 \frac{\partial u}{\partial t} = D \frac{\partial^2 u}{\partial x^2} ∂t∂u=D∂x2∂2u - Fokker-Planck方程:
∂ u ∂ t = − ∂ ∂ x ( a ( x ) u ) + 1 2 ∂ 2 ∂ x 2 ( b ( x ) u ) \frac{\partial u}{\partial t} = -\frac{\partial}{\partial x}(a(x)u) + \frac{1}{2}\frac{\partial^2}{\partial x^2}(b(x)u) ∂t∂u=−∂x∂(a(x)u)+21∂x2∂2(b(x)u)
应用实例:
- 物体内部温度随时间的变化
- 污染物在环境中的扩散
- Black-Scholes期权定价模型
- 粒子在势场中的运动
双曲型方程
双曲型偏微分方程主要用于描述波动现象,如声波、电磁波和弹性力学中的振动问题。其标准形式为:
A ∂ 2 u ∂ t 2 + B ∂ 2 u ∂ x 2 + C ∂ u ∂ t + D ∂ u ∂ x + E u = F A \frac{\partial^2 u}{\partial t^2} + B \frac{\partial^2 u}{\partial x^2} + C \frac{\partial u}{\partial t} + D \frac{\partial u}{\partial x} + Eu = F A∂t2∂2u+B∂x2∂2u+C∂t∂u+D∂x∂u+Eu=F
判别式满足 B 2 − 4 A C > 0 B^2 - 4AC > 0 B2−4AC>0。典型的双曲型方程包括:
- 波动方程:
∂ 2 u ∂ t 2 = c 2 ∂ 2 u ∂ x 2 \frac{\partial^2 u}{\partial t^2} = c^2 \frac{\partial^2 u}{\partial x^2} ∂t2∂2u=c2∂x2∂2u - 电报方程:
∂ 2 u ∂ t 2 + 2 α ∂ u ∂ t + β 2 u = c 2 ∂ 2 u ∂ x 2 \frac{\partial^2 u}{\partial t^2} + 2\alpha \frac{\partial u}{\partial t} + \beta^2 u = c^2 \frac{\partial^2 u}{\partial x^2} ∂t2∂2u+2α∂t∂u+β2u=c2∂x2∂2u - Klein-Gordon方程:
∂ 2 u ∂ t 2 − Δ u + m 2 u = 0 \frac{\partial^2 u}{\partial t^2} - \Delta u + m^2u = 0 ∂t2∂2u−Δu+m2u=0
应用实例:
- 声波在空气中的传播
- 电磁波在介质中的传播
- 弹性体的振动问题
- 量子场论中的标量场
求解方法
分离变量法
分离变量法是求解线性偏微分方程的经典方法,适用于具有齐次边界条件的问题。基本步骤如下:
- 假设解可以表示为各变量的乘积形式,即 u ( x , y ) = X ( x ) Y ( y ) u(x, y) = X(x)Y(y) u(x,y)=X(x)Y(y)。
- 将假设代入原方程,分离变量,使得两边只含有单一变量的函数。
- 得到两个常微分方程,分别关于 X ( x ) X(x) X(x) 和 Y ( y ) Y(y) Y(y)。
- 求解这两个常微分方程,得到通解。
- 根据边界条件确定常数,得到特定解。
实例 :求解一维热传导方程
∂ u ∂ t = α ∂ 2 u ∂ x 2 \frac{\partial u}{\partial t} = \alpha \frac{\partial^2 u}{\partial x^2} ∂t∂u=α∂x2∂2u
假设解为 u ( x , t ) = X ( x ) T ( t ) u(x, t) = X(x)T(t) u(x,t)=X(x)T(t),代入方程后可得到
1 α T d T d t = 1 X d 2 X d x 2 = − λ \frac{1}{\alpha T} \frac{dT}{dt} = \frac{1}{X} \frac{d^2 X}{dx^2} = -\lambda αT1dtdT=X1dx2d2X=−λ
从而得到两个常微分方程:
d T d t + α λ T = 0 \frac{dT}{dt} + \alpha \lambda T = 0 dtdT+αλT=0
d 2 X d x 2 + λ X = 0 \frac{d^2 X}{dx^2} + \lambda X = 0 dx2d2X+λX=0
根据边界条件求解,得到温度分布随时间的变化规律。
特征线法
特征线法适用于一阶偏微分方程,通过寻找特征线将偏微分方程转化为常微分方程。基本步骤:
- 将偏微分方程写成标准形式:
a ( x , y ) ∂ u ∂ x + b ( x , y ) ∂ u ∂ y = c ( x , y ) a(x, y) \frac{\partial u}{\partial x} + b(x, y) \frac{\partial u}{\partial y} = c(x, y) a(x,y)∂x∂u+b(x,y)∂y∂u=c(x,y) - 构造特征方程组:
d x d s = a ( x , y ) , d y d s = b ( x , y ) , d u d s = c ( x , y ) \frac{dx}{ds} = a(x, y), \quad \frac{dy}{ds} = b(x, y), \quad \frac{du}{ds} = c(x, y) dsdx=a(x,y),dsdy=b(x,y),dsdu=c(x,y) - 解特征方程组,得到特征曲线。
- 在特征曲线上求解 u u u。
实例 :求解一阶线性偏微分方程
∂ u ∂ x + ∂ u ∂ y = 0 \frac{\partial u}{\partial x} + \frac{\partial u}{\partial y} = 0 ∂x∂u+∂y∂u=0
特征方程为:
d x d s = 1 , d y d s = 1 , d u d s = 0 \frac{dx}{ds} = 1, \quad \frac{dy}{ds} = 1, \quad \frac{du}{ds} = 0 dsdx=1,dsdy=1,dsdu=0
解得特征线为 y − x = const y - x = \text{const} y−x=const,因此解为 u ( x , y ) = f ( y − x ) u(x, y) = f(y - x) u(x,y)=f(y−x)。
数值解法
对于无法通过解析方法求解的复杂偏微分方程,数值解法是重要的求解工具。常见的方法包括:
-
有限差分法:
- 将连续的偏微分方程离散化,转化为代数方程
- 构建差分网格,定义网格点
- 在网格点上应用差分近似,得到离散方程组
- 使用数值方法(如迭代法)求解方程组
- 优点:简单直观,易于实现
- 缺点:对复杂几何形状适应性差
-
有限元法:
- 将求解区域划分为有限个单元
- 在每个单元上构造近似函数
- 通过变分原理或加权残值法建立代数方程组
- 求解方程组得到近似解
- 优点:适应复杂几何形状,精度高
- 缺点:计算量大,实现复杂
-
谱方法:
- 使用全局基函数(如傅里叶级数或切比雪夫多项式)近似解
- 通过Galerkin方法或配点法建立代数方程组
- 求解方程组得到高精度近似解
- 优点:高精度,收敛快
- 缺点:对非光滑解适应性差
实例 :使用有限差分法求解热传导方程
∂ u ∂ t = α ∂ 2 u ∂ x 2 \frac{\partial u}{\partial t} = \alpha \frac{\partial^2 u}{\partial x^2} ∂t∂u=α∂x2∂2u
离散化后得到:
u i n + 1 − u i n Δ t = α u i + 1 n − 2 u i n + u i − 1 n ( Δ x ) 2 \frac{u_i^{n+1} - u_i^n}{\Delta t} = \alpha \frac{u_{i+1}^n - 2u_i^n + u_{i-1}^n}{(\Delta x)^2} Δtuin+1−uin=α(Δx)2ui+1n−2uin+ui−1n
通过迭代计算,可以获得 u u u 在离散网格上的近似值。
边界条件与适定性
偏微分方程的求解需要考虑边界条件和初始条件,常见边界条件包括:
- 狄利克雷边界条件:指定函数在边界上的值
- 诺伊曼边界条件:指定函数在边界上的法向导数
- 混合边界条件:同时包含函数值及其导数的条件
- 周期边界条件:函数在边界上满足周期性条件
偏微分方程的适定性要求解满足:
- 存在性:至少存在一个解
- 唯一性:解是唯一的
- 稳定性:解对初始条件和边界条件连续依赖
补充说明:
- 对于不同类型的偏微分方程,需要采用不同的边界条件组合
- 适定性是偏微分方程理论研究的核心问题之一
- 在实际应用中,还需要考虑数值稳定性和收敛性等问题
第十部分:非线性系统分析
非线性系统广泛存在于工程实践中,其分析与线性系统有显著不同。本节将系统介绍非线性系统分析的三大核心方法:稳定性理论、相平面分析和混沌理论。
稳定性理论
李雅普诺夫方法
李雅普诺夫方法是分析非线性动态系统稳定性的强大工具,由俄罗斯数学家亚历山大·李雅普诺夫于1892年提出。其核心思想是通过构造一个李雅普诺夫函数 V ( x ) V(x) V(x) 来研究系统的稳定性,而无需求解系统的具体解。
李雅普诺夫函数的定义
对于一个自治非线性系统:
d x d t = f ( x ) \frac{dx}{dt} = f(x) dtdx=f(x)
其中, x ∈ R n x \in \mathbb{R}^n x∈Rn, f ( x ) f(x) f(x) 是连续可微函数。李雅普诺夫函数 V ( x ) V(x) V(x) 需要满足以下条件:
- 正定性: V ( x ) V(x) V(x) 在平衡点 x = 0 x = 0 x=0 处有极小值,即 V ( 0 ) = 0 V(0) = 0 V(0)=0 且 V ( x ) > 0 V(x) > 0 V(x)>0 对于所有 x ≠ 0 x \neq 0 x=0。
- 导数条件: V ( x ) V(x) V(x) 关于时间的导数 d V d t \frac{dV}{dt} dtdV 满足:
d V d t = ∇ V ( x ) ⋅ f ( x ) ≤ 0 \frac{dV}{dt} = \nabla V(x) \cdot f(x) \leq 0 dtdV=∇V(x)⋅f(x)≤0
稳定性判据
-
稳定性 :
如果存在李雅普诺夫函数 V ( x ) V(x) V(x) 使得 d V d t ≤ 0 \frac{dV}{dt} \leq 0 dtdV≤0,则平衡点 x = 0 x = 0 x=0 是稳定的。
-
渐近稳定性 :
如果 d V d t < 0 \frac{dV}{dt} < 0 dtdV<0 除 x = 0 x = 0 x=0 外,则平衡点是渐近稳定的,即系统状态将随着时间趋向于平衡点。
-
全局渐近稳定性 :
如果李雅普诺夫函数 V ( x ) V(x) V(x) 满足 V ( x ) → ∞ V(x) \to \infty V(x)→∞ 当 ∣ ∣ x ∣ ∣ → ∞ ||x|| \to \infty ∣∣x∣∣→∞,且 d V d t < 0 \frac{dV}{dt} < 0 dtdV<0 对所有 x ≠ 0 x \neq 0 x=0 成立,则平衡点是全局渐近稳定的。
应用实例
实例 1 :考虑一维线性系统
d x d t = − k x \frac{dx}{dt} = -kx dtdx=−kx
其中 k > 0 k > 0 k>0。选择李雅普诺夫函数 V ( x ) = 1 2 x 2 V(x) = \frac{1}{2}x^2 V(x)=21x2,则
d V d t = x ⋅ ( − k x ) = − k x 2 ≤ 0 \frac{dV}{dt} = x \cdot (-kx) = -kx^2 \leq 0 dtdV=x⋅(−kx)=−kx2≤0
因此,系统在 x = 0 x = 0 x=0 处是渐近稳定的。
实例 2 :考虑非线性系统
d x d t = − x 3 \frac{dx}{dt} = -x^3 dtdx=−x3
选择 V ( x ) = 1 2 x 2 V(x) = \frac{1}{2}x^2 V(x)=21x2,则
d V d t = x ⋅ ( − x 3 ) = − x 4 < 0 ( x ≠ 0 ) \frac{dV}{dt} = x \cdot (-x^3) = -x^4 < 0 \quad (x \neq 0) dtdV=x⋅(−x3)=−x4<0(x=0)
系统在 x = 0 x = 0 x=0 处是全局渐近稳定的。
相平面分析
相平面分析是一种直观的方法,用于研究二维非线性动态系统的行为。通过在相平面上绘制系统的轨道,可以直观地观察系统的稳定性和长期行为。
系统方程
考虑二维非线性系统:
{ d x d t = f ( x , y ) d y d t = g ( x , y ) \begin{cases} \frac{dx}{dt} = f(x, y) \\ \frac{dy}{dt} = g(x, y) \end{cases} {dtdx=f(x,y)dtdy=g(x,y)
平衡点与稳定性
-
平衡点 :满足 f ( x , y ) = 0 f(x, y) = 0 f(x,y)=0 和 g ( x , y ) = 0 g(x, y) = 0 g(x,y)=0 的点,表示系统在该点处保持不变。
-
稳定性分析 :
通过线性化系统,可以分析平衡点的稳定性。线性化系统的雅可比矩阵为:
J = ( ∂ f ∂ x ∂ f ∂ y ∂ g ∂ x ∂ g ∂ y ) J = \begin{pmatrix} \frac{\partial f}{\partial x} & \frac{\partial f}{\partial y} \\ \frac{\partial g}{\partial x} & \frac{\partial g}{\partial y} \end{pmatrix} J=(∂x∂f∂x∂g∂y∂f∂y∂g)计算雅可比矩阵的特征值,可以判断平衡点的类型和稳定性。
稳定性分类
- 稳定节点:两个实负特征值,系统状态趋向平衡点。
- 不稳定节点:两个实正特征值,系统状态远离平衡点。
- 鞍点:特征值一正一负,系统在某些方向稳定,某些方向不稳定。
- 稳定焦点:复特征值,实部为负,系统状态呈螺旋趋向平衡点。
- 不稳定焦点:复特征值,实部为正,系统状态呈螺旋远离平衡点。
应用实例
实例 1 :分析系统
{ d x d t = y d y d t = − x − y \begin{cases} \frac{dx}{dt} = y \\ \frac{dy}{dt} = -x - y \end{cases} {dtdx=ydtdy=−x−y
平衡点为 ( 0 , 0 ) (0, 0) (0,0)。雅可比矩阵为:
J = ( 0 1 − 1 − 1 ) J = \begin{pmatrix} 0 & 1 \\ -1 & -1 \end{pmatrix} J=(0−11−1)
特征方程为:
λ 2 + λ + 1 = 0 \lambda^2 + \lambda + 1 = 0 λ2+λ+1=0
解得特征值为 λ = − 1 ± − 3 2 \lambda = \frac{-1 \pm \sqrt{-3}}{2} λ=2−1±−3 ,实部为负,系统在原点为稳定焦点,系统状态将以螺旋方式趋向于平衡点。
实例 2 :Van der Pol 振子
{ d x d t = y d y d t = μ ( 1 − x 2 ) y − x \begin{cases} \frac{dx}{dt} = y \\ \frac{dy}{dt} = \mu(1-x^2)y - x \end{cases} {dtdx=ydtdy=μ(1−x2)y−x
当 μ > 0 \mu > 0 μ>0 时,系统存在稳定的极限环,表现出自激振荡行为。
混沌理论
混沌理论研究的是非线性系统中高度敏感的动态行为,即微小的初始条件变化会引起系统状态的巨大差异。混沌系统在许多自然现象和工程应用中普遍存在。
混沌系统的特征
-
敏感依赖初值 :
混沌系统对初始条件极为敏感,即使是极小的初始差异也会随着时间的推移迅速放大,导致系统行为的不可预测性。数学上,混沌系统的李雅普诺夫指数 λ \lambda λ 满足 λ > 0 \lambda > 0 λ>0。
-
拓扑混合性 :
任意两个区域内的轨道随着时间的推移会相互交织,系统的轨道在相空间中复杂交错。
-
密集不稳定周期轨道 :
混沌吸引子中包含无限多个周期轨道,这些周期轨道在相空间中密集分布。
李雅普诺夫指数
李雅普诺夫指数是衡量系统对初始条件敏感性的指标。对于一个 n n n 维系统,存在 n n n 个李雅普诺夫指数,其中最大的一个决定了系统是否具有混沌性。
定义:
λ = lim t → ∞ 1 t ln ∣ ∣ δ x ( t ) ∣ ∣ ∣ ∣ δ x ( 0 ) ∣ ∣ \lambda = \lim_{t \to \infty} \frac{1}{t} \ln \frac{||\delta x(t)||}{||\delta x(0)||} λ=t→∞limt1ln∣∣δx(0)∣∣∣∣δx(t)∣∣
如果 λ > 0 \lambda > 0 λ>0,则系统对初始条件敏感,可能表现出混沌行为。
分岔现象
分岔指的是随着系统参数的变化,系统动力学行为发生质的变化。分岔是混沌生成的前兆,它标志着系统从简单行为向复杂行为的过渡。
常见的分岔类型
-
鞍结分岔 :
系统通过参数变化,从稳定状态转变为不稳定状态,通常伴随着周期轨道的出现。
-
Hopf 分岔 :
当系统参数达到临界值时,平衡点由稳定变为不稳定,并产生一个或多个极限环。
-
周期倍增分岔 :
系统通过一系列的周期倍增过程,最终走向混沌。例如,随着参数的不断增加,系统的周期性行为会变为双周期、四周期,最终演变为不规则的混沌轨道。
应用实例
实例 :Lorenz 系统
{ d x d t = σ ( y − x ) d y d t = x ( ρ − z ) − y d z d t = x y − β z \begin{cases} \frac{dx}{dt} = \sigma (y - x) \\ \frac{dy}{dt} = x (\rho - z) - y \\ \frac{dz}{dt} = xy - \beta z \end{cases} ⎩ ⎨ ⎧dtdx=σ(y−x)dtdy=x(ρ−z)−ydtdz=xy−βz
当参数 ρ \rho ρ 增加时,系统经历从稳定点到极限环,再到混沌的分岔过程。例如,当 ρ > ρ c r i t i c a l \rho > \rho_{critical} ρ>ρcritical,系统表现出混沌行为,轨道在相空间中呈现出复杂的吸引子结构,即著名的"蝴蝶效应"。
附录
符号表与术语解释
-
f ′ ( x ) f'(x) f′(x) :函数 f ( x ) f(x) f(x) 在点 x x x 处的导数,表示瞬时变化率。在微分方程和优化问题中广泛应用。
-
∫ f ( x ) d x \int f(x) dx ∫f(x)dx :函数 f ( x ) f(x) f(x) 的不定积分,表示所有原函数的集合。在求解微分方程和计算面积、体积等问题中起关键作用。
-
det ( A ) \det(A) det(A) :矩阵 A A A 的行列式,用于判断矩阵是否可逆及其他性质。在矩阵分解和线性方程组求解中具有重要意义。
-
S n S_n Sn :全排列的集合,包含所有长度为 n n n 的排列。在组合数学和概率论中经常使用。
-
P ( x ) P(x) P(x), Q ( x ) Q(x) Q(x):一阶线性微分方程中的系数函数,视具体方程而定。在求解微分方程时用于描述方程的结构。
-
C 1 , C 2 C_1, C_2 C1,C2:常数,通常由初始条件或边界条件确定。在求解微分方程时表示通解中的任意常数。
-
李雅普诺夫指数 λ \lambda λ :衡量系统对初始条件敏感性的指标, λ > 0 \lambda > 0 λ>0 表示系统可能具有混沌行为。在非线性系统分析中用于判断系统的稳定性。
-
α , β \alpha, \beta α,β:在解决二阶常系数齐次微分方程时,表示特征方程的复数根的实部和虚部。在振动系统和热传导问题中常见。
-
Λ \Lambda Λ:通常用于表示拉格朗日乘数或其他特定参数,根据上下文定义。在优化问题和约束系统中使用。
-
V ( x ) V(x) V(x):李雅普诺夫函数,用于分析系统的稳定性。在非线性系统稳定性理论中起核心作用。
-
A , B , C A, B, C A,B,C:在不同的数学公式和方程中表示不同的变量或系数,具体含义依上下文而定。在矩阵理论、微分方程和傅里叶分析中广泛使用。
-
γ \gamma γ:通常表示路径或曲线,在复变函数中用于表示积分路径。
-
μ \mu μ:在概率论中表示期望值,在热传导方程中表示热扩散系数。
-
σ \sigma σ:在概率论中表示标准差,在Lorenz系统中表示普朗特数。
-
ρ \rho ρ:在Lorenz系统中表示瑞利数,在矩阵理论中表示谱半径。
-
ω \omega ω:在傅里叶变换中表示角频率,在振动系统中表示固有频率。
-
t t t:通常表示时间变量,在微分方程和动力系统中作为独立变量。
-
x , y , z x, y, z x,y,z:通常表示空间变量或状态变量,在偏微分方程和动力系统中使用。
-
n n n:在级数中表示项数,在矩阵中表示维度,在概率论中表示样本容量。
-
k k k:在微分方程中表示常数,在傅里叶级数中表示波数。
-
i i i :虚数单位, i 2 = − 1 i^2 = -1 i2=−1,在复变函数和傅里叶变换中使用。
-
λ \lambda λ:在特征值问题中表示特征值,在偏微分方程中表示分离变量常数。在矩阵理论和微分方程中广泛使用。
-
ϕ \phi ϕ:在傅里叶分析中表示相位角,在流体力学中表示速度势函数。在信号处理和流体力学中常见。
-
θ \theta θ:在极坐标中表示角度,在旋转矩阵中表示旋转角度。在几何变换和坐标转换中使用。
-
ϵ \epsilon ϵ:在极限理论中表示无穷小量,在优化问题中表示收敛精度。在微积分和数值分析中常见。
-
δ \delta δ:在狄拉克函数中表示脉冲函数,在变分法中表示微小变化。在信号处理和变分法中使用。
-
∇ \nabla ∇:表示梯度算子,用于计算标量场的梯度。在向量分析和场论中广泛使用。
-
∂ \partial ∂:表示偏导数,用于多元函数的微分。在偏微分方程和多变量微积分中使用。
-
∑ \sum ∑:表示求和符号,用于级数和离散求和。在级数理论和概率论中常见。
-
∏ \prod ∏:表示连乘积符号,用于序列的乘积。在组合数学和概率论中使用。
-
∞ \infty ∞:表示无穷大,用于描述极限和积分区间。在微积分和实分析中广泛使用。
-
∈ \in ∈:表示属于关系,用于描述元素与集合的关系。在集合论和数学分析中使用。
-
⊂ \subset ⊂:表示子集关系,用于描述集合之间的包含关系。在集合论和拓扑学中常见。
-
⇒ \Rightarrow ⇒:表示逻辑蕴含,用于描述命题之间的推理关系。在逻辑推理和数学证明中使用。
-
⇔ \Leftrightarrow ⇔:表示逻辑等价,用于描述命题之间的双向关系。在逻辑推理和数学证明中常见。
-
∀ \forall ∀:表示全称量词,用于描述对所有元素都成立的命题。在逻辑推理和数学证明中使用。
-
∃ \exists ∃:表示存在量词,用于描述存在某个元素满足的命题。在逻辑推理和数学证明中常见。
-
A \mathbf{A} A:表示矩阵,在矩阵理论和线性代数中广泛使用。用于表示线性变换、方程组系数等。
-
b \mathbf{b} b:在矩阵方程中表示常数向量,在线性方程组中表示右侧向量。在数值计算和优化问题中常见。
-
c \mathbf{c} c:在优化问题中表示目标函数系数向量,在傅里叶级数中表示余弦系数。在数学建模和信号处理中使用。
-
Q \mathbf{Q} Q:在二次规划中表示二次项系数矩阵,在矩阵分解中表示正交矩阵。在最优化和数值分析中广泛使用。
-
R \mathbf{R} R:在QR分解中表示上三角矩阵,在控制理论中表示状态空间矩阵。在数值计算和系统分析中使用。
-
U , V \mathbf{U}, \mathbf{V} U,V:在奇异值分解中表示正交矩阵,在矩阵理论中表示特征向量矩阵。在数据分析和降维技术中常见。
-
Σ \Sigma Σ:在奇异值分解中表示对角矩阵,在概率论中表示协方差矩阵。在统计分析和机器学习中广泛使用。
-
x \mathbf{x} x:在优化问题中表示决策变量,在微分方程中表示状态变量。在数学建模和系统分析中常见。
-
y \mathbf{y} y:在控制系统中表示输出变量,在回归分析中表示响应变量。在系统识别和数据分析中使用。
-
z \mathbf{z} z:在复变函数中表示复变量,在状态空间模型中表示测量变量。在信号处理和系统控制中常见。
-
f \mathbf{f} f:在微分方程中表示向量场,在优化问题中表示目标函数。在动力系统和数学建模中使用。
-
g \mathbf{g} g:在约束优化中表示约束函数,在微分方程中表示非线性项。在最优化和系统分析中常见。
-
h \mathbf{h} h:在控制系统中表示观测函数,在机器学习中表示假设函数。在系统识别和人工智能中使用。
-
J \mathbf{J} J:在优化问题中表示雅可比矩阵,在控制理论中表示性能指标。在数值计算和系统优化中广泛使用。
-
H \mathbf{H} H:在优化问题中表示海森矩阵,在控制理论中表示哈密顿函数。在数值优化和物理建模中使用。
-
P \mathbf{P} P:在控制理论中表示李雅普诺夫函数矩阵,在概率论中表示转移概率矩阵。在系统稳定性和马尔可夫链分析中常见。
-
K \mathbf{K} K:在控制理论中表示反馈增益矩阵,在优化问题中表示核矩阵。在控制系统设计和机器学习中使用。
-
L \mathbf{L} L:在矩阵分解中表示下三角矩阵,在图论中表示拉普拉斯矩阵。在数值计算和网络分析中常见。
-
M \mathbf{M} M:在力学系统中表示质量矩阵,在数值分析中表示预处理矩阵。在物理建模和数值计算中使用。
-
N \mathbf{N} N:在数值分析中表示迭代矩阵,在概率论中表示正态分布矩阵。在数值计算和统计分析中常见。
-
D \mathbf{D} D:在矩阵理论中表示对角矩阵,在微分方程中表示阻尼矩阵。在数值计算和物理建模中使用。
-
E \mathbf{E} E:在误差分析中表示误差矩阵,在控制理论中表示状态估计矩阵。在系统识别和数值分析中常见。
-
F \mathbf{F} F:在控制理论中表示状态转移矩阵,在数值分析中表示迭代矩阵。在系统分析和数值计算中使用。
-
G \mathbf{G} G:在控制理论中表示控制增益矩阵,在优化问题中表示梯度矩阵。在控制系统设计和数值优化中常见。
-
I \mathbf{I} I:在矩阵理论中表示单位矩阵,在控制理论中表示惯性矩阵。在数值计算和物理建模中使用。
-
O \mathbf{O} O:在矩阵理论中表示零矩阵,在控制理论中表示观测矩阵。在数值计算和系统分析中常见。
-
S \mathbf{S} S:在矩阵理论中表示对称矩阵,在控制理论中表示灵敏度矩阵。在数值优化和系统分析中使用。
-
T \mathbf{T} T:在矩阵理论中表示变换矩阵,在控制理论中表示传递函数矩阵。在数值计算和系统分析中常见。
-
W \mathbf{W} W:在优化问题中表示权重矩阵,在控制理论中表示噪声协方差矩阵。在数值优化和系统识别中使用。
-
X \mathbf{X} X:在状态空间模型中表示状态矩阵,在优化问题中表示决策变量矩阵。在系统分析和数学建模中常见。
-
Y \mathbf{Y} Y:在控制理论中表示输出矩阵,在优化问题中表示对偶变量矩阵。在系统识别和数值优化中使用。
-
Z \mathbf{Z} Z:在控制理论中表示测量矩阵,在优化问题中表示拉格朗日乘子矩阵。在系统分析和数值优化中常见。
-
α \mathbf{\alpha} α:在优化问题中表示步长参数,在控制理论中表示衰减系数。在数值计算和系统分析中使用。
-
β \mathbf{\beta} β:在回归分析中表示回归系数,在控制理论中表示阻尼系数。在统计分析和系统建模中常见。
-
γ \mathbf{\gamma} γ:在优化问题中表示惩罚参数,在控制理论中表示增益系数。在数值优化和系统设计中使用。
-
δ \mathbf{\delta} δ:在数值分析中表示扰动参数,在控制理论中表示偏差系数。在数值计算和系统分析中常见。
-
ϵ \mathbf{\epsilon} ϵ:在数值分析中表示误差项,在优化问题中表示收敛阈值。在数值计算和数学建模中使用。
-
ζ \mathbf{\zeta} ζ:在控制理论中表示阻尼比,在数值分析中表示迭代参数。在系统分析和数值计算中常见。
-
η \mathbf{\eta} η:在优化问题中表示学习率,在控制理论中表示效率系数。在数值优化和系统设计中使用。
-
θ \mathbf{\theta} θ:在控制理论中表示角度变量,在优化问题中表示参数向量。在系统分析和数学建模中常见。