工程数学速记手册(下)

工程数学速记手册(下)

第六部分:概率与统计

概率基础

概率空间与事件

概率空间 是概率论中的基本概念,用于描述随机试验的所有可能结果及其概率。一个概率空间可以表示为三元组 ( Ω , F , P ) (\Omega, \mathcal{F}, P) (Ω,F,P),其中:

  • Ω \Omega Ω 是样本空间,表示所有可能的实验结果。
  • F \mathcal{F} F 是事件的集合,满足σ-代数的性质,即包含空集、对补集运算封闭、对可数并运算封闭。
  • P P P 是概率测度,将事件集合映射到 [ 0 , 1 ] [0,1] [0,1] 之间的数,满足概率公理。

事件 是样本空间 Ω \Omega Ω 的子集,表示随机试验可能出现的结果组合。事件可以是简单事件(单个结果),也可以是复合事件(多个结果的集合)。事件运算包括并、交、补等,满足德摩根定律。

概率公理

概率公理是建立概率理论的基础,通常包括以下三个基本公理:

  1. 非负性公理

    对于任意事件 A A A,有:
    P ( A ) ≥ 0 P(A) \geq 0 P(A)≥0

  2. 规范化公理

    整个样本空间的概率为 1,即:
    P ( Ω ) = 1 P(\Omega) = 1 P(Ω)=1

  3. 可列可加公理

    对于一列两两互斥的事件 A 1 , A 2 , ... A_1, A_2, \ldots A1,A2,...,有:
    P ( ⋃ i = 1 ∞ A i ) = ∑ i = 1 ∞ P ( A i ) P\left(\bigcup_{i=1}^{\infty} A_i\right) = \sum_{i=1}^{\infty} P(A_i) P(i=1⋃∞Ai)=i=1∑∞P(Ai)

推论

  • P ( ∅ ) = 0 P(\emptyset) = 0 P(∅)=0
  • P ( A c ) = 1 − P ( A ) P(A^c) = 1 - P(A) P(Ac)=1−P(A)
  • 若 A ⊆ B A \subseteq B A⊆B,则 P ( A ) ≤ P ( B ) P(A) \leq P(B) P(A)≤P(B)
  • P ( A ∪ B ) = P ( A ) + P ( B ) − P ( A ∩ B ) P(A \cup B) = P(A) + P(B) - P(A \cap B) P(A∪B)=P(A)+P(B)−P(A∩B)
  • 容斥原理:对于任意n个事件,有:
    P ( ⋃ i = 1 n A i ) = ∑ i = 1 n P ( A i ) − ∑ 1 ≤ i < j ≤ n P ( A i ∩ A j ) + ⋯ + ( − 1 ) n + 1 P ( ⋂ i = 1 n A i ) P\left(\bigcup_{i=1}^{n} A_i\right) = \sum_{i=1}^{n} P(A_i) - \sum_{1\leq i<j\leq n} P(A_i \cap A_j) + \cdots + (-1)^{n+1} P\left(\bigcap_{i=1}^{n} A_i\right) P(i=1⋃nAi)=i=1∑nP(Ai)−1≤i<j≤n∑P(Ai∩Aj)+⋯+(−1)n+1P(i=1⋂nAi)
随机变量

随机变量 是将样本空间 Ω \Omega Ω 映射到实数集的函数,用于量化随机试验的结果。根据随机变量取值的性质,随机变量可分为:

离散随机变量

如果随机变量 X X X 只能取有限或可数无限多个离散值,则称为离散随机变量。其概率质量函数(PMF)定义为:
P ( X = x i ) = p i P(X = x_i) = p_i P(X=xi)=pi

其中, x i x_i xi 是 X X X 的可能取值, p i p_i pi 满足 p i ≥ 0 p_i \geq 0 pi≥0 且 ∑ p i = 1 \sum p_i = 1 ∑pi=1。

常见分布

  • 伯努利分布
    P ( X = 1 ) = p , P ( X = 0 ) = 1 − p P(X = 1) = p, \quad P(X = 0) = 1 - p P(X=1)=p,P(X=0)=1−p

  • 二项分布 ( n n n 次独立试验的成功次数):
    P ( X = k ) = ( n k ) p k ( 1 − p ) n − k , k = 0 , 1 , ... , n P(X = k) = \binom{n}{k} p^k (1 - p)^{n - k}, \quad k = 0,1,\ldots,n P(X=k)=(kn)pk(1−p)n−k,k=0,1,...,n

  • 泊松分布 (单位时间内事件发生的次数):
    P ( X = k ) = λ k e − λ k ! , k = 0 , 1 , 2 , ... P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}, \quad k = 0,1,2,\ldots P(X=k)=k!λke−λ,k=0,1,2,...

  • 几何分布 (首次成功所需的试验次数):
    P ( X = k ) = ( 1 − p ) k − 1 p , k = 1 , 2 , 3 , ... P(X = k) = (1 - p)^{k-1} p, \quad k = 1,2,3,\ldots P(X=k)=(1−p)k−1p,k=1,2,3,...

连续随机变量

如果随机变量 X X X 的取值为连续区间内的任意实数,则称为连续随机变量。其概率密度函数(PDF)定义为:
f X ( x ) = d d x P ( X ≤ x ) f_X(x) = \frac{d}{dx} P(X \leq x) fX(x)=dxdP(X≤x)

满足:
∫ − ∞ ∞ f X ( x ) d x = 1 \int_{-\infty}^{\infty} f_X(x) dx = 1 ∫−∞∞fX(x)dx=1

常见分布

  • 正态分布
    f X ( x ) = 1 2 π σ e − ( x − μ ) 2 2 σ 2 , x ∈ R f_X(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{ -\frac{(x - \mu)^2}{2\sigma^2} }, \quad x \in \mathbb{R} fX(x)=2π σ1e−2σ2(x−μ)2,x∈R

    其中, μ \mu μ 为均值, σ \sigma σ 为标准差。

  • 指数分布
    f X ( x ) = λ e − λ x , x ≥ 0 f_X(x) = \lambda e^{ -\lambda x }, \quad x \geq 0 fX(x)=λe−λx,x≥0

    其中, λ > 0 \lambda > 0 λ>0 是参数。

  • 均匀分布
    f X ( x ) = { 1 b − a a ≤ x ≤ b 0 其他 f_X(x) = \begin{cases} \frac{1}{b-a} & a \leq x \leq b \\ 0 & \text{其他} \end{cases} fX(x)={b−a10a≤x≤b其他

  • 伽马分布
    f X ( x ) = β α Γ ( α ) x α − 1 e − β x , x > 0 f_X(x) = \frac{\beta^\alpha}{\Gamma(\alpha)} x^{\alpha-1} e^{-\beta x}, \quad x > 0 fX(x)=Γ(α)βαxα−1e−βx,x>0

    其中, α > 0 \alpha > 0 α>0 为形状参数, β > 0 \beta > 0 β>0 为尺度参数。

统计分析

统计分析主要分为描述统计推断统计两大类,用于数据的整理与分析、参数估计与假设检验等。

描述统计

描述统计用于对收集到的数据进行总结和描述,主要通过计算各种统计量来体现数据的特征。

期望与方差
  • 期望(均值)

    表示随机变量取值的平均水平。对于离散随机变量 X X X,期望为:
    E ( X ) = ∑ i x i P ( X = x i ) E(X) = \sum_{i} x_i P(X = x_i) E(X)=i∑xiP(X=xi)

    对于连续随机变量 X X X,期望为:
    E ( X ) = ∫ − ∞ ∞ x f X ( x ) d x E(X) = \int_{-\infty}^{\infty} x f_X(x) dx E(X)=∫−∞∞xfX(x)dx

  • 方差

    描述随机变量围绕期望的离散程度。定义为:
    Var ( X ) = E [ ( X − E ( X ) ) 2 ] = E ( X 2 ) − [ E ( X ) ] 2 \text{Var}(X) = E[(X - E(X))^2] = E(X^2) - [E(X)]^2 Var(X)=E[(X−E(X))2]=E(X2)−[E(X)]2

性质

  • Var ( a X + b ) = a 2 Var ( X ) \text{Var}(aX + b) = a^2\text{Var}(X) Var(aX+b)=a2Var(X)
  • 若 X X X 和 Y Y Y 独立,则 Var ( X + Y ) = Var ( X ) + Var ( Y ) \text{Var}(X + Y) = \text{Var}(X) + \text{Var}(Y) Var(X+Y)=Var(X)+Var(Y)
  • 切比雪夫不等式:对于任意 k > 0 k > 0 k>0,
    P ( ∣ X − μ ∣ ≥ k σ ) ≤ 1 k 2 P(|X - \mu| \geq k\sigma) \leq \frac{1}{k^2} P(∣X−μ∣≥kσ)≤k21
常用统计量
  • 中位数:将数据分为上下两部分的数值。
  • 众数:数据中出现次数最多的值。
  • 标准差:方差的平方根,表示数据的离散程度。
  • 偏度:描述数据分布的不对称性。
  • 峰度:描述数据分布的尖峭程度。
  • 分位数:将数据按比例划分的数值点,如四分位数、百分位数等。
推断统计

推断统计通过样本数据对总体参数进行估计和假设检验,主要包括参数估计和假设检验两部分。

参数估计

估计总体参数的常用方法包括点估计和区间估计。

  • 点估计 :用样本统计量直接估计总体参数。例如,样本均值 x ˉ = 1 n ∑ i = 1 n x i \bar{x} = \frac{1}{n}\sum_{i=1}^{n} x_i xˉ=n1∑i=1nxi 是总体均值 μ \mu μ 的点估计。

  • 区间估计 :在一定置信度下,建立参数的估计区间。例如,95%置信区间为:
    x ˉ ± z α 2 σ n \bar{x} \pm z_{\frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}} xˉ±z2αn σ

    其中, z α 2 z_{\frac{\alpha}{2}} z2α 是标准正态分布的临界值, σ \sigma σ 是总体标准差, n n n 是样本容量。

估计量的评价标准

  • 无偏性: E ( θ ^ ) = θ E(\hat{\theta}) = \theta E(θ^)=θ
  • 有效性:方差最小
  • 一致性:当 n → ∞ n \to \infty n→∞ 时, θ ^ → θ \hat{\theta} \to \theta θ^→θ
  • 充分性:估计量包含样本中关于参数的所有信息
假设检验

假设检验用于根据样本数据对关于总体参数的假设进行判定。

基本步骤

  1. 提出假设 :包括原假设 H 0 H_0 H0 和备择假设 H 1 H_1 H1。
  2. 选择显著性水平 :通常选用 α = 0.05 \alpha = 0.05 α=0.05。
  3. 计算检验统计量 :根据样本数据计算统计量,例如 t t t 统计量。
  4. 做出决策:比较统计量与临界值,决定是否拒绝原假设。

实例

假设要检验某工厂生产的零件直径是否符合设计要求( μ = 10 \mu = 10 μ=10 mm),采样 n = 30 n = 30 n=30 个零件,计算样本均值 x ˉ = 10.2 \bar{x} = 10.2 xˉ=10.2 mm,样本标准差 s = 0.3 s = 0.3 s=0.3 mm,显著性水平 α = 0.05 \alpha = 0.05 α=0.05。

  1. 原假设 H 0 : μ = 10 H_0: \mu = 10 H0:μ=10,备择假设 H 1 : μ ≠ 10 H_1: \mu \neq 10 H1:μ=10。
  2. 计算 t t t 统计量:
    t = x ˉ − μ s / n = 10.2 − 10 0.3 / 30 ≈ 3.65 t = \frac{\bar{x} - \mu}{s / \sqrt{n}} = \frac{10.2 - 10}{0.3 / \sqrt{30}} \approx 3.65 t=s/n xˉ−μ=0.3/30 10.2−10≈3.65
  3. 查找临界值 t α / 2 = 2.045 t_{\alpha/2} = 2.045 tα/2=2.045(自由度为29)。
  4. 由于 ∣ t ∣ = 3.65 > 2.045 |t| = 3.65 > 2.045 ∣t∣=3.65>2.045,拒绝原假设,认为生产过程中存在偏差。

注意事项

  • 第一类错误:拒绝正确的原假设
  • 第二类错误:接受错误的原假设
  • 检验功效:1 - 第二类错误概率

第七部分:傅里叶分析

傅里叶级数

级数展开
周期函数的傅里叶展开

傅里叶级数是法国数学家傅里叶提出的重要数学工具,它将周期函数表示为正弦和余弦函数的无穷级数之和。设 f ( x ) f(x) f(x) 是一个周期为 2 π 2\pi 2π 的函数,其傅里叶级数展开式为:
f ( x ) = a 0 2 + ∑ n = 1 ∞ ( a n cos ⁡ ( n x ) + b n sin ⁡ ( n x ) ) f(x) = \frac{a_0}{2} + \sum_{n=1}^{\infty} \left( a_n \cos(nx) + b_n \sin(nx) \right) f(x)=2a0+n=1∑∞(ancos(nx)+bnsin(nx))

其中, a 0 a_0 a0 表示直流分量, a n a_n an 和 b n b_n bn 分别表示各次谐波的余弦和正弦分量幅度。

对于一般周期 T T T 的函数,傅里叶级数可表示为:
f ( x ) = a 0 2 + ∑ n = 1 ∞ ( a n cos ⁡ ( 2 n π x T ) + b n sin ⁡ ( 2 n π x T ) ) f(x) = \frac{a_0}{2} + \sum_{n=1}^{\infty} \left( a_n \cos(\frac{2n\pi x}{T}) + b_n \sin(\frac{2n\pi x}{T}) \right) f(x)=2a0+n=1∑∞(ancos(T2nπx)+bnsin(T2nπx))

傅里叶级数的存在条件

傅里叶级数的收敛性由戴利克雷条件保证,要求函数 f ( x ) f(x) f(x) 满足:

  1. 在一个周期内有有限个极值
  2. 在一个周期内有有限个第一类间断点
  3. 在一个周期内绝对可积

当这些条件满足时,傅里叶级数在连续点收敛于函数值,在间断点收敛于左右极限的平均值。

傅里叶系数计算
正交性与系数求解

傅里叶系数的计算基于三角函数系的正交性。对于周期为 2 π 2\pi 2π 的函数 f ( x ) f(x) f(x),其傅里叶系数计算公式为:
a n = 1 π ∫ − π π f ( x ) cos ⁡ ( n x ) d x ( n = 0 , 1 , 2 , ⋯   ) a_n = \frac{1}{\pi} \int_{-\pi}^{\pi} f(x) \cos(nx) dx \quad (n = 0,1,2,\cdots) an=π1∫−ππf(x)cos(nx)dx(n=0,1,2,⋯)
b n = 1 π ∫ − π π f ( x ) sin ⁡ ( n x ) d x ( n = 1 , 2 , 3 , ⋯   ) b_n = \frac{1}{\pi} \int_{-\pi}^{\pi} f(x) \sin(nx) dx \quad (n = 1,2,3,\cdots) bn=π1∫−ππf(x)sin(nx)dx(n=1,2,3,⋯)

对于奇函数和偶函数,傅里叶级数可以简化:

  • 奇函数: a n = 0 a_n = 0 an=0,只有正弦项
  • 偶函数: b n = 0 b_n = 0 bn=0,只有余弦项
正交性原理

三角函数系的正交性体现在:
∫ − π π cos ⁡ ( n x ) cos ⁡ ( m x ) d x = { 0 n ≠ m π n = m ≠ 0 2 π n = m = 0 \int_{-\pi}^{\pi} \cos(nx) \cos(mx) dx = \begin{cases} 0 & n \neq m \\ \pi & n = m \neq 0 \\ 2\pi & n = m = 0 \end{cases} ∫−ππcos(nx)cos(mx)dx=⎩ ⎨ ⎧0π2πn=mn=m=0n=m=0
∫ − π π sin ⁡ ( n x ) sin ⁡ ( m x ) d x = { 0 n ≠ m π n = m \int_{-\pi}^{\pi} \sin(nx) \sin(mx) dx = \begin{cases} 0 & n \neq m \\ \pi & n = m \end{cases} ∫−ππsin(nx)sin(mx)dx={0πn=mn=m
∫ − π π sin ⁡ ( n x ) cos ⁡ ( m x ) d x = 0 ∀ n , m \int_{-\pi}^{\pi} \sin(nx) \cos(mx) dx = 0 \quad \forall n, m ∫−ππsin(nx)cos(mx)dx=0∀n,m

这种正交性保证了傅里叶系数的唯一性,并简化了计算过程。

傅里叶变换
连续傅里叶变换

傅里叶变换将时域信号转换为频域表示,定义为:
F ( ω ) = ∫ − ∞ ∞ f ( t ) e − i ω t d t F(\omega) = \int_{-\infty}^{\infty} f(t) e^{-i\omega t} dt F(ω)=∫−∞∞f(t)e−iωtdt

其逆变换为:
f ( t ) = 1 2 π ∫ − ∞ ∞ F ( ω ) e i ω t d ω f(t) = \frac{1}{2\pi} \int_{-\infty}^{\infty} F(\omega) e^{i\omega t} d\omega f(t)=2π1∫−∞∞F(ω)eiωtdω

基本性质
  1. 线性性 : F [ a f ( t ) + b g ( t ) ] = a F ( ω ) + b G ( ω ) \mathcal{F}[af(t)+bg(t)] = aF(\omega)+bG(\omega) F[af(t)+bg(t)]=aF(ω)+bG(ω)
  2. 时移性 : F [ f ( t − t 0 ) ] = F ( ω ) e − i ω t 0 \mathcal{F}[f(t-t_0)] = F(\omega)e^{-i\omega t_0} F[f(t−t0)]=F(ω)e−iωt0
  3. 频移性 : F [ f ( t ) e i ω 0 t ] = F ( ω − ω 0 ) \mathcal{F}[f(t)e^{i\omega_0 t}] = F(\omega-\omega_0) F[f(t)eiω0t]=F(ω−ω0)
  4. 尺度变换 : F [ f ( a t ) ] = 1 ∣ a ∣ F ( ω a ) \mathcal{F}[f(at)] = \frac{1}{|a|}F(\frac{\omega}{a}) F[f(at)]=∣a∣1F(aω)
  5. 卷积定理:时域卷积对应频域乘积
  6. Parseval定理:时域和频域能量守恒
应用
信号处理

傅里叶变换在信号处理中用于:

  • 频谱分析:识别信号中的频率成分
  • 滤波器设计:实现低通、高通、带通等滤波器
  • 信号去噪:分离有用信号和噪声
  • 调制解调:在通信系统中实现信号的调制与解调
  • 图像处理:在频域进行图像增强和压缩
系统分析

在系统分析中,傅里叶变换用于:

  • 研究LTI系统的频率响应
  • 分析系统的稳定性和性能
  • 设计控制系统
  • 系统辨识:通过频域分析确定系统模型
  • 故障诊断:通过频谱特征识别系统故障
实例应用

实例 1:信号的频谱分析

考虑信号 f ( t ) = 2 cos ⁡ ( 5 t ) + 3 sin ⁡ ( 2 t ) f(t) = 2\cos(5t) + 3\sin(2t) f(t)=2cos(5t)+3sin(2t),其傅里叶变换为:
F ( ω ) = 2 π [ δ ( ω − 5 ) + δ ( ω + 5 ) ] + 3 π i [ δ ( ω − 2 ) − δ ( ω + 2 ) ] F(\omega) = 2\pi[\delta(\omega-5)+\delta(\omega+5)] + \frac{3\pi}{i}[\delta(\omega-2)-\delta(\omega+2)] F(ω)=2π[δ(ω−5)+δ(ω+5)]+i3π[δ(ω−2)−δ(ω+2)]

通过傅里叶变换,可以清晰地识别出信号中包含的5 rad/s和2 rad/s两个频率成分。

实例 2:系统的频率响应

对于RC低通滤波器,其传递函数为:
H ( ω ) = 1 1 + i ω R C H(\omega) = \frac{1}{1+i\omega RC} H(ω)=1+iωRC1

通过傅里叶变换,可以分析系统对不同频率信号的衰减特性,确定截止频率为 ω c = 1 R C \omega_c = \frac{1}{RC} ωc=RC1,为滤波器设计提供理论依据。

实例 3:图像压缩

在JPEG图像压缩中,首先对图像进行分块,然后对每个8×8的块进行离散余弦变换(DCT),将图像从空间域转换到频域。通过量化高频分量,保留主要低频信息,从而实现图像压缩。

实例 4:通信系统

在正交频分复用(OFDM)系统中,利用快速傅里叶变换(FFT)将高速数据流分解为多个低速子载波,提高了频谱利用率和抗干扰能力,广泛应用于4G/5G移动通信系统。

第八部分:矩阵理论

矩阵理论是工程数学的核心内容之一,为线性代数、优化理论等提供了重要的数学工具。本节将深入探讨矩阵分解、线性变换和最优化问题等关键内容,从基本概念到实际应用,由浅入深地展开讨论。

矩阵分解

矩阵分解是将复杂矩阵分解为若干更简单矩阵乘积的过程,这种分解不仅便于计算和分析,还能揭示矩阵的内在结构特征。常见的矩阵分解方法包括LU分解、QR分解和奇异值分解(SVD),每种方法都有其特定的应用场景和优势。

LU分解

LU分解是求解线性方程组的基础方法,它将一个方阵 A A A分解为一个下三角矩阵 L L L和一个上三角矩阵 U U U的乘积:
A = L U A = LU A=LU

其中, L L L为单位下三角矩阵(主对角线元素为1), U U U为上三角矩阵。LU分解在求解线性方程组、计算行列式和逆矩阵等方面有广泛应用。

计算方法

LU分解通常通过高斯消元法实现,具体步骤如下:

  1. 对矩阵 A A A进行高斯消元,得到上三角矩阵 U U U
  2. 在消元过程中记录下每一步的系数,构造出下三角矩阵 L L L
  3. 若出现主元为零的情况,需要进行行交换(引入置换矩阵 P P P,即PLU分解)
实例

考虑矩阵

A = ( 2 3 1 4 7 7 6 18 22 ) A = \begin{pmatrix} 2 & 3 & 1 \\ 4 & 7 & 7 \\ 6 & 18 & 22 \end{pmatrix} A= 24637181722

通过LU分解,可以得到

L = ( 1 0 0 2 1 0 3 3 1 ) , U = ( 2 3 1 0 1 5 0 0 2 ) L = \begin{pmatrix} 1 & 0 & 0 \\ 2 & 1 & 0 \\ 3 & 3 & 1 \end{pmatrix}, \quad U = \begin{pmatrix} 2 & 3 & 1 \\ 0 & 1 & 5 \\ 0 & 0 & 2 \end{pmatrix} L= 123013001 ,U= 200310152

验证:

L U = ( 1 0 0 2 1 0 3 3 1 ) ( 2 3 1 0 1 5 0 0 2 ) = ( 2 3 1 4 7 7 6 18 22 ) = A LU = \begin{pmatrix} 1 & 0 & 0 \\ 2 & 1 & 0 \\ 3 & 3 & 1 \end{pmatrix} \begin{pmatrix} 2 & 3 & 1 \\ 0 & 1 & 5 \\ 0 & 0 & 2 \end{pmatrix} = \begin{pmatrix} 2 & 3 & 1 \\ 4 & 7 & 7 \\ 6 & 18 & 22 \end{pmatrix} = A LU= 123013001 200310152 = 24637181722 =A

QR分解

QR分解是解决最小二乘问题和计算特征值的重要工具,它将一个矩阵 A A A分解为一个正交矩阵 Q Q Q和一个上三角矩阵 R R R的乘积:
A = Q R A = QR A=QR

其中, Q Q Q满足 Q T Q = I Q^T Q = I QTQ=I, R R R为上三角矩阵。QR分解在数值线性代数中具有重要地位。

计算方法

QR分解的实现方法主要有:

  1. 格拉姆-施密特正交化:逐步构造正交基
  2. 豪斯霍尔德变换:通过反射变换实现正交化
  3. 吉文斯旋转:通过平面旋转实现正交化
实例

对于矩阵

A = ( 1 1 1 − 1 1 1 ) A = \begin{pmatrix} 1 & 1 \\ 1 & -1 \\ 1 & 1 \end{pmatrix} A= 1111−11

其QR分解为

Q = ( 1 3 1 2 1 3 − 1 2 1 3 0 ) , R = ( 3 1 2 0 2 ) Q = \begin{pmatrix} \frac{1}{\sqrt{3}} & \frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{3}} & -\frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{3}} & 0 \end{pmatrix}, \quad R = \begin{pmatrix} \sqrt{3} & \frac{1}{\sqrt{2}} \\ 0 & \sqrt{2} \end{pmatrix} Q= 3 13 13 12 1−2 10 ,R=(3 02 12 )

验证:

Q R = ( 1 3 1 2 1 3 − 1 2 1 3 0 ) ( 3 1 2 0 2 ) = ( 1 1 1 − 1 1 1 ) = A QR = \begin{pmatrix} \frac{1}{\sqrt{3}} & \frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{3}} & -\frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{3}} & 0 \end{pmatrix} \begin{pmatrix} \sqrt{3} & \frac{1}{\sqrt{2}} \\ 0 & \sqrt{2} \end{pmatrix}= \begin{pmatrix} 1 & 1 \\ 1 & -1 \\ 1 & 1 \end{pmatrix} = A QR= 3 13 13 12 1−2 10 (3 02 12 )= 1111−11 =A

奇异值分解(SVD)

奇异值分解是矩阵分析中最强大的工具之一,它将任意矩阵 A A A分解为三个矩阵的乘积:
A = U Σ V T A = U \Sigma V^T A=UΣVT

其中, U U U和 V V V是正交矩阵, Σ \Sigma Σ是一个对角矩阵,其对角线上的元素称为奇异值。SVD在数据压缩、噪声过滤、主成分分析等领域有广泛应用。

计算方法

SVD的计算通常通过:

  1. 双谱算法:适用于中小规模矩阵
  2. 雅可比旋转法:适用于对称矩阵
  3. 分治法:适用于大规模矩阵
实例

对于矩阵

A = ( 3 1 1 3 ) A = \begin{pmatrix} 3 & 1 \\ 1 & 3 \end{pmatrix} A=(3113)

其奇异值分解为

U = ( 1 2 − 1 2 1 2 1 2 ) , Σ = ( 4 0 0 2 ) , V T = U T U = \begin{pmatrix} \frac{1}{\sqrt{2}} & -\frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}} \end{pmatrix}, \quad \Sigma = \begin{pmatrix} 4 & 0 \\ 0 & 2 \end{pmatrix}, \quad V^T = U^T U=(2 12 1−2 12 1),Σ=(4002),VT=UT

验证:

U Σ V T = ( 1 2 − 1 2 1 2 1 2 ) ( 4 0 0 2 ) ( 1 2 1 2 − 1 2 1 2 ) = ( 3 1 1 3 ) = A U \Sigma V^T = \begin{pmatrix} \frac{1}{\sqrt{2}} & -\frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}} \end{pmatrix} \begin{pmatrix} 4 & 0 \\ 0 & 2 \end{pmatrix} \begin{pmatrix} \frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}} \\ -\frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}} \end{pmatrix}= \begin{pmatrix} 3 & 1 \\ 1 & 3 \end{pmatrix} = A UΣVT=(2 12 1−2 12 1)(4002)(2 1−2 12 12 1)=(3113)=A

应用

矩阵理论在工程领域中有广泛的应用,主要包括线性变换和最优化问题等。

线性变换

线性变换是保持向量加法和标量乘法的映射,其可以通过矩阵来表示和分析。

矩阵与线性映射

给定一个线性变换 T : R n → R m T: \mathbb{R}^n \to \mathbb{R}^m T:Rn→Rm,存在唯一的矩阵 A ∈ R m × n A \in \mathbb{R}^{m \times n} A∈Rm×n,使得
T ( x ) = A x T(\mathbf{x}) = A\mathbf{x} T(x)=Ax

其中, x ∈ R n \mathbf{x} \in \mathbb{R}^n x∈Rn为输入向量, A x ∈ R m A\mathbf{x} \in \mathbb{R}^m Ax∈Rm为输出向量。

基本性质
  • 保持加法 : T ( x + y ) = T ( x ) + T ( y ) T(\mathbf{x} + \mathbf{y}) = T(\mathbf{x}) + T(\mathbf{y}) T(x+y)=T(x)+T(y)
  • 保持标量乘法 : T ( c x ) = c T ( x ) T(c\mathbf{x}) = cT(\mathbf{x}) T(cx)=cT(x)
  • 组合性 :若 T 1 T_1 T1和 T 2 T_2 T2分别由矩阵 A A A和 B B B表示,则 T 1 ∘ T 2 T_1 \circ T_2 T1∘T2由矩阵 B A BA BA表示
  • 核与像空间 :核空间 ker ⁡ ( T ) \ker(T) ker(T)和像空间 im ⁡ ( T ) \operatorname{im}(T) im(T)是重要的子空间
  • 秩-零度定理 : dim ⁡ ( ker ⁡ ( T ) ) + dim ⁡ ( im ⁡ ( T ) ) = n \dim(\ker(T)) + \dim(\operatorname{im}(T)) = n dim(ker(T))+dim(im(T))=n
实例

考虑线性变换 T : R 2 → R 2 T: \mathbb{R}^2 \to \mathbb{R}^2 T:R2→R2,其矩阵表示为
A = ( 2 0 0 3 ) A = \begin{pmatrix} 2 & 0 \\ 0 & 3 \end{pmatrix} A=(2003)

则对于向量 x = ( x y ) \mathbf{x} = \begin{pmatrix} x \\ y \end{pmatrix} x=(xy),有
T ( x ) = A x = ( 2 x 3 y ) T(\mathbf{x}) = A\mathbf{x} = \begin{pmatrix} 2x \\ 3y \end{pmatrix} T(x)=Ax=(2x3y)

此变换对应于 x x x轴方向的缩放因子为2, y y y轴方向的缩放因子为3。

最优化问题

最优化问题旨在找到一个目标函数的最优值(最小值或最大值),通常在一定约束条件下进行。

二次规划与拉格朗日乘数法

二次规划是一类特殊的最优化问题,其目标函数为二次函数,约束条件为线性不等式或等式。
min ⁡ x 1 2 x T Q x + c T x \min_{\mathbf{x}} \frac{1}{2}\mathbf{x}^T Q \mathbf{x} + \mathbf{c}^T \mathbf{x} xmin21xTQx+cTx

受限于
A x ≤ b A\mathbf{x} \leq \mathbf{b} Ax≤b

其中, Q Q Q是对称正定矩阵,确保目标函数的凸性。

拉格朗日乘数法

拉格朗日乘数法是一种用于求解带等式约束的最优化问题的方法。对于目标函数 f ( x ) f(\mathbf{x}) f(x),约束条件 g ( x ) = 0 g(\mathbf{x}) = 0 g(x)=0,构建拉格朗日函数:
L ( x , λ ) = f ( x ) + λ g ( x ) \mathcal{L}(\mathbf{x}, \lambda) = f(\mathbf{x}) + \lambda g(\mathbf{x}) L(x,λ)=f(x)+λg(x)

通过对 L \mathcal{L} L分别对 x \mathbf{x} x和 λ \lambda λ求偏导并令其为零,得到最优解。

实例

求解以下二次规划问题:
min ⁡ x x 1 2 + x 2 2 \min_{\mathbf{x}} x_1^2 + x_2^2 xminx12+x22

受限于
x 1 + x 2 ≥ 1 x_1 + x_2 \geq 1 x1+x2≥1

通过构建拉格朗日函数:
L ( x 1 , x 2 , λ ) = x 1 2 + x 2 2 + λ ( 1 − x 1 − x 2 ) \mathcal{L}(x_1, x_2, \lambda) = x_1^2 + x_2^2 + \lambda (1 - x_1 - x_2) L(x1,x2,λ)=x12+x22+λ(1−x1−x2)

求解KKT条件:
∂ L ∂ x 1 = 2 x 1 − λ = 0 ∂ L ∂ x 2 = 2 x 2 − λ = 0 ∂ L ∂ λ = 1 − x 1 − x 2 = 0 \frac{\partial \mathcal{L}}{\partial x_1} = 2x_1 - \lambda = 0 \\ \frac{\partial \mathcal{L}}{\partial x_2} = 2x_2 - \lambda = 0 \\ \frac{\partial \mathcal{L}}{\partial \lambda} = 1 - x_1 - x_2 = 0 ∂x1∂L=2x1−λ=0∂x2∂L=2x2−λ=0∂λ∂L=1−x1−x2=0

解得:
x 1 = x 2 = 1 2 , λ = 1 x_1 = x_2 = \frac{1}{2}, \quad \lambda = 1 x1=x2=21,λ=1

对应的最小值为:
1 2 2 + 1 2 2 = 1 2 \frac{1}{2}^2 + \frac{1}{2}^2 = \frac{1}{2} 212+212=21

第九部分:偏微分方程

基本概念与分类

偏微分方程(Partial Differential Equations, PDEs)是描述多变量函数及其偏导数之间关系的方程,在工程、物理等领域有广泛应用。根据方程中最高阶导数的性质,偏微分方程可分为三类:

椭圆型方程

椭圆型偏微分方程通常用于描述稳态过程,如热传导、电场分布和流体力学中的势流问题。其标准形式为:
A ∂ 2 u ∂ x 2 + B ∂ 2 u ∂ x ∂ y + C ∂ 2 u ∂ y 2 + D ∂ u ∂ x + E ∂ u ∂ y + F u = G A \frac{\partial^2 u}{\partial x^2} + B \frac{\partial^2 u}{\partial x \partial y} + C \frac{\partial^2 u}{\partial y^2} + D \frac{\partial u}{\partial x} + E \frac{\partial u}{\partial y} + Fu = G A∂x2∂2u+B∂x∂y∂2u+C∂y2∂2u+D∂x∂u+E∂y∂u+Fu=G

其中,系数满足判别式 B 2 − 4 A C < 0 B^2 - 4AC < 0 B2−4AC<0。典型的椭圆型方程包括:

  1. 拉普拉斯方程:
    Δ u = ∂ 2 u ∂ x 2 + ∂ 2 u ∂ y 2 = 0 \Delta u = \frac{\partial^2 u}{\partial x^2} + \frac{\partial^2 u}{\partial y^2} = 0 Δu=∂x2∂2u+∂y2∂2u=0
  2. 泊松方程:
    Δ u = f ( x , y ) \Delta u = f(x,y) Δu=f(x,y)
  3. 亥姆霍兹方程:
    Δ u + k 2 u = 0 \Delta u + k^2u = 0 Δu+k2u=0
    应用实例
  • 稳态热传导问题中的温度分布
  • 静电场中的电势分布
  • 不可压缩流体的势流问题
  • 弹性力学中的平面应力问题
抛物型方程

抛物型偏微分方程常用于描述扩散过程,如热传导、物质扩散和金融数学中的期权定价。其标准形式为:
A ∂ 2 u ∂ x 2 + B ∂ u ∂ t + C ∂ u ∂ x + D u = E A \frac{\partial^2 u}{\partial x^2} + B \frac{\partial u}{\partial t} + C \frac{\partial u}{\partial x} + Du = E A∂x2∂2u+B∂t∂u+C∂x∂u+Du=E

判别式满足 B 2 − 4 A C = 0 B^2 - 4AC = 0 B2−4AC=0。典型的抛物型方程包括:

  1. 热传导方程:
    ∂ u ∂ t = α ∂ 2 u ∂ x 2 \frac{\partial u}{\partial t} = \alpha \frac{\partial^2 u}{\partial x^2} ∂t∂u=α∂x2∂2u
  2. 扩散方程:
    ∂ u ∂ t = D ∂ 2 u ∂ x 2 \frac{\partial u}{\partial t} = D \frac{\partial^2 u}{\partial x^2} ∂t∂u=D∂x2∂2u
  3. Fokker-Planck方程:
    ∂ u ∂ t = − ∂ ∂ x ( a ( x ) u ) + 1 2 ∂ 2 ∂ x 2 ( b ( x ) u ) \frac{\partial u}{\partial t} = -\frac{\partial}{\partial x}(a(x)u) + \frac{1}{2}\frac{\partial^2}{\partial x^2}(b(x)u) ∂t∂u=−∂x∂(a(x)u)+21∂x2∂2(b(x)u)
    应用实例
  • 物体内部温度随时间的变化
  • 污染物在环境中的扩散
  • Black-Scholes期权定价模型
  • 粒子在势场中的运动
双曲型方程

双曲型偏微分方程主要用于描述波动现象,如声波、电磁波和弹性力学中的振动问题。其标准形式为:
A ∂ 2 u ∂ t 2 + B ∂ 2 u ∂ x 2 + C ∂ u ∂ t + D ∂ u ∂ x + E u = F A \frac{\partial^2 u}{\partial t^2} + B \frac{\partial^2 u}{\partial x^2} + C \frac{\partial u}{\partial t} + D \frac{\partial u}{\partial x} + Eu = F A∂t2∂2u+B∂x2∂2u+C∂t∂u+D∂x∂u+Eu=F

判别式满足 B 2 − 4 A C > 0 B^2 - 4AC > 0 B2−4AC>0。典型的双曲型方程包括:

  1. 波动方程:
    ∂ 2 u ∂ t 2 = c 2 ∂ 2 u ∂ x 2 \frac{\partial^2 u}{\partial t^2} = c^2 \frac{\partial^2 u}{\partial x^2} ∂t2∂2u=c2∂x2∂2u
  2. 电报方程:
    ∂ 2 u ∂ t 2 + 2 α ∂ u ∂ t + β 2 u = c 2 ∂ 2 u ∂ x 2 \frac{\partial^2 u}{\partial t^2} + 2\alpha \frac{\partial u}{\partial t} + \beta^2 u = c^2 \frac{\partial^2 u}{\partial x^2} ∂t2∂2u+2α∂t∂u+β2u=c2∂x2∂2u
  3. Klein-Gordon方程:
    ∂ 2 u ∂ t 2 − Δ u + m 2 u = 0 \frac{\partial^2 u}{\partial t^2} - \Delta u + m^2u = 0 ∂t2∂2u−Δu+m2u=0
    应用实例
  • 声波在空气中的传播
  • 电磁波在介质中的传播
  • 弹性体的振动问题
  • 量子场论中的标量场

求解方法

分离变量法

分离变量法是求解线性偏微分方程的经典方法,适用于具有齐次边界条件的问题。基本步骤如下:

  1. 假设解可以表示为各变量的乘积形式,即 u ( x , y ) = X ( x ) Y ( y ) u(x, y) = X(x)Y(y) u(x,y)=X(x)Y(y)。
  2. 将假设代入原方程,分离变量,使得两边只含有单一变量的函数。
  3. 得到两个常微分方程,分别关于 X ( x ) X(x) X(x) 和 Y ( y ) Y(y) Y(y)。
  4. 求解这两个常微分方程,得到通解。
  5. 根据边界条件确定常数,得到特定解。

实例 :求解一维热传导方程
∂ u ∂ t = α ∂ 2 u ∂ x 2 \frac{\partial u}{\partial t} = \alpha \frac{\partial^2 u}{\partial x^2} ∂t∂u=α∂x2∂2u

假设解为 u ( x , t ) = X ( x ) T ( t ) u(x, t) = X(x)T(t) u(x,t)=X(x)T(t),代入方程后可得到
1 α T d T d t = 1 X d 2 X d x 2 = − λ \frac{1}{\alpha T} \frac{dT}{dt} = \frac{1}{X} \frac{d^2 X}{dx^2} = -\lambda αT1dtdT=X1dx2d2X=−λ

从而得到两个常微分方程:
d T d t + α λ T = 0 \frac{dT}{dt} + \alpha \lambda T = 0 dtdT+αλT=0
d 2 X d x 2 + λ X = 0 \frac{d^2 X}{dx^2} + \lambda X = 0 dx2d2X+λX=0

根据边界条件求解,得到温度分布随时间的变化规律。

特征线法

特征线法适用于一阶偏微分方程,通过寻找特征线将偏微分方程转化为常微分方程。基本步骤:

  1. 将偏微分方程写成标准形式:
    a ( x , y ) ∂ u ∂ x + b ( x , y ) ∂ u ∂ y = c ( x , y ) a(x, y) \frac{\partial u}{\partial x} + b(x, y) \frac{\partial u}{\partial y} = c(x, y) a(x,y)∂x∂u+b(x,y)∂y∂u=c(x,y)
  2. 构造特征方程组:
    d x d s = a ( x , y ) , d y d s = b ( x , y ) , d u d s = c ( x , y ) \frac{dx}{ds} = a(x, y), \quad \frac{dy}{ds} = b(x, y), \quad \frac{du}{ds} = c(x, y) dsdx=a(x,y),dsdy=b(x,y),dsdu=c(x,y)
  3. 解特征方程组,得到特征曲线。
  4. 在特征曲线上求解 u u u。

实例 :求解一阶线性偏微分方程
∂ u ∂ x + ∂ u ∂ y = 0 \frac{\partial u}{\partial x} + \frac{\partial u}{\partial y} = 0 ∂x∂u+∂y∂u=0

特征方程为:
d x d s = 1 , d y d s = 1 , d u d s = 0 \frac{dx}{ds} = 1, \quad \frac{dy}{ds} = 1, \quad \frac{du}{ds} = 0 dsdx=1,dsdy=1,dsdu=0

解得特征线为 y − x = const y - x = \text{const} y−x=const,因此解为 u ( x , y ) = f ( y − x ) u(x, y) = f(y - x) u(x,y)=f(y−x)。

数值解法

对于无法通过解析方法求解的复杂偏微分方程,数值解法是重要的求解工具。常见的方法包括:

  1. 有限差分法:

    • 将连续的偏微分方程离散化,转化为代数方程
    • 构建差分网格,定义网格点
    • 在网格点上应用差分近似,得到离散方程组
    • 使用数值方法(如迭代法)求解方程组
    • 优点:简单直观,易于实现
    • 缺点:对复杂几何形状适应性差
  2. 有限元法:

    • 将求解区域划分为有限个单元
    • 在每个单元上构造近似函数
    • 通过变分原理或加权残值法建立代数方程组
    • 求解方程组得到近似解
    • 优点:适应复杂几何形状,精度高
    • 缺点:计算量大,实现复杂
  3. 谱方法:

    • 使用全局基函数(如傅里叶级数或切比雪夫多项式)近似解
    • 通过Galerkin方法或配点法建立代数方程组
    • 求解方程组得到高精度近似解
    • 优点:高精度,收敛快
    • 缺点:对非光滑解适应性差

实例 :使用有限差分法求解热传导方程
∂ u ∂ t = α ∂ 2 u ∂ x 2 \frac{\partial u}{\partial t} = \alpha \frac{\partial^2 u}{\partial x^2} ∂t∂u=α∂x2∂2u

离散化后得到:
u i n + 1 − u i n Δ t = α u i + 1 n − 2 u i n + u i − 1 n ( Δ x ) 2 \frac{u_i^{n+1} - u_i^n}{\Delta t} = \alpha \frac{u_{i+1}^n - 2u_i^n + u_{i-1}^n}{(\Delta x)^2} Δtuin+1−uin=α(Δx)2ui+1n−2uin+ui−1n

通过迭代计算,可以获得 u u u 在离散网格上的近似值。

边界条件与适定性

偏微分方程的求解需要考虑边界条件和初始条件,常见边界条件包括:

  1. 狄利克雷边界条件:指定函数在边界上的值
  2. 诺伊曼边界条件:指定函数在边界上的法向导数
  3. 混合边界条件:同时包含函数值及其导数的条件
  4. 周期边界条件:函数在边界上满足周期性条件

偏微分方程的适定性要求解满足:

  1. 存在性:至少存在一个解
  2. 唯一性:解是唯一的
  3. 稳定性:解对初始条件和边界条件连续依赖

补充说明

  • 对于不同类型的偏微分方程,需要采用不同的边界条件组合
  • 适定性是偏微分方程理论研究的核心问题之一
  • 在实际应用中,还需要考虑数值稳定性和收敛性等问题

第十部分:非线性系统分析

非线性系统广泛存在于工程实践中,其分析与线性系统有显著不同。本节将系统介绍非线性系统分析的三大核心方法:稳定性理论、相平面分析和混沌理论。

稳定性理论

李雅普诺夫方法

李雅普诺夫方法是分析非线性动态系统稳定性的强大工具,由俄罗斯数学家亚历山大·李雅普诺夫于1892年提出。其核心思想是通过构造一个李雅普诺夫函数 V ( x ) V(x) V(x) 来研究系统的稳定性,而无需求解系统的具体解。

李雅普诺夫函数的定义

对于一个自治非线性系统:
d x d t = f ( x ) \frac{dx}{dt} = f(x) dtdx=f(x)

其中, x ∈ R n x \in \mathbb{R}^n x∈Rn, f ( x ) f(x) f(x) 是连续可微函数。李雅普诺夫函数 V ( x ) V(x) V(x) 需要满足以下条件:

  1. 正定性: V ( x ) V(x) V(x) 在平衡点 x = 0 x = 0 x=0 处有极小值,即 V ( 0 ) = 0 V(0) = 0 V(0)=0 且 V ( x ) > 0 V(x) > 0 V(x)>0 对于所有 x ≠ 0 x \neq 0 x=0。
  2. 导数条件: V ( x ) V(x) V(x) 关于时间的导数 d V d t \frac{dV}{dt} dtdV 满足:
    d V d t = ∇ V ( x ) ⋅ f ( x ) ≤ 0 \frac{dV}{dt} = \nabla V(x) \cdot f(x) \leq 0 dtdV=∇V(x)⋅f(x)≤0
稳定性判据
  • 稳定性

    如果存在李雅普诺夫函数 V ( x ) V(x) V(x) 使得 d V d t ≤ 0 \frac{dV}{dt} \leq 0 dtdV≤0,则平衡点 x = 0 x = 0 x=0 是稳定的。

  • 渐近稳定性

    如果 d V d t < 0 \frac{dV}{dt} < 0 dtdV<0 除 x = 0 x = 0 x=0 外,则平衡点是渐近稳定的,即系统状态将随着时间趋向于平衡点。

  • 全局渐近稳定性

    如果李雅普诺夫函数 V ( x ) V(x) V(x) 满足 V ( x ) → ∞ V(x) \to \infty V(x)→∞ 当 ∣ ∣ x ∣ ∣ → ∞ ||x|| \to \infty ∣∣x∣∣→∞,且 d V d t < 0 \frac{dV}{dt} < 0 dtdV<0 对所有 x ≠ 0 x \neq 0 x=0 成立,则平衡点是全局渐近稳定的。

应用实例

实例 1 :考虑一维线性系统
d x d t = − k x \frac{dx}{dt} = -kx dtdx=−kx

其中 k > 0 k > 0 k>0。选择李雅普诺夫函数 V ( x ) = 1 2 x 2 V(x) = \frac{1}{2}x^2 V(x)=21x2,则
d V d t = x ⋅ ( − k x ) = − k x 2 ≤ 0 \frac{dV}{dt} = x \cdot (-kx) = -kx^2 \leq 0 dtdV=x⋅(−kx)=−kx2≤0

因此,系统在 x = 0 x = 0 x=0 处是渐近稳定的。

实例 2 :考虑非线性系统
d x d t = − x 3 \frac{dx}{dt} = -x^3 dtdx=−x3

选择 V ( x ) = 1 2 x 2 V(x) = \frac{1}{2}x^2 V(x)=21x2,则
d V d t = x ⋅ ( − x 3 ) = − x 4 < 0 ( x ≠ 0 ) \frac{dV}{dt} = x \cdot (-x^3) = -x^4 < 0 \quad (x \neq 0) dtdV=x⋅(−x3)=−x4<0(x=0)

系统在 x = 0 x = 0 x=0 处是全局渐近稳定的。

相平面分析

相平面分析是一种直观的方法,用于研究二维非线性动态系统的行为。通过在相平面上绘制系统的轨道,可以直观地观察系统的稳定性和长期行为。

系统方程

考虑二维非线性系统:
{ d x d t = f ( x , y ) d y d t = g ( x , y ) \begin{cases} \frac{dx}{dt} = f(x, y) \\ \frac{dy}{dt} = g(x, y) \end{cases} {dtdx=f(x,y)dtdy=g(x,y)

平衡点与稳定性
  • 平衡点 :满足 f ( x , y ) = 0 f(x, y) = 0 f(x,y)=0 和 g ( x , y ) = 0 g(x, y) = 0 g(x,y)=0 的点,表示系统在该点处保持不变。

  • 稳定性分析

    通过线性化系统,可以分析平衡点的稳定性。线性化系统的雅可比矩阵为:
    J = ( ∂ f ∂ x ∂ f ∂ y ∂ g ∂ x ∂ g ∂ y ) J = \begin{pmatrix} \frac{\partial f}{\partial x} & \frac{\partial f}{\partial y} \\ \frac{\partial g}{\partial x} & \frac{\partial g}{\partial y} \end{pmatrix} J=(∂x∂f∂x∂g∂y∂f∂y∂g)

    计算雅可比矩阵的特征值,可以判断平衡点的类型和稳定性。

稳定性分类
  1. 稳定节点:两个实负特征值,系统状态趋向平衡点。
  2. 不稳定节点:两个实正特征值,系统状态远离平衡点。
  3. 鞍点:特征值一正一负,系统在某些方向稳定,某些方向不稳定。
  4. 稳定焦点:复特征值,实部为负,系统状态呈螺旋趋向平衡点。
  5. 不稳定焦点:复特征值,实部为正,系统状态呈螺旋远离平衡点。
应用实例

实例 1 :分析系统
{ d x d t = y d y d t = − x − y \begin{cases} \frac{dx}{dt} = y \\ \frac{dy}{dt} = -x - y \end{cases} {dtdx=ydtdy=−x−y

平衡点为 ( 0 , 0 ) (0, 0) (0,0)。雅可比矩阵为:
J = ( 0 1 − 1 − 1 ) J = \begin{pmatrix} 0 & 1 \\ -1 & -1 \end{pmatrix} J=(0−11−1)

特征方程为:
λ 2 + λ + 1 = 0 \lambda^2 + \lambda + 1 = 0 λ2+λ+1=0

解得特征值为 λ = − 1 ± − 3 2 \lambda = \frac{-1 \pm \sqrt{-3}}{2} λ=2−1±−3 ,实部为负,系统在原点为稳定焦点,系统状态将以螺旋方式趋向于平衡点。

实例 2 :Van der Pol 振子
{ d x d t = y d y d t = μ ( 1 − x 2 ) y − x \begin{cases} \frac{dx}{dt} = y \\ \frac{dy}{dt} = \mu(1-x^2)y - x \end{cases} {dtdx=ydtdy=μ(1−x2)y−x

当 μ > 0 \mu > 0 μ>0 时,系统存在稳定的极限环,表现出自激振荡行为。

混沌理论

混沌理论研究的是非线性系统中高度敏感的动态行为,即微小的初始条件变化会引起系统状态的巨大差异。混沌系统在许多自然现象和工程应用中普遍存在。

混沌系统的特征
  1. 敏感依赖初值

    混沌系统对初始条件极为敏感,即使是极小的初始差异也会随着时间的推移迅速放大,导致系统行为的不可预测性。数学上,混沌系统的李雅普诺夫指数 λ \lambda λ 满足 λ > 0 \lambda > 0 λ>0。

  2. 拓扑混合性

    任意两个区域内的轨道随着时间的推移会相互交织,系统的轨道在相空间中复杂交错。

  3. 密集不稳定周期轨道

    混沌吸引子中包含无限多个周期轨道,这些周期轨道在相空间中密集分布。

李雅普诺夫指数

李雅普诺夫指数是衡量系统对初始条件敏感性的指标。对于一个 n n n 维系统,存在 n n n 个李雅普诺夫指数,其中最大的一个决定了系统是否具有混沌性。

定义:
λ = lim ⁡ t → ∞ 1 t ln ⁡ ∣ ∣ δ x ( t ) ∣ ∣ ∣ ∣ δ x ( 0 ) ∣ ∣ \lambda = \lim_{t \to \infty} \frac{1}{t} \ln \frac{||\delta x(t)||}{||\delta x(0)||} λ=t→∞limt1ln∣∣δx(0)∣∣∣∣δx(t)∣∣

如果 λ > 0 \lambda > 0 λ>0,则系统对初始条件敏感,可能表现出混沌行为。

分岔现象

分岔指的是随着系统参数的变化,系统动力学行为发生质的变化。分岔是混沌生成的前兆,它标志着系统从简单行为向复杂行为的过渡。

常见的分岔类型
  1. 鞍结分岔

    系统通过参数变化,从稳定状态转变为不稳定状态,通常伴随着周期轨道的出现。

  2. Hopf 分岔

    当系统参数达到临界值时,平衡点由稳定变为不稳定,并产生一个或多个极限环。

  3. 周期倍增分岔

    系统通过一系列的周期倍增过程,最终走向混沌。例如,随着参数的不断增加,系统的周期性行为会变为双周期、四周期,最终演变为不规则的混沌轨道。

应用实例

实例 :Lorenz 系统
{ d x d t = σ ( y − x ) d y d t = x ( ρ − z ) − y d z d t = x y − β z \begin{cases} \frac{dx}{dt} = \sigma (y - x) \\ \frac{dy}{dt} = x (\rho - z) - y \\ \frac{dz}{dt} = xy - \beta z \end{cases} ⎩ ⎨ ⎧dtdx=σ(y−x)dtdy=x(ρ−z)−ydtdz=xy−βz

当参数 ρ \rho ρ 增加时,系统经历从稳定点到极限环,再到混沌的分岔过程。例如,当 ρ > ρ c r i t i c a l \rho > \rho_{critical} ρ>ρcritical,系统表现出混沌行为,轨道在相空间中呈现出复杂的吸引子结构,即著名的"蝴蝶效应"。

附录

符号表与术语解释

  • f ′ ( x ) f'(x) f′(x) :函数 f ( x ) f(x) f(x) 在点 x x x 处的导数,表示瞬时变化率。在微分方程和优化问题中广泛应用。

  • ∫ f ( x ) d x \int f(x) dx ∫f(x)dx :函数 f ( x ) f(x) f(x) 的不定积分,表示所有原函数的集合。在求解微分方程和计算面积、体积等问题中起关键作用。

  • det ⁡ ( A ) \det(A) det(A) :矩阵 A A A 的行列式,用于判断矩阵是否可逆及其他性质。在矩阵分解和线性方程组求解中具有重要意义。

  • S n S_n Sn :全排列的集合,包含所有长度为 n n n 的排列。在组合数学和概率论中经常使用。

  • P ( x ) P(x) P(x), Q ( x ) Q(x) Q(x):一阶线性微分方程中的系数函数,视具体方程而定。在求解微分方程时用于描述方程的结构。

  • C 1 , C 2 C_1, C_2 C1,C2:常数,通常由初始条件或边界条件确定。在求解微分方程时表示通解中的任意常数。

  • 李雅普诺夫指数 λ \lambda λ :衡量系统对初始条件敏感性的指标, λ > 0 \lambda > 0 λ>0 表示系统可能具有混沌行为。在非线性系统分析中用于判断系统的稳定性。

  • α , β \alpha, \beta α,β:在解决二阶常系数齐次微分方程时,表示特征方程的复数根的实部和虚部。在振动系统和热传导问题中常见。

  • Λ \Lambda Λ:通常用于表示拉格朗日乘数或其他特定参数,根据上下文定义。在优化问题和约束系统中使用。

  • V ( x ) V(x) V(x):李雅普诺夫函数,用于分析系统的稳定性。在非线性系统稳定性理论中起核心作用。

  • A , B , C A, B, C A,B,C:在不同的数学公式和方程中表示不同的变量或系数,具体含义依上下文而定。在矩阵理论、微分方程和傅里叶分析中广泛使用。

  • γ \gamma γ:通常表示路径或曲线,在复变函数中用于表示积分路径。

  • μ \mu μ:在概率论中表示期望值,在热传导方程中表示热扩散系数。

  • σ \sigma σ:在概率论中表示标准差,在Lorenz系统中表示普朗特数。

  • ρ \rho ρ:在Lorenz系统中表示瑞利数,在矩阵理论中表示谱半径。

  • ω \omega ω:在傅里叶变换中表示角频率,在振动系统中表示固有频率。

  • t t t:通常表示时间变量,在微分方程和动力系统中作为独立变量。

  • x , y , z x, y, z x,y,z:通常表示空间变量或状态变量,在偏微分方程和动力系统中使用。

  • n n n:在级数中表示项数,在矩阵中表示维度,在概率论中表示样本容量。

  • k k k:在微分方程中表示常数,在傅里叶级数中表示波数。

  • i i i :虚数单位, i 2 = − 1 i^2 = -1 i2=−1,在复变函数和傅里叶变换中使用。

  • λ \lambda λ:在特征值问题中表示特征值,在偏微分方程中表示分离变量常数。在矩阵理论和微分方程中广泛使用。

  • ϕ \phi ϕ:在傅里叶分析中表示相位角,在流体力学中表示速度势函数。在信号处理和流体力学中常见。

  • θ \theta θ:在极坐标中表示角度,在旋转矩阵中表示旋转角度。在几何变换和坐标转换中使用。

  • ϵ \epsilon ϵ:在极限理论中表示无穷小量,在优化问题中表示收敛精度。在微积分和数值分析中常见。

  • δ \delta δ:在狄拉克函数中表示脉冲函数,在变分法中表示微小变化。在信号处理和变分法中使用。

  • ∇ \nabla ∇:表示梯度算子,用于计算标量场的梯度。在向量分析和场论中广泛使用。

  • ∂ \partial ∂:表示偏导数,用于多元函数的微分。在偏微分方程和多变量微积分中使用。

  • ∑ \sum ∑:表示求和符号,用于级数和离散求和。在级数理论和概率论中常见。

  • ∏ \prod ∏:表示连乘积符号,用于序列的乘积。在组合数学和概率论中使用。

  • ∞ \infty ∞:表示无穷大,用于描述极限和积分区间。在微积分和实分析中广泛使用。

  • ∈ \in ∈:表示属于关系,用于描述元素与集合的关系。在集合论和数学分析中使用。

  • ⊂ \subset ⊂:表示子集关系,用于描述集合之间的包含关系。在集合论和拓扑学中常见。

  • ⇒ \Rightarrow ⇒:表示逻辑蕴含,用于描述命题之间的推理关系。在逻辑推理和数学证明中使用。

  • ⇔ \Leftrightarrow ⇔:表示逻辑等价,用于描述命题之间的双向关系。在逻辑推理和数学证明中常见。

  • ∀ \forall ∀:表示全称量词,用于描述对所有元素都成立的命题。在逻辑推理和数学证明中使用。

  • ∃ \exists ∃:表示存在量词,用于描述存在某个元素满足的命题。在逻辑推理和数学证明中常见。

  • A \mathbf{A} A:表示矩阵,在矩阵理论和线性代数中广泛使用。用于表示线性变换、方程组系数等。

  • b \mathbf{b} b:在矩阵方程中表示常数向量,在线性方程组中表示右侧向量。在数值计算和优化问题中常见。

  • c \mathbf{c} c:在优化问题中表示目标函数系数向量,在傅里叶级数中表示余弦系数。在数学建模和信号处理中使用。

  • Q \mathbf{Q} Q:在二次规划中表示二次项系数矩阵,在矩阵分解中表示正交矩阵。在最优化和数值分析中广泛使用。

  • R \mathbf{R} R:在QR分解中表示上三角矩阵,在控制理论中表示状态空间矩阵。在数值计算和系统分析中使用。

  • U , V \mathbf{U}, \mathbf{V} U,V:在奇异值分解中表示正交矩阵,在矩阵理论中表示特征向量矩阵。在数据分析和降维技术中常见。

  • Σ \Sigma Σ:在奇异值分解中表示对角矩阵,在概率论中表示协方差矩阵。在统计分析和机器学习中广泛使用。

  • x \mathbf{x} x:在优化问题中表示决策变量,在微分方程中表示状态变量。在数学建模和系统分析中常见。

  • y \mathbf{y} y:在控制系统中表示输出变量,在回归分析中表示响应变量。在系统识别和数据分析中使用。

  • z \mathbf{z} z:在复变函数中表示复变量,在状态空间模型中表示测量变量。在信号处理和系统控制中常见。

  • f \mathbf{f} f:在微分方程中表示向量场,在优化问题中表示目标函数。在动力系统和数学建模中使用。

  • g \mathbf{g} g:在约束优化中表示约束函数,在微分方程中表示非线性项。在最优化和系统分析中常见。

  • h \mathbf{h} h:在控制系统中表示观测函数,在机器学习中表示假设函数。在系统识别和人工智能中使用。

  • J \mathbf{J} J:在优化问题中表示雅可比矩阵,在控制理论中表示性能指标。在数值计算和系统优化中广泛使用。

  • H \mathbf{H} H:在优化问题中表示海森矩阵,在控制理论中表示哈密顿函数。在数值优化和物理建模中使用。

  • P \mathbf{P} P:在控制理论中表示李雅普诺夫函数矩阵,在概率论中表示转移概率矩阵。在系统稳定性和马尔可夫链分析中常见。

  • K \mathbf{K} K:在控制理论中表示反馈增益矩阵,在优化问题中表示核矩阵。在控制系统设计和机器学习中使用。

  • L \mathbf{L} L:在矩阵分解中表示下三角矩阵,在图论中表示拉普拉斯矩阵。在数值计算和网络分析中常见。

  • M \mathbf{M} M:在力学系统中表示质量矩阵,在数值分析中表示预处理矩阵。在物理建模和数值计算中使用。

  • N \mathbf{N} N:在数值分析中表示迭代矩阵,在概率论中表示正态分布矩阵。在数值计算和统计分析中常见。

  • D \mathbf{D} D:在矩阵理论中表示对角矩阵,在微分方程中表示阻尼矩阵。在数值计算和物理建模中使用。

  • E \mathbf{E} E:在误差分析中表示误差矩阵,在控制理论中表示状态估计矩阵。在系统识别和数值分析中常见。

  • F \mathbf{F} F:在控制理论中表示状态转移矩阵,在数值分析中表示迭代矩阵。在系统分析和数值计算中使用。

  • G \mathbf{G} G:在控制理论中表示控制增益矩阵,在优化问题中表示梯度矩阵。在控制系统设计和数值优化中常见。

  • I \mathbf{I} I:在矩阵理论中表示单位矩阵,在控制理论中表示惯性矩阵。在数值计算和物理建模中使用。

  • O \mathbf{O} O:在矩阵理论中表示零矩阵,在控制理论中表示观测矩阵。在数值计算和系统分析中常见。

  • S \mathbf{S} S:在矩阵理论中表示对称矩阵,在控制理论中表示灵敏度矩阵。在数值优化和系统分析中使用。

  • T \mathbf{T} T:在矩阵理论中表示变换矩阵,在控制理论中表示传递函数矩阵。在数值计算和系统分析中常见。

  • W \mathbf{W} W:在优化问题中表示权重矩阵,在控制理论中表示噪声协方差矩阵。在数值优化和系统识别中使用。

  • X \mathbf{X} X:在状态空间模型中表示状态矩阵,在优化问题中表示决策变量矩阵。在系统分析和数学建模中常见。

  • Y \mathbf{Y} Y:在控制理论中表示输出矩阵,在优化问题中表示对偶变量矩阵。在系统识别和数值优化中使用。

  • Z \mathbf{Z} Z:在控制理论中表示测量矩阵,在优化问题中表示拉格朗日乘子矩阵。在系统分析和数值优化中常见。

  • α \mathbf{\alpha} α:在优化问题中表示步长参数,在控制理论中表示衰减系数。在数值计算和系统分析中使用。

  • β \mathbf{\beta} β:在回归分析中表示回归系数,在控制理论中表示阻尼系数。在统计分析和系统建模中常见。

  • γ \mathbf{\gamma} γ:在优化问题中表示惩罚参数,在控制理论中表示增益系数。在数值优化和系统设计中使用。

  • δ \mathbf{\delta} δ:在数值分析中表示扰动参数,在控制理论中表示偏差系数。在数值计算和系统分析中常见。

  • ϵ \mathbf{\epsilon} ϵ:在数值分析中表示误差项,在优化问题中表示收敛阈值。在数值计算和数学建模中使用。

  • ζ \mathbf{\zeta} ζ:在控制理论中表示阻尼比,在数值分析中表示迭代参数。在系统分析和数值计算中常见。

  • η \mathbf{\eta} η:在优化问题中表示学习率,在控制理论中表示效率系数。在数值优化和系统设计中使用。

  • θ \mathbf{\theta} θ:在控制理论中表示角度变量,在优化问题中表示参数向量。在系统分析和数学建模中常见。

相关推荐
西岸行者13 天前
学习笔记:SKILLS 能帮助更好的vibe coding
笔记·学习
悠哉悠哉愿意13 天前
【单片机学习笔记】串口、超声波、NE555的同时使用
笔记·单片机·学习
别催小唐敲代码13 天前
嵌入式学习路线
学习
毛小茛13 天前
计算机系统概论——校验码
学习
babe小鑫13 天前
大专经济信息管理专业学习数据分析的必要性
学习·数据挖掘·数据分析
winfreedoms13 天前
ROS2知识大白话
笔记·学习·ros2
在这habit之下13 天前
Linux Virtual Server(LVS)学习总结
linux·学习·lvs
我想我不够好。13 天前
2026.2.25监控学习
学习
大江东去浪淘尽千古风流人物13 天前
【SLAM】GenRobot / IO-AI / Scale / Appen 能力对比表(机器人数据与闭环视角)
人工智能·机器学习·机器人·大模型·概率论·端侧部署·巨身智能
im_AMBER13 天前
Leetcode 127 删除有序数组中的重复项 | 删除有序数组中的重复项 II
数据结构·学习·算法·leetcode