工程数学速记手册(下)

工程数学速记手册(下)

第六部分:概率与统计

概率基础

概率空间与事件

概率空间 是概率论中的基本概念,用于描述随机试验的所有可能结果及其概率。一个概率空间可以表示为三元组 ( Ω , F , P ) (\Omega, \mathcal{F}, P) (Ω,F,P),其中:

  • Ω \Omega Ω 是样本空间,表示所有可能的实验结果。
  • F \mathcal{F} F 是事件的集合,满足σ-代数的性质,即包含空集、对补集运算封闭、对可数并运算封闭。
  • P P P 是概率测度,将事件集合映射到 [ 0 , 1 ] [0,1] [0,1] 之间的数,满足概率公理。

事件 是样本空间 Ω \Omega Ω 的子集,表示随机试验可能出现的结果组合。事件可以是简单事件(单个结果),也可以是复合事件(多个结果的集合)。事件运算包括并、交、补等,满足德摩根定律。

概率公理

概率公理是建立概率理论的基础,通常包括以下三个基本公理:

  1. 非负性公理

    对于任意事件 A A A,有:
    P ( A ) ≥ 0 P(A) \geq 0 P(A)≥0

  2. 规范化公理

    整个样本空间的概率为 1,即:
    P ( Ω ) = 1 P(\Omega) = 1 P(Ω)=1

  3. 可列可加公理

    对于一列两两互斥的事件 A 1 , A 2 , ... A_1, A_2, \ldots A1,A2,...,有:
    P ( ⋃ i = 1 ∞ A i ) = ∑ i = 1 ∞ P ( A i ) P\left(\bigcup_{i=1}^{\infty} A_i\right) = \sum_{i=1}^{\infty} P(A_i) P(i=1⋃∞Ai)=i=1∑∞P(Ai)

推论

  • P ( ∅ ) = 0 P(\emptyset) = 0 P(∅)=0
  • P ( A c ) = 1 − P ( A ) P(A^c) = 1 - P(A) P(Ac)=1−P(A)
  • 若 A ⊆ B A \subseteq B A⊆B,则 P ( A ) ≤ P ( B ) P(A) \leq P(B) P(A)≤P(B)
  • P ( A ∪ B ) = P ( A ) + P ( B ) − P ( A ∩ B ) P(A \cup B) = P(A) + P(B) - P(A \cap B) P(A∪B)=P(A)+P(B)−P(A∩B)
  • 容斥原理:对于任意n个事件,有:
    P ( ⋃ i = 1 n A i ) = ∑ i = 1 n P ( A i ) − ∑ 1 ≤ i < j ≤ n P ( A i ∩ A j ) + ⋯ + ( − 1 ) n + 1 P ( ⋂ i = 1 n A i ) P\left(\bigcup_{i=1}^{n} A_i\right) = \sum_{i=1}^{n} P(A_i) - \sum_{1\leq i<j\leq n} P(A_i \cap A_j) + \cdots + (-1)^{n+1} P\left(\bigcap_{i=1}^{n} A_i\right) P(i=1⋃nAi)=i=1∑nP(Ai)−1≤i<j≤n∑P(Ai∩Aj)+⋯+(−1)n+1P(i=1⋂nAi)
随机变量

随机变量 是将样本空间 Ω \Omega Ω 映射到实数集的函数,用于量化随机试验的结果。根据随机变量取值的性质,随机变量可分为:

离散随机变量

如果随机变量 X X X 只能取有限或可数无限多个离散值,则称为离散随机变量。其概率质量函数(PMF)定义为:
P ( X = x i ) = p i P(X = x_i) = p_i P(X=xi)=pi

其中, x i x_i xi 是 X X X 的可能取值, p i p_i pi 满足 p i ≥ 0 p_i \geq 0 pi≥0 且 ∑ p i = 1 \sum p_i = 1 ∑pi=1。

常见分布

  • 伯努利分布
    P ( X = 1 ) = p , P ( X = 0 ) = 1 − p P(X = 1) = p, \quad P(X = 0) = 1 - p P(X=1)=p,P(X=0)=1−p

  • 二项分布 ( n n n 次独立试验的成功次数):
    P ( X = k ) = ( n k ) p k ( 1 − p ) n − k , k = 0 , 1 , ... , n P(X = k) = \binom{n}{k} p^k (1 - p)^{n - k}, \quad k = 0,1,\ldots,n P(X=k)=(kn)pk(1−p)n−k,k=0,1,...,n

  • 泊松分布 (单位时间内事件发生的次数):
    P ( X = k ) = λ k e − λ k ! , k = 0 , 1 , 2 , ... P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}, \quad k = 0,1,2,\ldots P(X=k)=k!λke−λ,k=0,1,2,...

  • 几何分布 (首次成功所需的试验次数):
    P ( X = k ) = ( 1 − p ) k − 1 p , k = 1 , 2 , 3 , ... P(X = k) = (1 - p)^{k-1} p, \quad k = 1,2,3,\ldots P(X=k)=(1−p)k−1p,k=1,2,3,...

连续随机变量

如果随机变量 X X X 的取值为连续区间内的任意实数,则称为连续随机变量。其概率密度函数(PDF)定义为:
f X ( x ) = d d x P ( X ≤ x ) f_X(x) = \frac{d}{dx} P(X \leq x) fX(x)=dxdP(X≤x)

满足:
∫ − ∞ ∞ f X ( x ) d x = 1 \int_{-\infty}^{\infty} f_X(x) dx = 1 ∫−∞∞fX(x)dx=1

常见分布

  • 正态分布
    f X ( x ) = 1 2 π σ e − ( x − μ ) 2 2 σ 2 , x ∈ R f_X(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{ -\frac{(x - \mu)^2}{2\sigma^2} }, \quad x \in \mathbb{R} fX(x)=2π σ1e−2σ2(x−μ)2,x∈R

    其中, μ \mu μ 为均值, σ \sigma σ 为标准差。

  • 指数分布
    f X ( x ) = λ e − λ x , x ≥ 0 f_X(x) = \lambda e^{ -\lambda x }, \quad x \geq 0 fX(x)=λe−λx,x≥0

    其中, λ > 0 \lambda > 0 λ>0 是参数。

  • 均匀分布
    f X ( x ) = { 1 b − a a ≤ x ≤ b 0 其他 f_X(x) = \begin{cases} \frac{1}{b-a} & a \leq x \leq b \\ 0 & \text{其他} \end{cases} fX(x)={b−a10a≤x≤b其他

  • 伽马分布
    f X ( x ) = β α Γ ( α ) x α − 1 e − β x , x > 0 f_X(x) = \frac{\beta^\alpha}{\Gamma(\alpha)} x^{\alpha-1} e^{-\beta x}, \quad x > 0 fX(x)=Γ(α)βαxα−1e−βx,x>0

    其中, α > 0 \alpha > 0 α>0 为形状参数, β > 0 \beta > 0 β>0 为尺度参数。

统计分析

统计分析主要分为描述统计推断统计两大类,用于数据的整理与分析、参数估计与假设检验等。

描述统计

描述统计用于对收集到的数据进行总结和描述,主要通过计算各种统计量来体现数据的特征。

期望与方差
  • 期望(均值)

    表示随机变量取值的平均水平。对于离散随机变量 X X X,期望为:
    E ( X ) = ∑ i x i P ( X = x i ) E(X) = \sum_{i} x_i P(X = x_i) E(X)=i∑xiP(X=xi)

    对于连续随机变量 X X X,期望为:
    E ( X ) = ∫ − ∞ ∞ x f X ( x ) d x E(X) = \int_{-\infty}^{\infty} x f_X(x) dx E(X)=∫−∞∞xfX(x)dx

  • 方差

    描述随机变量围绕期望的离散程度。定义为:
    Var ( X ) = E [ ( X − E ( X ) ) 2 ] = E ( X 2 ) − [ E ( X ) ] 2 \text{Var}(X) = E[(X - E(X))^2] = E(X^2) - [E(X)]^2 Var(X)=E[(X−E(X))2]=E(X2)−[E(X)]2

性质

  • Var ( a X + b ) = a 2 Var ( X ) \text{Var}(aX + b) = a^2\text{Var}(X) Var(aX+b)=a2Var(X)
  • 若 X X X 和 Y Y Y 独立,则 Var ( X + Y ) = Var ( X ) + Var ( Y ) \text{Var}(X + Y) = \text{Var}(X) + \text{Var}(Y) Var(X+Y)=Var(X)+Var(Y)
  • 切比雪夫不等式:对于任意 k > 0 k > 0 k>0,
    P ( ∣ X − μ ∣ ≥ k σ ) ≤ 1 k 2 P(|X - \mu| \geq k\sigma) \leq \frac{1}{k^2} P(∣X−μ∣≥kσ)≤k21
常用统计量
  • 中位数:将数据分为上下两部分的数值。
  • 众数:数据中出现次数最多的值。
  • 标准差:方差的平方根,表示数据的离散程度。
  • 偏度:描述数据分布的不对称性。
  • 峰度:描述数据分布的尖峭程度。
  • 分位数:将数据按比例划分的数值点,如四分位数、百分位数等。
推断统计

推断统计通过样本数据对总体参数进行估计和假设检验,主要包括参数估计和假设检验两部分。

参数估计

估计总体参数的常用方法包括点估计和区间估计。

  • 点估计 :用样本统计量直接估计总体参数。例如,样本均值 x ˉ = 1 n ∑ i = 1 n x i \bar{x} = \frac{1}{n}\sum_{i=1}^{n} x_i xˉ=n1∑i=1nxi 是总体均值 μ \mu μ 的点估计。

  • 区间估计 :在一定置信度下,建立参数的估计区间。例如,95%置信区间为:
    x ˉ ± z α 2 σ n \bar{x} \pm z_{\frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}} xˉ±z2αn σ

    其中, z α 2 z_{\frac{\alpha}{2}} z2α 是标准正态分布的临界值, σ \sigma σ 是总体标准差, n n n 是样本容量。

估计量的评价标准

  • 无偏性: E ( θ ^ ) = θ E(\hat{\theta}) = \theta E(θ^)=θ
  • 有效性:方差最小
  • 一致性:当 n → ∞ n \to \infty n→∞ 时, θ ^ → θ \hat{\theta} \to \theta θ^→θ
  • 充分性:估计量包含样本中关于参数的所有信息
假设检验

假设检验用于根据样本数据对关于总体参数的假设进行判定。

基本步骤

  1. 提出假设 :包括原假设 H 0 H_0 H0 和备择假设 H 1 H_1 H1。
  2. 选择显著性水平 :通常选用 α = 0.05 \alpha = 0.05 α=0.05。
  3. 计算检验统计量 :根据样本数据计算统计量,例如 t t t 统计量。
  4. 做出决策:比较统计量与临界值,决定是否拒绝原假设。

实例

假设要检验某工厂生产的零件直径是否符合设计要求( μ = 10 \mu = 10 μ=10 mm),采样 n = 30 n = 30 n=30 个零件,计算样本均值 x ˉ = 10.2 \bar{x} = 10.2 xˉ=10.2 mm,样本标准差 s = 0.3 s = 0.3 s=0.3 mm,显著性水平 α = 0.05 \alpha = 0.05 α=0.05。

  1. 原假设 H 0 : μ = 10 H_0: \mu = 10 H0:μ=10,备择假设 H 1 : μ ≠ 10 H_1: \mu \neq 10 H1:μ=10。
  2. 计算 t t t 统计量:
    t = x ˉ − μ s / n = 10.2 − 10 0.3 / 30 ≈ 3.65 t = \frac{\bar{x} - \mu}{s / \sqrt{n}} = \frac{10.2 - 10}{0.3 / \sqrt{30}} \approx 3.65 t=s/n xˉ−μ=0.3/30 10.2−10≈3.65
  3. 查找临界值 t α / 2 = 2.045 t_{\alpha/2} = 2.045 tα/2=2.045(自由度为29)。
  4. 由于 ∣ t ∣ = 3.65 > 2.045 |t| = 3.65 > 2.045 ∣t∣=3.65>2.045,拒绝原假设,认为生产过程中存在偏差。

注意事项

  • 第一类错误:拒绝正确的原假设
  • 第二类错误:接受错误的原假设
  • 检验功效:1 - 第二类错误概率

第七部分:傅里叶分析

傅里叶级数

级数展开
周期函数的傅里叶展开

傅里叶级数是法国数学家傅里叶提出的重要数学工具,它将周期函数表示为正弦和余弦函数的无穷级数之和。设 f ( x ) f(x) f(x) 是一个周期为 2 π 2\pi 2π 的函数,其傅里叶级数展开式为:
f ( x ) = a 0 2 + ∑ n = 1 ∞ ( a n cos ⁡ ( n x ) + b n sin ⁡ ( n x ) ) f(x) = \frac{a_0}{2} + \sum_{n=1}^{\infty} \left( a_n \cos(nx) + b_n \sin(nx) \right) f(x)=2a0+n=1∑∞(ancos(nx)+bnsin(nx))

其中, a 0 a_0 a0 表示直流分量, a n a_n an 和 b n b_n bn 分别表示各次谐波的余弦和正弦分量幅度。

对于一般周期 T T T 的函数,傅里叶级数可表示为:
f ( x ) = a 0 2 + ∑ n = 1 ∞ ( a n cos ⁡ ( 2 n π x T ) + b n sin ⁡ ( 2 n π x T ) ) f(x) = \frac{a_0}{2} + \sum_{n=1}^{\infty} \left( a_n \cos(\frac{2n\pi x}{T}) + b_n \sin(\frac{2n\pi x}{T}) \right) f(x)=2a0+n=1∑∞(ancos(T2nπx)+bnsin(T2nπx))

傅里叶级数的存在条件

傅里叶级数的收敛性由戴利克雷条件保证,要求函数 f ( x ) f(x) f(x) 满足:

  1. 在一个周期内有有限个极值
  2. 在一个周期内有有限个第一类间断点
  3. 在一个周期内绝对可积

当这些条件满足时,傅里叶级数在连续点收敛于函数值,在间断点收敛于左右极限的平均值。

傅里叶系数计算
正交性与系数求解

傅里叶系数的计算基于三角函数系的正交性。对于周期为 2 π 2\pi 2π 的函数 f ( x ) f(x) f(x),其傅里叶系数计算公式为:
a n = 1 π ∫ − π π f ( x ) cos ⁡ ( n x ) d x ( n = 0 , 1 , 2 , ⋯   ) a_n = \frac{1}{\pi} \int_{-\pi}^{\pi} f(x) \cos(nx) dx \quad (n = 0,1,2,\cdots) an=π1∫−ππf(x)cos(nx)dx(n=0,1,2,⋯)
b n = 1 π ∫ − π π f ( x ) sin ⁡ ( n x ) d x ( n = 1 , 2 , 3 , ⋯   ) b_n = \frac{1}{\pi} \int_{-\pi}^{\pi} f(x) \sin(nx) dx \quad (n = 1,2,3,\cdots) bn=π1∫−ππf(x)sin(nx)dx(n=1,2,3,⋯)

对于奇函数和偶函数,傅里叶级数可以简化:

  • 奇函数: a n = 0 a_n = 0 an=0,只有正弦项
  • 偶函数: b n = 0 b_n = 0 bn=0,只有余弦项
正交性原理

三角函数系的正交性体现在:
∫ − π π cos ⁡ ( n x ) cos ⁡ ( m x ) d x = { 0 n ≠ m π n = m ≠ 0 2 π n = m = 0 \int_{-\pi}^{\pi} \cos(nx) \cos(mx) dx = \begin{cases} 0 & n \neq m \\ \pi & n = m \neq 0 \\ 2\pi & n = m = 0 \end{cases} ∫−ππcos(nx)cos(mx)dx=⎩ ⎨ ⎧0π2πn=mn=m=0n=m=0
∫ − π π sin ⁡ ( n x ) sin ⁡ ( m x ) d x = { 0 n ≠ m π n = m \int_{-\pi}^{\pi} \sin(nx) \sin(mx) dx = \begin{cases} 0 & n \neq m \\ \pi & n = m \end{cases} ∫−ππsin(nx)sin(mx)dx={0πn=mn=m
∫ − π π sin ⁡ ( n x ) cos ⁡ ( m x ) d x = 0 ∀ n , m \int_{-\pi}^{\pi} \sin(nx) \cos(mx) dx = 0 \quad \forall n, m ∫−ππsin(nx)cos(mx)dx=0∀n,m

这种正交性保证了傅里叶系数的唯一性,并简化了计算过程。

傅里叶变换
连续傅里叶变换

傅里叶变换将时域信号转换为频域表示,定义为:
F ( ω ) = ∫ − ∞ ∞ f ( t ) e − i ω t d t F(\omega) = \int_{-\infty}^{\infty} f(t) e^{-i\omega t} dt F(ω)=∫−∞∞f(t)e−iωtdt

其逆变换为:
f ( t ) = 1 2 π ∫ − ∞ ∞ F ( ω ) e i ω t d ω f(t) = \frac{1}{2\pi} \int_{-\infty}^{\infty} F(\omega) e^{i\omega t} d\omega f(t)=2π1∫−∞∞F(ω)eiωtdω

基本性质
  1. 线性性 : F [ a f ( t ) + b g ( t ) ] = a F ( ω ) + b G ( ω ) \mathcal{F}[af(t)+bg(t)] = aF(\omega)+bG(\omega) F[af(t)+bg(t)]=aF(ω)+bG(ω)
  2. 时移性 : F [ f ( t − t 0 ) ] = F ( ω ) e − i ω t 0 \mathcal{F}[f(t-t_0)] = F(\omega)e^{-i\omega t_0} F[f(t−t0)]=F(ω)e−iωt0
  3. 频移性 : F [ f ( t ) e i ω 0 t ] = F ( ω − ω 0 ) \mathcal{F}[f(t)e^{i\omega_0 t}] = F(\omega-\omega_0) F[f(t)eiω0t]=F(ω−ω0)
  4. 尺度变换 : F [ f ( a t ) ] = 1 ∣ a ∣ F ( ω a ) \mathcal{F}[f(at)] = \frac{1}{|a|}F(\frac{\omega}{a}) F[f(at)]=∣a∣1F(aω)
  5. 卷积定理:时域卷积对应频域乘积
  6. Parseval定理:时域和频域能量守恒
应用
信号处理

傅里叶变换在信号处理中用于:

  • 频谱分析:识别信号中的频率成分
  • 滤波器设计:实现低通、高通、带通等滤波器
  • 信号去噪:分离有用信号和噪声
  • 调制解调:在通信系统中实现信号的调制与解调
  • 图像处理:在频域进行图像增强和压缩
系统分析

在系统分析中,傅里叶变换用于:

  • 研究LTI系统的频率响应
  • 分析系统的稳定性和性能
  • 设计控制系统
  • 系统辨识:通过频域分析确定系统模型
  • 故障诊断:通过频谱特征识别系统故障
实例应用

实例 1:信号的频谱分析

考虑信号 f ( t ) = 2 cos ⁡ ( 5 t ) + 3 sin ⁡ ( 2 t ) f(t) = 2\cos(5t) + 3\sin(2t) f(t)=2cos(5t)+3sin(2t),其傅里叶变换为:
F ( ω ) = 2 π [ δ ( ω − 5 ) + δ ( ω + 5 ) ] + 3 π i [ δ ( ω − 2 ) − δ ( ω + 2 ) ] F(\omega) = 2\pi[\delta(\omega-5)+\delta(\omega+5)] + \frac{3\pi}{i}[\delta(\omega-2)-\delta(\omega+2)] F(ω)=2π[δ(ω−5)+δ(ω+5)]+i3π[δ(ω−2)−δ(ω+2)]

通过傅里叶变换,可以清晰地识别出信号中包含的5 rad/s和2 rad/s两个频率成分。

实例 2:系统的频率响应

对于RC低通滤波器,其传递函数为:
H ( ω ) = 1 1 + i ω R C H(\omega) = \frac{1}{1+i\omega RC} H(ω)=1+iωRC1

通过傅里叶变换,可以分析系统对不同频率信号的衰减特性,确定截止频率为 ω c = 1 R C \omega_c = \frac{1}{RC} ωc=RC1,为滤波器设计提供理论依据。

实例 3:图像压缩

在JPEG图像压缩中,首先对图像进行分块,然后对每个8×8的块进行离散余弦变换(DCT),将图像从空间域转换到频域。通过量化高频分量,保留主要低频信息,从而实现图像压缩。

实例 4:通信系统

在正交频分复用(OFDM)系统中,利用快速傅里叶变换(FFT)将高速数据流分解为多个低速子载波,提高了频谱利用率和抗干扰能力,广泛应用于4G/5G移动通信系统。

第八部分:矩阵理论

矩阵理论是工程数学的核心内容之一,为线性代数、优化理论等提供了重要的数学工具。本节将深入探讨矩阵分解、线性变换和最优化问题等关键内容,从基本概念到实际应用,由浅入深地展开讨论。

矩阵分解

矩阵分解是将复杂矩阵分解为若干更简单矩阵乘积的过程,这种分解不仅便于计算和分析,还能揭示矩阵的内在结构特征。常见的矩阵分解方法包括LU分解、QR分解和奇异值分解(SVD),每种方法都有其特定的应用场景和优势。

LU分解

LU分解是求解线性方程组的基础方法,它将一个方阵 A A A分解为一个下三角矩阵 L L L和一个上三角矩阵 U U U的乘积:
A = L U A = LU A=LU

其中, L L L为单位下三角矩阵(主对角线元素为1), U U U为上三角矩阵。LU分解在求解线性方程组、计算行列式和逆矩阵等方面有广泛应用。

计算方法

LU分解通常通过高斯消元法实现,具体步骤如下:

  1. 对矩阵 A A A进行高斯消元,得到上三角矩阵 U U U
  2. 在消元过程中记录下每一步的系数,构造出下三角矩阵 L L L
  3. 若出现主元为零的情况,需要进行行交换(引入置换矩阵 P P P,即PLU分解)
实例

考虑矩阵

A = ( 2 3 1 4 7 7 6 18 22 ) A = \begin{pmatrix} 2 & 3 & 1 \\ 4 & 7 & 7 \\ 6 & 18 & 22 \end{pmatrix} A= 24637181722

通过LU分解,可以得到

L = ( 1 0 0 2 1 0 3 3 1 ) , U = ( 2 3 1 0 1 5 0 0 2 ) L = \begin{pmatrix} 1 & 0 & 0 \\ 2 & 1 & 0 \\ 3 & 3 & 1 \end{pmatrix}, \quad U = \begin{pmatrix} 2 & 3 & 1 \\ 0 & 1 & 5 \\ 0 & 0 & 2 \end{pmatrix} L= 123013001 ,U= 200310152

验证:

L U = ( 1 0 0 2 1 0 3 3 1 ) ( 2 3 1 0 1 5 0 0 2 ) = ( 2 3 1 4 7 7 6 18 22 ) = A LU = \begin{pmatrix} 1 & 0 & 0 \\ 2 & 1 & 0 \\ 3 & 3 & 1 \end{pmatrix} \begin{pmatrix} 2 & 3 & 1 \\ 0 & 1 & 5 \\ 0 & 0 & 2 \end{pmatrix} = \begin{pmatrix} 2 & 3 & 1 \\ 4 & 7 & 7 \\ 6 & 18 & 22 \end{pmatrix} = A LU= 123013001 200310152 = 24637181722 =A

QR分解

QR分解是解决最小二乘问题和计算特征值的重要工具,它将一个矩阵 A A A分解为一个正交矩阵 Q Q Q和一个上三角矩阵 R R R的乘积:
A = Q R A = QR A=QR

其中, Q Q Q满足 Q T Q = I Q^T Q = I QTQ=I, R R R为上三角矩阵。QR分解在数值线性代数中具有重要地位。

计算方法

QR分解的实现方法主要有:

  1. 格拉姆-施密特正交化:逐步构造正交基
  2. 豪斯霍尔德变换:通过反射变换实现正交化
  3. 吉文斯旋转:通过平面旋转实现正交化
实例

对于矩阵

A = ( 1 1 1 − 1 1 1 ) A = \begin{pmatrix} 1 & 1 \\ 1 & -1 \\ 1 & 1 \end{pmatrix} A= 1111−11

其QR分解为

Q = ( 1 3 1 2 1 3 − 1 2 1 3 0 ) , R = ( 3 1 2 0 2 ) Q = \begin{pmatrix} \frac{1}{\sqrt{3}} & \frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{3}} & -\frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{3}} & 0 \end{pmatrix}, \quad R = \begin{pmatrix} \sqrt{3} & \frac{1}{\sqrt{2}} \\ 0 & \sqrt{2} \end{pmatrix} Q= 3 13 13 12 1−2 10 ,R=(3 02 12 )

验证:

Q R = ( 1 3 1 2 1 3 − 1 2 1 3 0 ) ( 3 1 2 0 2 ) = ( 1 1 1 − 1 1 1 ) = A QR = \begin{pmatrix} \frac{1}{\sqrt{3}} & \frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{3}} & -\frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{3}} & 0 \end{pmatrix} \begin{pmatrix} \sqrt{3} & \frac{1}{\sqrt{2}} \\ 0 & \sqrt{2} \end{pmatrix}= \begin{pmatrix} 1 & 1 \\ 1 & -1 \\ 1 & 1 \end{pmatrix} = A QR= 3 13 13 12 1−2 10 (3 02 12 )= 1111−11 =A

奇异值分解(SVD)

奇异值分解是矩阵分析中最强大的工具之一,它将任意矩阵 A A A分解为三个矩阵的乘积:
A = U Σ V T A = U \Sigma V^T A=UΣVT

其中, U U U和 V V V是正交矩阵, Σ \Sigma Σ是一个对角矩阵,其对角线上的元素称为奇异值。SVD在数据压缩、噪声过滤、主成分分析等领域有广泛应用。

计算方法

SVD的计算通常通过:

  1. 双谱算法:适用于中小规模矩阵
  2. 雅可比旋转法:适用于对称矩阵
  3. 分治法:适用于大规模矩阵
实例

对于矩阵

A = ( 3 1 1 3 ) A = \begin{pmatrix} 3 & 1 \\ 1 & 3 \end{pmatrix} A=(3113)

其奇异值分解为

U = ( 1 2 − 1 2 1 2 1 2 ) , Σ = ( 4 0 0 2 ) , V T = U T U = \begin{pmatrix} \frac{1}{\sqrt{2}} & -\frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}} \end{pmatrix}, \quad \Sigma = \begin{pmatrix} 4 & 0 \\ 0 & 2 \end{pmatrix}, \quad V^T = U^T U=(2 12 1−2 12 1),Σ=(4002),VT=UT

验证:

U Σ V T = ( 1 2 − 1 2 1 2 1 2 ) ( 4 0 0 2 ) ( 1 2 1 2 − 1 2 1 2 ) = ( 3 1 1 3 ) = A U \Sigma V^T = \begin{pmatrix} \frac{1}{\sqrt{2}} & -\frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}} \end{pmatrix} \begin{pmatrix} 4 & 0 \\ 0 & 2 \end{pmatrix} \begin{pmatrix} \frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}} \\ -\frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}} \end{pmatrix}= \begin{pmatrix} 3 & 1 \\ 1 & 3 \end{pmatrix} = A UΣVT=(2 12 1−2 12 1)(4002)(2 1−2 12 12 1)=(3113)=A

应用

矩阵理论在工程领域中有广泛的应用,主要包括线性变换和最优化问题等。

线性变换

线性变换是保持向量加法和标量乘法的映射,其可以通过矩阵来表示和分析。

矩阵与线性映射

给定一个线性变换 T : R n → R m T: \mathbb{R}^n \to \mathbb{R}^m T:Rn→Rm,存在唯一的矩阵 A ∈ R m × n A \in \mathbb{R}^{m \times n} A∈Rm×n,使得
T ( x ) = A x T(\mathbf{x}) = A\mathbf{x} T(x)=Ax

其中, x ∈ R n \mathbf{x} \in \mathbb{R}^n x∈Rn为输入向量, A x ∈ R m A\mathbf{x} \in \mathbb{R}^m Ax∈Rm为输出向量。

基本性质
  • 保持加法 : T ( x + y ) = T ( x ) + T ( y ) T(\mathbf{x} + \mathbf{y}) = T(\mathbf{x}) + T(\mathbf{y}) T(x+y)=T(x)+T(y)
  • 保持标量乘法 : T ( c x ) = c T ( x ) T(c\mathbf{x}) = cT(\mathbf{x}) T(cx)=cT(x)
  • 组合性 :若 T 1 T_1 T1和 T 2 T_2 T2分别由矩阵 A A A和 B B B表示,则 T 1 ∘ T 2 T_1 \circ T_2 T1∘T2由矩阵 B A BA BA表示
  • 核与像空间 :核空间 ker ⁡ ( T ) \ker(T) ker(T)和像空间 im ⁡ ( T ) \operatorname{im}(T) im(T)是重要的子空间
  • 秩-零度定理 : dim ⁡ ( ker ⁡ ( T ) ) + dim ⁡ ( im ⁡ ( T ) ) = n \dim(\ker(T)) + \dim(\operatorname{im}(T)) = n dim(ker(T))+dim(im(T))=n
实例

考虑线性变换 T : R 2 → R 2 T: \mathbb{R}^2 \to \mathbb{R}^2 T:R2→R2,其矩阵表示为
A = ( 2 0 0 3 ) A = \begin{pmatrix} 2 & 0 \\ 0 & 3 \end{pmatrix} A=(2003)

则对于向量 x = ( x y ) \mathbf{x} = \begin{pmatrix} x \\ y \end{pmatrix} x=(xy),有
T ( x ) = A x = ( 2 x 3 y ) T(\mathbf{x}) = A\mathbf{x} = \begin{pmatrix} 2x \\ 3y \end{pmatrix} T(x)=Ax=(2x3y)

此变换对应于 x x x轴方向的缩放因子为2, y y y轴方向的缩放因子为3。

最优化问题

最优化问题旨在找到一个目标函数的最优值(最小值或最大值),通常在一定约束条件下进行。

二次规划与拉格朗日乘数法

二次规划是一类特殊的最优化问题,其目标函数为二次函数,约束条件为线性不等式或等式。
min ⁡ x 1 2 x T Q x + c T x \min_{\mathbf{x}} \frac{1}{2}\mathbf{x}^T Q \mathbf{x} + \mathbf{c}^T \mathbf{x} xmin21xTQx+cTx

受限于
A x ≤ b A\mathbf{x} \leq \mathbf{b} Ax≤b

其中, Q Q Q是对称正定矩阵,确保目标函数的凸性。

拉格朗日乘数法

拉格朗日乘数法是一种用于求解带等式约束的最优化问题的方法。对于目标函数 f ( x ) f(\mathbf{x}) f(x),约束条件 g ( x ) = 0 g(\mathbf{x}) = 0 g(x)=0,构建拉格朗日函数:
L ( x , λ ) = f ( x ) + λ g ( x ) \mathcal{L}(\mathbf{x}, \lambda) = f(\mathbf{x}) + \lambda g(\mathbf{x}) L(x,λ)=f(x)+λg(x)

通过对 L \mathcal{L} L分别对 x \mathbf{x} x和 λ \lambda λ求偏导并令其为零,得到最优解。

实例

求解以下二次规划问题:
min ⁡ x x 1 2 + x 2 2 \min_{\mathbf{x}} x_1^2 + x_2^2 xminx12+x22

受限于
x 1 + x 2 ≥ 1 x_1 + x_2 \geq 1 x1+x2≥1

通过构建拉格朗日函数:
L ( x 1 , x 2 , λ ) = x 1 2 + x 2 2 + λ ( 1 − x 1 − x 2 ) \mathcal{L}(x_1, x_2, \lambda) = x_1^2 + x_2^2 + \lambda (1 - x_1 - x_2) L(x1,x2,λ)=x12+x22+λ(1−x1−x2)

求解KKT条件:
∂ L ∂ x 1 = 2 x 1 − λ = 0 ∂ L ∂ x 2 = 2 x 2 − λ = 0 ∂ L ∂ λ = 1 − x 1 − x 2 = 0 \frac{\partial \mathcal{L}}{\partial x_1} = 2x_1 - \lambda = 0 \\ \frac{\partial \mathcal{L}}{\partial x_2} = 2x_2 - \lambda = 0 \\ \frac{\partial \mathcal{L}}{\partial \lambda} = 1 - x_1 - x_2 = 0 ∂x1∂L=2x1−λ=0∂x2∂L=2x2−λ=0∂λ∂L=1−x1−x2=0

解得:
x 1 = x 2 = 1 2 , λ = 1 x_1 = x_2 = \frac{1}{2}, \quad \lambda = 1 x1=x2=21,λ=1

对应的最小值为:
1 2 2 + 1 2 2 = 1 2 \frac{1}{2}^2 + \frac{1}{2}^2 = \frac{1}{2} 212+212=21

第九部分:偏微分方程

基本概念与分类

偏微分方程(Partial Differential Equations, PDEs)是描述多变量函数及其偏导数之间关系的方程,在工程、物理等领域有广泛应用。根据方程中最高阶导数的性质,偏微分方程可分为三类:

椭圆型方程

椭圆型偏微分方程通常用于描述稳态过程,如热传导、电场分布和流体力学中的势流问题。其标准形式为:
A ∂ 2 u ∂ x 2 + B ∂ 2 u ∂ x ∂ y + C ∂ 2 u ∂ y 2 + D ∂ u ∂ x + E ∂ u ∂ y + F u = G A \frac{\partial^2 u}{\partial x^2} + B \frac{\partial^2 u}{\partial x \partial y} + C \frac{\partial^2 u}{\partial y^2} + D \frac{\partial u}{\partial x} + E \frac{\partial u}{\partial y} + Fu = G A∂x2∂2u+B∂x∂y∂2u+C∂y2∂2u+D∂x∂u+E∂y∂u+Fu=G

其中,系数满足判别式 B 2 − 4 A C < 0 B^2 - 4AC < 0 B2−4AC<0。典型的椭圆型方程包括:

  1. 拉普拉斯方程:
    Δ u = ∂ 2 u ∂ x 2 + ∂ 2 u ∂ y 2 = 0 \Delta u = \frac{\partial^2 u}{\partial x^2} + \frac{\partial^2 u}{\partial y^2} = 0 Δu=∂x2∂2u+∂y2∂2u=0
  2. 泊松方程:
    Δ u = f ( x , y ) \Delta u = f(x,y) Δu=f(x,y)
  3. 亥姆霍兹方程:
    Δ u + k 2 u = 0 \Delta u + k^2u = 0 Δu+k2u=0
    应用实例
  • 稳态热传导问题中的温度分布
  • 静电场中的电势分布
  • 不可压缩流体的势流问题
  • 弹性力学中的平面应力问题
抛物型方程

抛物型偏微分方程常用于描述扩散过程,如热传导、物质扩散和金融数学中的期权定价。其标准形式为:
A ∂ 2 u ∂ x 2 + B ∂ u ∂ t + C ∂ u ∂ x + D u = E A \frac{\partial^2 u}{\partial x^2} + B \frac{\partial u}{\partial t} + C \frac{\partial u}{\partial x} + Du = E A∂x2∂2u+B∂t∂u+C∂x∂u+Du=E

判别式满足 B 2 − 4 A C = 0 B^2 - 4AC = 0 B2−4AC=0。典型的抛物型方程包括:

  1. 热传导方程:
    ∂ u ∂ t = α ∂ 2 u ∂ x 2 \frac{\partial u}{\partial t} = \alpha \frac{\partial^2 u}{\partial x^2} ∂t∂u=α∂x2∂2u
  2. 扩散方程:
    ∂ u ∂ t = D ∂ 2 u ∂ x 2 \frac{\partial u}{\partial t} = D \frac{\partial^2 u}{\partial x^2} ∂t∂u=D∂x2∂2u
  3. Fokker-Planck方程:
    ∂ u ∂ t = − ∂ ∂ x ( a ( x ) u ) + 1 2 ∂ 2 ∂ x 2 ( b ( x ) u ) \frac{\partial u}{\partial t} = -\frac{\partial}{\partial x}(a(x)u) + \frac{1}{2}\frac{\partial^2}{\partial x^2}(b(x)u) ∂t∂u=−∂x∂(a(x)u)+21∂x2∂2(b(x)u)
    应用实例
  • 物体内部温度随时间的变化
  • 污染物在环境中的扩散
  • Black-Scholes期权定价模型
  • 粒子在势场中的运动
双曲型方程

双曲型偏微分方程主要用于描述波动现象,如声波、电磁波和弹性力学中的振动问题。其标准形式为:
A ∂ 2 u ∂ t 2 + B ∂ 2 u ∂ x 2 + C ∂ u ∂ t + D ∂ u ∂ x + E u = F A \frac{\partial^2 u}{\partial t^2} + B \frac{\partial^2 u}{\partial x^2} + C \frac{\partial u}{\partial t} + D \frac{\partial u}{\partial x} + Eu = F A∂t2∂2u+B∂x2∂2u+C∂t∂u+D∂x∂u+Eu=F

判别式满足 B 2 − 4 A C > 0 B^2 - 4AC > 0 B2−4AC>0。典型的双曲型方程包括:

  1. 波动方程:
    ∂ 2 u ∂ t 2 = c 2 ∂ 2 u ∂ x 2 \frac{\partial^2 u}{\partial t^2} = c^2 \frac{\partial^2 u}{\partial x^2} ∂t2∂2u=c2∂x2∂2u
  2. 电报方程:
    ∂ 2 u ∂ t 2 + 2 α ∂ u ∂ t + β 2 u = c 2 ∂ 2 u ∂ x 2 \frac{\partial^2 u}{\partial t^2} + 2\alpha \frac{\partial u}{\partial t} + \beta^2 u = c^2 \frac{\partial^2 u}{\partial x^2} ∂t2∂2u+2α∂t∂u+β2u=c2∂x2∂2u
  3. Klein-Gordon方程:
    ∂ 2 u ∂ t 2 − Δ u + m 2 u = 0 \frac{\partial^2 u}{\partial t^2} - \Delta u + m^2u = 0 ∂t2∂2u−Δu+m2u=0
    应用实例
  • 声波在空气中的传播
  • 电磁波在介质中的传播
  • 弹性体的振动问题
  • 量子场论中的标量场

求解方法

分离变量法

分离变量法是求解线性偏微分方程的经典方法,适用于具有齐次边界条件的问题。基本步骤如下:

  1. 假设解可以表示为各变量的乘积形式,即 u ( x , y ) = X ( x ) Y ( y ) u(x, y) = X(x)Y(y) u(x,y)=X(x)Y(y)。
  2. 将假设代入原方程,分离变量,使得两边只含有单一变量的函数。
  3. 得到两个常微分方程,分别关于 X ( x ) X(x) X(x) 和 Y ( y ) Y(y) Y(y)。
  4. 求解这两个常微分方程,得到通解。
  5. 根据边界条件确定常数,得到特定解。

实例 :求解一维热传导方程
∂ u ∂ t = α ∂ 2 u ∂ x 2 \frac{\partial u}{\partial t} = \alpha \frac{\partial^2 u}{\partial x^2} ∂t∂u=α∂x2∂2u

假设解为 u ( x , t ) = X ( x ) T ( t ) u(x, t) = X(x)T(t) u(x,t)=X(x)T(t),代入方程后可得到
1 α T d T d t = 1 X d 2 X d x 2 = − λ \frac{1}{\alpha T} \frac{dT}{dt} = \frac{1}{X} \frac{d^2 X}{dx^2} = -\lambda αT1dtdT=X1dx2d2X=−λ

从而得到两个常微分方程:
d T d t + α λ T = 0 \frac{dT}{dt} + \alpha \lambda T = 0 dtdT+αλT=0
d 2 X d x 2 + λ X = 0 \frac{d^2 X}{dx^2} + \lambda X = 0 dx2d2X+λX=0

根据边界条件求解,得到温度分布随时间的变化规律。

特征线法

特征线法适用于一阶偏微分方程,通过寻找特征线将偏微分方程转化为常微分方程。基本步骤:

  1. 将偏微分方程写成标准形式:
    a ( x , y ) ∂ u ∂ x + b ( x , y ) ∂ u ∂ y = c ( x , y ) a(x, y) \frac{\partial u}{\partial x} + b(x, y) \frac{\partial u}{\partial y} = c(x, y) a(x,y)∂x∂u+b(x,y)∂y∂u=c(x,y)
  2. 构造特征方程组:
    d x d s = a ( x , y ) , d y d s = b ( x , y ) , d u d s = c ( x , y ) \frac{dx}{ds} = a(x, y), \quad \frac{dy}{ds} = b(x, y), \quad \frac{du}{ds} = c(x, y) dsdx=a(x,y),dsdy=b(x,y),dsdu=c(x,y)
  3. 解特征方程组,得到特征曲线。
  4. 在特征曲线上求解 u u u。

实例 :求解一阶线性偏微分方程
∂ u ∂ x + ∂ u ∂ y = 0 \frac{\partial u}{\partial x} + \frac{\partial u}{\partial y} = 0 ∂x∂u+∂y∂u=0

特征方程为:
d x d s = 1 , d y d s = 1 , d u d s = 0 \frac{dx}{ds} = 1, \quad \frac{dy}{ds} = 1, \quad \frac{du}{ds} = 0 dsdx=1,dsdy=1,dsdu=0

解得特征线为 y − x = const y - x = \text{const} y−x=const,因此解为 u ( x , y ) = f ( y − x ) u(x, y) = f(y - x) u(x,y)=f(y−x)。

数值解法

对于无法通过解析方法求解的复杂偏微分方程,数值解法是重要的求解工具。常见的方法包括:

  1. 有限差分法:

    • 将连续的偏微分方程离散化,转化为代数方程
    • 构建差分网格,定义网格点
    • 在网格点上应用差分近似,得到离散方程组
    • 使用数值方法(如迭代法)求解方程组
    • 优点:简单直观,易于实现
    • 缺点:对复杂几何形状适应性差
  2. 有限元法:

    • 将求解区域划分为有限个单元
    • 在每个单元上构造近似函数
    • 通过变分原理或加权残值法建立代数方程组
    • 求解方程组得到近似解
    • 优点:适应复杂几何形状,精度高
    • 缺点:计算量大,实现复杂
  3. 谱方法:

    • 使用全局基函数(如傅里叶级数或切比雪夫多项式)近似解
    • 通过Galerkin方法或配点法建立代数方程组
    • 求解方程组得到高精度近似解
    • 优点:高精度,收敛快
    • 缺点:对非光滑解适应性差

实例 :使用有限差分法求解热传导方程
∂ u ∂ t = α ∂ 2 u ∂ x 2 \frac{\partial u}{\partial t} = \alpha \frac{\partial^2 u}{\partial x^2} ∂t∂u=α∂x2∂2u

离散化后得到:
u i n + 1 − u i n Δ t = α u i + 1 n − 2 u i n + u i − 1 n ( Δ x ) 2 \frac{u_i^{n+1} - u_i^n}{\Delta t} = \alpha \frac{u_{i+1}^n - 2u_i^n + u_{i-1}^n}{(\Delta x)^2} Δtuin+1−uin=α(Δx)2ui+1n−2uin+ui−1n

通过迭代计算,可以获得 u u u 在离散网格上的近似值。

边界条件与适定性

偏微分方程的求解需要考虑边界条件和初始条件,常见边界条件包括:

  1. 狄利克雷边界条件:指定函数在边界上的值
  2. 诺伊曼边界条件:指定函数在边界上的法向导数
  3. 混合边界条件:同时包含函数值及其导数的条件
  4. 周期边界条件:函数在边界上满足周期性条件

偏微分方程的适定性要求解满足:

  1. 存在性:至少存在一个解
  2. 唯一性:解是唯一的
  3. 稳定性:解对初始条件和边界条件连续依赖

补充说明

  • 对于不同类型的偏微分方程,需要采用不同的边界条件组合
  • 适定性是偏微分方程理论研究的核心问题之一
  • 在实际应用中,还需要考虑数值稳定性和收敛性等问题

第十部分:非线性系统分析

非线性系统广泛存在于工程实践中,其分析与线性系统有显著不同。本节将系统介绍非线性系统分析的三大核心方法:稳定性理论、相平面分析和混沌理论。

稳定性理论

李雅普诺夫方法

李雅普诺夫方法是分析非线性动态系统稳定性的强大工具,由俄罗斯数学家亚历山大·李雅普诺夫于1892年提出。其核心思想是通过构造一个李雅普诺夫函数 V ( x ) V(x) V(x) 来研究系统的稳定性,而无需求解系统的具体解。

李雅普诺夫函数的定义

对于一个自治非线性系统:
d x d t = f ( x ) \frac{dx}{dt} = f(x) dtdx=f(x)

其中, x ∈ R n x \in \mathbb{R}^n x∈Rn, f ( x ) f(x) f(x) 是连续可微函数。李雅普诺夫函数 V ( x ) V(x) V(x) 需要满足以下条件:

  1. 正定性: V ( x ) V(x) V(x) 在平衡点 x = 0 x = 0 x=0 处有极小值,即 V ( 0 ) = 0 V(0) = 0 V(0)=0 且 V ( x ) > 0 V(x) > 0 V(x)>0 对于所有 x ≠ 0 x \neq 0 x=0。
  2. 导数条件: V ( x ) V(x) V(x) 关于时间的导数 d V d t \frac{dV}{dt} dtdV 满足:
    d V d t = ∇ V ( x ) ⋅ f ( x ) ≤ 0 \frac{dV}{dt} = \nabla V(x) \cdot f(x) \leq 0 dtdV=∇V(x)⋅f(x)≤0
稳定性判据
  • 稳定性

    如果存在李雅普诺夫函数 V ( x ) V(x) V(x) 使得 d V d t ≤ 0 \frac{dV}{dt} \leq 0 dtdV≤0,则平衡点 x = 0 x = 0 x=0 是稳定的。

  • 渐近稳定性

    如果 d V d t < 0 \frac{dV}{dt} < 0 dtdV<0 除 x = 0 x = 0 x=0 外,则平衡点是渐近稳定的,即系统状态将随着时间趋向于平衡点。

  • 全局渐近稳定性

    如果李雅普诺夫函数 V ( x ) V(x) V(x) 满足 V ( x ) → ∞ V(x) \to \infty V(x)→∞ 当 ∣ ∣ x ∣ ∣ → ∞ ||x|| \to \infty ∣∣x∣∣→∞,且 d V d t < 0 \frac{dV}{dt} < 0 dtdV<0 对所有 x ≠ 0 x \neq 0 x=0 成立,则平衡点是全局渐近稳定的。

应用实例

实例 1 :考虑一维线性系统
d x d t = − k x \frac{dx}{dt} = -kx dtdx=−kx

其中 k > 0 k > 0 k>0。选择李雅普诺夫函数 V ( x ) = 1 2 x 2 V(x) = \frac{1}{2}x^2 V(x)=21x2,则
d V d t = x ⋅ ( − k x ) = − k x 2 ≤ 0 \frac{dV}{dt} = x \cdot (-kx) = -kx^2 \leq 0 dtdV=x⋅(−kx)=−kx2≤0

因此,系统在 x = 0 x = 0 x=0 处是渐近稳定的。

实例 2 :考虑非线性系统
d x d t = − x 3 \frac{dx}{dt} = -x^3 dtdx=−x3

选择 V ( x ) = 1 2 x 2 V(x) = \frac{1}{2}x^2 V(x)=21x2,则
d V d t = x ⋅ ( − x 3 ) = − x 4 < 0 ( x ≠ 0 ) \frac{dV}{dt} = x \cdot (-x^3) = -x^4 < 0 \quad (x \neq 0) dtdV=x⋅(−x3)=−x4<0(x=0)

系统在 x = 0 x = 0 x=0 处是全局渐近稳定的。

相平面分析

相平面分析是一种直观的方法,用于研究二维非线性动态系统的行为。通过在相平面上绘制系统的轨道,可以直观地观察系统的稳定性和长期行为。

系统方程

考虑二维非线性系统:
{ d x d t = f ( x , y ) d y d t = g ( x , y ) \begin{cases} \frac{dx}{dt} = f(x, y) \\ \frac{dy}{dt} = g(x, y) \end{cases} {dtdx=f(x,y)dtdy=g(x,y)

平衡点与稳定性
  • 平衡点 :满足 f ( x , y ) = 0 f(x, y) = 0 f(x,y)=0 和 g ( x , y ) = 0 g(x, y) = 0 g(x,y)=0 的点,表示系统在该点处保持不变。

  • 稳定性分析

    通过线性化系统,可以分析平衡点的稳定性。线性化系统的雅可比矩阵为:
    J = ( ∂ f ∂ x ∂ f ∂ y ∂ g ∂ x ∂ g ∂ y ) J = \begin{pmatrix} \frac{\partial f}{\partial x} & \frac{\partial f}{\partial y} \\ \frac{\partial g}{\partial x} & \frac{\partial g}{\partial y} \end{pmatrix} J=(∂x∂f∂x∂g∂y∂f∂y∂g)

    计算雅可比矩阵的特征值,可以判断平衡点的类型和稳定性。

稳定性分类
  1. 稳定节点:两个实负特征值,系统状态趋向平衡点。
  2. 不稳定节点:两个实正特征值,系统状态远离平衡点。
  3. 鞍点:特征值一正一负,系统在某些方向稳定,某些方向不稳定。
  4. 稳定焦点:复特征值,实部为负,系统状态呈螺旋趋向平衡点。
  5. 不稳定焦点:复特征值,实部为正,系统状态呈螺旋远离平衡点。
应用实例

实例 1 :分析系统
{ d x d t = y d y d t = − x − y \begin{cases} \frac{dx}{dt} = y \\ \frac{dy}{dt} = -x - y \end{cases} {dtdx=ydtdy=−x−y

平衡点为 ( 0 , 0 ) (0, 0) (0,0)。雅可比矩阵为:
J = ( 0 1 − 1 − 1 ) J = \begin{pmatrix} 0 & 1 \\ -1 & -1 \end{pmatrix} J=(0−11−1)

特征方程为:
λ 2 + λ + 1 = 0 \lambda^2 + \lambda + 1 = 0 λ2+λ+1=0

解得特征值为 λ = − 1 ± − 3 2 \lambda = \frac{-1 \pm \sqrt{-3}}{2} λ=2−1±−3 ,实部为负,系统在原点为稳定焦点,系统状态将以螺旋方式趋向于平衡点。

实例 2 :Van der Pol 振子
{ d x d t = y d y d t = μ ( 1 − x 2 ) y − x \begin{cases} \frac{dx}{dt} = y \\ \frac{dy}{dt} = \mu(1-x^2)y - x \end{cases} {dtdx=ydtdy=μ(1−x2)y−x

当 μ > 0 \mu > 0 μ>0 时,系统存在稳定的极限环,表现出自激振荡行为。

混沌理论

混沌理论研究的是非线性系统中高度敏感的动态行为,即微小的初始条件变化会引起系统状态的巨大差异。混沌系统在许多自然现象和工程应用中普遍存在。

混沌系统的特征
  1. 敏感依赖初值

    混沌系统对初始条件极为敏感,即使是极小的初始差异也会随着时间的推移迅速放大,导致系统行为的不可预测性。数学上,混沌系统的李雅普诺夫指数 λ \lambda λ 满足 λ > 0 \lambda > 0 λ>0。

  2. 拓扑混合性

    任意两个区域内的轨道随着时间的推移会相互交织,系统的轨道在相空间中复杂交错。

  3. 密集不稳定周期轨道

    混沌吸引子中包含无限多个周期轨道,这些周期轨道在相空间中密集分布。

李雅普诺夫指数

李雅普诺夫指数是衡量系统对初始条件敏感性的指标。对于一个 n n n 维系统,存在 n n n 个李雅普诺夫指数,其中最大的一个决定了系统是否具有混沌性。

定义:
λ = lim ⁡ t → ∞ 1 t ln ⁡ ∣ ∣ δ x ( t ) ∣ ∣ ∣ ∣ δ x ( 0 ) ∣ ∣ \lambda = \lim_{t \to \infty} \frac{1}{t} \ln \frac{||\delta x(t)||}{||\delta x(0)||} λ=t→∞limt1ln∣∣δx(0)∣∣∣∣δx(t)∣∣

如果 λ > 0 \lambda > 0 λ>0,则系统对初始条件敏感,可能表现出混沌行为。

分岔现象

分岔指的是随着系统参数的变化,系统动力学行为发生质的变化。分岔是混沌生成的前兆,它标志着系统从简单行为向复杂行为的过渡。

常见的分岔类型
  1. 鞍结分岔

    系统通过参数变化,从稳定状态转变为不稳定状态,通常伴随着周期轨道的出现。

  2. Hopf 分岔

    当系统参数达到临界值时,平衡点由稳定变为不稳定,并产生一个或多个极限环。

  3. 周期倍增分岔

    系统通过一系列的周期倍增过程,最终走向混沌。例如,随着参数的不断增加,系统的周期性行为会变为双周期、四周期,最终演变为不规则的混沌轨道。

应用实例

实例 :Lorenz 系统
{ d x d t = σ ( y − x ) d y d t = x ( ρ − z ) − y d z d t = x y − β z \begin{cases} \frac{dx}{dt} = \sigma (y - x) \\ \frac{dy}{dt} = x (\rho - z) - y \\ \frac{dz}{dt} = xy - \beta z \end{cases} ⎩ ⎨ ⎧dtdx=σ(y−x)dtdy=x(ρ−z)−ydtdz=xy−βz

当参数 ρ \rho ρ 增加时,系统经历从稳定点到极限环,再到混沌的分岔过程。例如,当 ρ > ρ c r i t i c a l \rho > \rho_{critical} ρ>ρcritical,系统表现出混沌行为,轨道在相空间中呈现出复杂的吸引子结构,即著名的"蝴蝶效应"。

附录

符号表与术语解释

  • f ′ ( x ) f'(x) f′(x) :函数 f ( x ) f(x) f(x) 在点 x x x 处的导数,表示瞬时变化率。在微分方程和优化问题中广泛应用。

  • ∫ f ( x ) d x \int f(x) dx ∫f(x)dx :函数 f ( x ) f(x) f(x) 的不定积分,表示所有原函数的集合。在求解微分方程和计算面积、体积等问题中起关键作用。

  • det ⁡ ( A ) \det(A) det(A) :矩阵 A A A 的行列式,用于判断矩阵是否可逆及其他性质。在矩阵分解和线性方程组求解中具有重要意义。

  • S n S_n Sn :全排列的集合,包含所有长度为 n n n 的排列。在组合数学和概率论中经常使用。

  • P ( x ) P(x) P(x), Q ( x ) Q(x) Q(x):一阶线性微分方程中的系数函数,视具体方程而定。在求解微分方程时用于描述方程的结构。

  • C 1 , C 2 C_1, C_2 C1,C2:常数,通常由初始条件或边界条件确定。在求解微分方程时表示通解中的任意常数。

  • 李雅普诺夫指数 λ \lambda λ :衡量系统对初始条件敏感性的指标, λ > 0 \lambda > 0 λ>0 表示系统可能具有混沌行为。在非线性系统分析中用于判断系统的稳定性。

  • α , β \alpha, \beta α,β:在解决二阶常系数齐次微分方程时,表示特征方程的复数根的实部和虚部。在振动系统和热传导问题中常见。

  • Λ \Lambda Λ:通常用于表示拉格朗日乘数或其他特定参数,根据上下文定义。在优化问题和约束系统中使用。

  • V ( x ) V(x) V(x):李雅普诺夫函数,用于分析系统的稳定性。在非线性系统稳定性理论中起核心作用。

  • A , B , C A, B, C A,B,C:在不同的数学公式和方程中表示不同的变量或系数,具体含义依上下文而定。在矩阵理论、微分方程和傅里叶分析中广泛使用。

  • γ \gamma γ:通常表示路径或曲线,在复变函数中用于表示积分路径。

  • μ \mu μ:在概率论中表示期望值,在热传导方程中表示热扩散系数。

  • σ \sigma σ:在概率论中表示标准差,在Lorenz系统中表示普朗特数。

  • ρ \rho ρ:在Lorenz系统中表示瑞利数,在矩阵理论中表示谱半径。

  • ω \omega ω:在傅里叶变换中表示角频率,在振动系统中表示固有频率。

  • t t t:通常表示时间变量,在微分方程和动力系统中作为独立变量。

  • x , y , z x, y, z x,y,z:通常表示空间变量或状态变量,在偏微分方程和动力系统中使用。

  • n n n:在级数中表示项数,在矩阵中表示维度,在概率论中表示样本容量。

  • k k k:在微分方程中表示常数,在傅里叶级数中表示波数。

  • i i i :虚数单位, i 2 = − 1 i^2 = -1 i2=−1,在复变函数和傅里叶变换中使用。

  • λ \lambda λ:在特征值问题中表示特征值,在偏微分方程中表示分离变量常数。在矩阵理论和微分方程中广泛使用。

  • ϕ \phi ϕ:在傅里叶分析中表示相位角,在流体力学中表示速度势函数。在信号处理和流体力学中常见。

  • θ \theta θ:在极坐标中表示角度,在旋转矩阵中表示旋转角度。在几何变换和坐标转换中使用。

  • ϵ \epsilon ϵ:在极限理论中表示无穷小量,在优化问题中表示收敛精度。在微积分和数值分析中常见。

  • δ \delta δ:在狄拉克函数中表示脉冲函数,在变分法中表示微小变化。在信号处理和变分法中使用。

  • ∇ \nabla ∇:表示梯度算子,用于计算标量场的梯度。在向量分析和场论中广泛使用。

  • ∂ \partial ∂:表示偏导数,用于多元函数的微分。在偏微分方程和多变量微积分中使用。

  • ∑ \sum ∑:表示求和符号,用于级数和离散求和。在级数理论和概率论中常见。

  • ∏ \prod ∏:表示连乘积符号,用于序列的乘积。在组合数学和概率论中使用。

  • ∞ \infty ∞:表示无穷大,用于描述极限和积分区间。在微积分和实分析中广泛使用。

  • ∈ \in ∈:表示属于关系,用于描述元素与集合的关系。在集合论和数学分析中使用。

  • ⊂ \subset ⊂:表示子集关系,用于描述集合之间的包含关系。在集合论和拓扑学中常见。

  • ⇒ \Rightarrow ⇒:表示逻辑蕴含,用于描述命题之间的推理关系。在逻辑推理和数学证明中使用。

  • ⇔ \Leftrightarrow ⇔:表示逻辑等价,用于描述命题之间的双向关系。在逻辑推理和数学证明中常见。

  • ∀ \forall ∀:表示全称量词,用于描述对所有元素都成立的命题。在逻辑推理和数学证明中使用。

  • ∃ \exists ∃:表示存在量词,用于描述存在某个元素满足的命题。在逻辑推理和数学证明中常见。

  • A \mathbf{A} A:表示矩阵,在矩阵理论和线性代数中广泛使用。用于表示线性变换、方程组系数等。

  • b \mathbf{b} b:在矩阵方程中表示常数向量,在线性方程组中表示右侧向量。在数值计算和优化问题中常见。

  • c \mathbf{c} c:在优化问题中表示目标函数系数向量,在傅里叶级数中表示余弦系数。在数学建模和信号处理中使用。

  • Q \mathbf{Q} Q:在二次规划中表示二次项系数矩阵,在矩阵分解中表示正交矩阵。在最优化和数值分析中广泛使用。

  • R \mathbf{R} R:在QR分解中表示上三角矩阵,在控制理论中表示状态空间矩阵。在数值计算和系统分析中使用。

  • U , V \mathbf{U}, \mathbf{V} U,V:在奇异值分解中表示正交矩阵,在矩阵理论中表示特征向量矩阵。在数据分析和降维技术中常见。

  • Σ \Sigma Σ:在奇异值分解中表示对角矩阵,在概率论中表示协方差矩阵。在统计分析和机器学习中广泛使用。

  • x \mathbf{x} x:在优化问题中表示决策变量,在微分方程中表示状态变量。在数学建模和系统分析中常见。

  • y \mathbf{y} y:在控制系统中表示输出变量,在回归分析中表示响应变量。在系统识别和数据分析中使用。

  • z \mathbf{z} z:在复变函数中表示复变量,在状态空间模型中表示测量变量。在信号处理和系统控制中常见。

  • f \mathbf{f} f:在微分方程中表示向量场,在优化问题中表示目标函数。在动力系统和数学建模中使用。

  • g \mathbf{g} g:在约束优化中表示约束函数,在微分方程中表示非线性项。在最优化和系统分析中常见。

  • h \mathbf{h} h:在控制系统中表示观测函数,在机器学习中表示假设函数。在系统识别和人工智能中使用。

  • J \mathbf{J} J:在优化问题中表示雅可比矩阵,在控制理论中表示性能指标。在数值计算和系统优化中广泛使用。

  • H \mathbf{H} H:在优化问题中表示海森矩阵,在控制理论中表示哈密顿函数。在数值优化和物理建模中使用。

  • P \mathbf{P} P:在控制理论中表示李雅普诺夫函数矩阵,在概率论中表示转移概率矩阵。在系统稳定性和马尔可夫链分析中常见。

  • K \mathbf{K} K:在控制理论中表示反馈增益矩阵,在优化问题中表示核矩阵。在控制系统设计和机器学习中使用。

  • L \mathbf{L} L:在矩阵分解中表示下三角矩阵,在图论中表示拉普拉斯矩阵。在数值计算和网络分析中常见。

  • M \mathbf{M} M:在力学系统中表示质量矩阵,在数值分析中表示预处理矩阵。在物理建模和数值计算中使用。

  • N \mathbf{N} N:在数值分析中表示迭代矩阵,在概率论中表示正态分布矩阵。在数值计算和统计分析中常见。

  • D \mathbf{D} D:在矩阵理论中表示对角矩阵,在微分方程中表示阻尼矩阵。在数值计算和物理建模中使用。

  • E \mathbf{E} E:在误差分析中表示误差矩阵,在控制理论中表示状态估计矩阵。在系统识别和数值分析中常见。

  • F \mathbf{F} F:在控制理论中表示状态转移矩阵,在数值分析中表示迭代矩阵。在系统分析和数值计算中使用。

  • G \mathbf{G} G:在控制理论中表示控制增益矩阵,在优化问题中表示梯度矩阵。在控制系统设计和数值优化中常见。

  • I \mathbf{I} I:在矩阵理论中表示单位矩阵,在控制理论中表示惯性矩阵。在数值计算和物理建模中使用。

  • O \mathbf{O} O:在矩阵理论中表示零矩阵,在控制理论中表示观测矩阵。在数值计算和系统分析中常见。

  • S \mathbf{S} S:在矩阵理论中表示对称矩阵,在控制理论中表示灵敏度矩阵。在数值优化和系统分析中使用。

  • T \mathbf{T} T:在矩阵理论中表示变换矩阵,在控制理论中表示传递函数矩阵。在数值计算和系统分析中常见。

  • W \mathbf{W} W:在优化问题中表示权重矩阵,在控制理论中表示噪声协方差矩阵。在数值优化和系统识别中使用。

  • X \mathbf{X} X:在状态空间模型中表示状态矩阵,在优化问题中表示决策变量矩阵。在系统分析和数学建模中常见。

  • Y \mathbf{Y} Y:在控制理论中表示输出矩阵,在优化问题中表示对偶变量矩阵。在系统识别和数值优化中使用。

  • Z \mathbf{Z} Z:在控制理论中表示测量矩阵,在优化问题中表示拉格朗日乘子矩阵。在系统分析和数值优化中常见。

  • α \mathbf{\alpha} α:在优化问题中表示步长参数,在控制理论中表示衰减系数。在数值计算和系统分析中使用。

  • β \mathbf{\beta} β:在回归分析中表示回归系数,在控制理论中表示阻尼系数。在统计分析和系统建模中常见。

  • γ \mathbf{\gamma} γ:在优化问题中表示惩罚参数,在控制理论中表示增益系数。在数值优化和系统设计中使用。

  • δ \mathbf{\delta} δ:在数值分析中表示扰动参数,在控制理论中表示偏差系数。在数值计算和系统分析中常见。

  • ϵ \mathbf{\epsilon} ϵ:在数值分析中表示误差项,在优化问题中表示收敛阈值。在数值计算和数学建模中使用。

  • ζ \mathbf{\zeta} ζ:在控制理论中表示阻尼比,在数值分析中表示迭代参数。在系统分析和数值计算中常见。

  • η \mathbf{\eta} η:在优化问题中表示学习率,在控制理论中表示效率系数。在数值优化和系统设计中使用。

  • θ \mathbf{\theta} θ:在控制理论中表示角度变量,在优化问题中表示参数向量。在系统分析和数学建模中常见。

相关推荐
索然无味io8 分钟前
组件框架漏洞
前端·笔记·学习·安全·web安全·网络安全·前端框架
珊瑚里的鱼23 分钟前
【单链表算法实战】解锁数据结构核心谜题——环形链表
数据结构·学习·程序人生·算法·leetcode·链表·visual studio
林涧泣24 分钟前
图的矩阵表示
学习·线性代数·矩阵
chimchim6632 分钟前
【starrocks学习】之catalog
学习
梦云澜1 小时前
论文阅读(二):理解概率图模型的两个要点:关于推理和学习的知识
论文阅读·深度学习·学习
Ronin-Lotus2 小时前
上位机知识篇---CMake
c语言·c++·笔记·学习·跨平台·编译·cmake
lxl13072 小时前
学习数据结构(2)空间复杂度+顺序表
数据结构·学习
简知圈3 小时前
03-画P封装(制作2D+添加3D)
笔记·stm32·单片机·学习·pcb工艺
java冯坚持4 小时前
shiro学习五:使用springboot整合shiro。在前面学习四的基础上,增加shiro的缓存机制,源码讲解:认证缓存、授权缓存。
spring boot·学习·缓存
fanged6 小时前
简单看看会议系统(TODO)
学习