机器学习微积分--(1)核心思想

微积分是数学中一门非常重要的分支,它主要研究变化累积。你可能听说过"微积分"这个名字,感觉它很难,但其实它的核心思想非常直观,源于两个我们都很熟悉的几何问题:

  1. 如何求一条曲线在某一点的切线斜率? ------ 这引出了微分
  2. 如何求一条曲线下方的面积? ------ 这引出了积分

而微积分最精彩的地方在于,这两个看似完全不同的问题,实际上是互为逆运算的!这个联系被称为微积分基本定理


1.1 微分:研究瞬间变化

想象你开着一辆车,速度表显示的是你此刻的速度,比如 60 公里/小时。这个"此刻的速度"就是瞬间变化率。但速度表是如何计算出来的呢?它不能直接测量"此刻",因为任何测量都需要一段时间。

这就是微积分的核心思想:用"无穷小"来逼近"瞬间"

从平均速度到瞬时速度

  • 平均速度:如果你在一小时内开了 60 公里,你的平均速度是 60 公里/小时。公式很简单:距离变化 ÷ 时间变化。
  • 瞬时速度:但如果你想知道在某一秒、甚至某一毫秒的速度呢?你可以记录下非常短的时间段内的平均速度,比如 0.1 秒。时间段越短,这个平均速度就越接近那一瞬间的真实速度。

微积分的做法是 :让这个时间段无限趋近于 0 ,但又不等于 0 (因为除以 0 没有意义)。这个过程中,平均速度会趋近于一个确定的值,这个值就是瞬时速度 ,也就是导数

导数定义
f ′ ( x ) = lim ⁡ h → 0 f ( x + h ) − f ( x ) h f'(x) = \lim_{h \to 0} \frac{f(x+h) - f(x)}{h} f′(x)=h→0limhf(x+h)−f(x)

换个例子 :看下面这条曲线,它代表一辆车的行驶距离随时间变化的函数 s ( t ) s(t) s(t)。

  • 如果我们想求从时间 t t t 到 t + Δ t t + \Delta t t+Δt 的平均速度,就是割线的斜率( Δ s Δ t \frac{\Delta s}{\Delta t} ΔtΔs)。
  • 当我们让 Δ t \Delta t Δt 无限缩小,割线就会无限靠近 t t t 点,最终变成一条切线 。这条切线的斜率,就是瞬时速度 ,也就是函数 s ( t ) s(t) s(t) 在 t t t 点的导数 ,记作 s ′ ( t ) s'(t) s′(t) 或 d s d t \frac{ds}{dt} dtds。

想象一个图:一条曲线,过点P画一条割线交曲线于另一点Q,当Q向P移动时,割线逐渐变成切线。

所以,微分就是研究"变化率"的工具。它告诉我们,当一个量发生微小变化时,另一个量会如何变化。


1.2 积分:研究累积总量

现在考虑另一个问题:如果我知道一辆车的速度随时间变化的函数 v ( t ) v(t) v(t),我能不能求出它在某段时间内总共走了多远?

这相当于求速度曲线下的面积。

从粗略估计到精确面积

假设速度函数 v ( t ) v(t) v(t) 的图像是一条曲线,我们想求从时间 a a a 到 b b b 这段时间内走过的路程。

  • 粗略估计:我们可以把这段时间分成很多个很窄的小区间。在每个小区间内,我们认为速度是近似不变的(比如用该区间起始点的速度代替)。这样,每个小区间的路程 ≈ 速度 × 时间,对应图像上就是一个细长矩形的面积。
  • 求和:把所有小矩形的面积加起来,就得到了总路程的一个近似值。
  • 极限逼近:如果我们将区间分得越来越细(即矩形的宽度无限趋近于 0),这些矩形面积之和就会无限趋近于曲线下的真实面积,也就是精确的总路程。

想象一个图:速度曲线下方,用许多细长矩形填充,宽度越来越窄,矩形顶部的锯齿越来越贴合曲线。

这个过程就是积分 。我们称这个极限值为定积分 ,记作 ∫ a b v ( t )   d t \int_a^b v(t) \, dt ∫abv(t)dt。积分符号 ∫ \int ∫ 就像拉长的字母 S,表示"求和"(Sum)。

定积分定义
∫ a b f ( x )   d x = lim ⁡ n → ∞ ∑ i = 1 n f ( x i ∗ ) Δ x \int_a^b f(x) \, dx = \lim_{n \to \infty} \sum_{i=1}^n f(x_i^*) \Delta x ∫abf(x)dx=n→∞limi=1∑nf(xi∗)Δx

所以,积分就是研究"累积量"的工具 。它把无数个无穷小的变化( v ( t )   d t v(t) \, dt v(t)dt)累加起来,得到总的变化。


1.3 微积分基本定理:连接微分和积分的桥梁

到这里,我们有了两个看起来毫无关系的问题:一个求切线斜率(微分),一个求曲线下面积(积分)。但天才的牛顿和莱布尼茨(微积分的两位独立创始人)发现了它们之间深刻的联系。

微积分基本定理(通俗版):

微分和积分是互逆的运算。就像加法和减法、乘法和除法是逆运算一样。

更具体地说:

  • 第一基本定理 :积分之后再微分,会回到原来的函数。也就是说,如果你对一个函数 f f f 从 a a a 到 x x x 积分,得到一个关于 x x x 的新函数 F ( x ) F(x) F(x)(称为积分上限函数),那么对 F ( x ) F(x) F(x) 求导,结果就是 f ( x ) f(x) f(x) 本身。这就像说:求总量,然后再看总量的变化率,就回到了原来的变化率。
    F ( x ) = ∫ a b f ( x )   d x F ′ ( x ) = f ( x ) F(x)=\int_a^b f(x) \, dx \ \ \ \ \ \ \ \ \ \ \ F'(x)=f(x) F(x)=∫abf(x)dx F′(x)=f(x)

  • 第二基本定理(也是最常用的) :如果要计算一个函数 f f f 从 a a a 到 b b b 的定积分,你只需要找到 f f f 的一个原函数 F F F(即导数为 f f f 的函数),然后计算 F ( b ) − F ( a ) F(b) - F(a) F(b)−F(a) 即可。

    f ( x ) = F ′ ( x ) ∫ a b f ( x )   d x = F ( b ) − F ( a ) f(x)=F'(x) \ \ \ \ \ \ \ \ \ \ \ \int_a^b f(x) \, dx = F(b) - F(a) f(x)=F′(x) ∫abf(x)dx=F(b)−F(a)

这个定理的伟大之处在于:它将复杂的求面积问题,转化为了求原函数的问题。而求原函数(不定积分)在某种程度上是求导的逆过程,通常更容易。

举例

求函数 f ( x ) = 2 x f(x) = 2x f(x)=2x 在区间 [1, 3] 上的积分(即曲线下的面积)。

  1. 传统积分法(逼近):会很繁琐。
  2. 用微积分基本定理
    • 首先,找到一个函数 F ( x ) F(x) F(x),使得 F ′ ( x ) = 2 x F'(x) = 2x F′(x)=2x。很容易想到 F ( x ) = x 2 F(x) = x^2 F(x)=x2(因为 ( x 2 ) ′ = 2 x (x^2)' = 2x (x2)′=2x)。
    • 然后,直接计算: ∫ 1 3 2 x   d x = F ( 3 ) − F ( 1 ) = 3 2 − 1 2 = 9 − 1 = 8 \int_1^3 2x \, dx = F(3) - F(1) = 3^2 - 1^2 = 9 - 1 = 8 ∫132xdx=F(3)−F(1)=32−12=9−1=8。

看,是不是简单多了?这个定理是微积分的心脏,让计算变得可行,也让微分和积分完美地统一起来。


1.4 数学演示案例

下面通过具体案例,展示微积分的操作过程和实际应用。

案例一:微分------求切线斜率

问题 :求函数 f ( x ) = x 2 f(x) = x^2 f(x)=x2 在 x = 1 x = 1 x=1 处的导数(切线斜率)。

  1. 平均变化率:
    f ( 1 + h ) − f ( 1 ) h = ( 1 + h ) 2 − 1 h = 2 + h \frac{f(1+h) - f(1)}{h} = \frac{(1+h)^2 - 1}{h} = 2 + h hf(1+h)−f(1)=h(1+h)2−1=2+h

  2. 令 h → 0 h \to 0 h→0:
    f ′ ( 1 ) = lim ⁡ h → 0 ( 2 + h ) = 2 f'(1) = \lim_{h \to 0} (2 + h) = 2 f′(1)=h→0lim(2+h)=2

    所以切线斜率为 2 2 2。

    推广可得 ( x 2 ) ′ = 2 x (x^2)' = 2x (x2)′=2x。


案例二:积分------求曲线下的面积

问题 :求函数 f ( x ) = 2 x f(x) = 2x f(x)=2x 在区间 [ 1 , 3 ] [1,3] [1,3] 上的定积分。

  • 方法一:黎曼和逼近

    将区间 [ 1 , 3 ] [1,3] [1,3] 分成 n n n 等份, Δ x = 2 n \Delta x = \frac{2}{n} Δx=n2,取左端点:

S n = ∑ i = 1 n f ( 1 + ( i − 1 ) 2 n ) ⋅ 2 n = 4 n ∑ i = 1 n ( 1 + 2 ( i − 1 ) n ) S_n = \sum_{i=1}^n f\left(1 + (i-1)\frac{2}{n}\right) \cdot \frac{2}{n} = \frac{4}{n}\sum_{i=1}^n \left(1 + \frac{2(i-1)}{n}\right) Sn=i=1∑nf(1+(i−1)n2)⋅n2=n4i=1∑n(1+n2(i−1))

​ 计算得 S n = 8 − 4 n S_n = 8 - \frac{4}{n} Sn=8−n4,当 n → ∞ n \to \infty n→∞ 时 S n → 8 S_n \to 8 Sn→8。

  • 方法二:微积分基本定理

    2 x 2x 2x 的一个原函数是 F ( x ) = x 2 F(x) = x^2 F(x)=x2,则

∫ 1 3 2 x   d x = F ( 3 ) − F ( 1 ) = 9 − 1 = 8 \int_1^3 2x \, dx = F(3) - F(1) = 9 - 1 = 8 ∫132xdx=F(3)−F(1)=9−1=8

​ 结果一致。几何上,该区域是梯形,面积也为 8 8 8。


案例三:验证微分与积分互逆

设 f ( t ) = 3 t 2 f(t) = 3t^2 f(t)=3t2,定义 F ( x ) = ∫ 0 x 3 t 2   d t F(x) = \int_0^x 3t^2 \, dt F(x)=∫0x3t2dt。

  • 求原函数: 3 t 2 3t^2 3t2 的原函数为 t 3 t^3 t3,故 F ( x ) = x 3 F(x) = x^3 F(x)=x3。 对 F ( x ) F(x) F(x) 求导: F ′ ( x ) = 3 x 2 = f ( x ) F'(x) = 3x^2 = f(x) F′(x)=3x2=f(x)。
  • 反之,先求导再积分: ∫ 0 x ( t 3 ) ′   d t = ∫ 0 x 3 t 2   d t = [ t 3 ] 0 x = x 3 \int_0^x (t^3)' \, dt = \int_0^x 3t^2 \, dt = [t^3]_0^x = x^3 ∫0x(t3)′dt=∫0x3t2dt=[t3]0x=x3。

这表明微分与积分互为逆运算。


案例四:物理应用------速度与位移

汽车速度 v ( t ) = t 2 v(t) = t^2 v(t)=t2 米/秒,求 t = 0 t=0 t=0 到 3 3 3 秒的位移。

位移 s = ∫ 0 3 t 2   d t = [ t 3 3 ] 0 3 = 27 3 = 9 s = \int_0^3 t^2 \, dt = \left[ \frac{t^3}{3} \right]_0^3 = \frac{27}{3} = 9 s=∫03t2dt=[3t3]03=327=9 米。

而位移函数 s ( t ) = t 3 3 s(t) = \frac{t^3}{3} s(t)=3t3 的导数恰为速度 v ( t ) = t 2 v(t) = t^2 v(t)=t2,符合运动学关系。


案例五:微分近似------线性逼近

求 4.1 \sqrt{4.1} 4.1 的近似值。

取 f ( x ) = x f(x) = \sqrt{x} f(x)=x ,已知 f ( 4 ) = 2 f(4)=2 f(4)=2, f ′ ( x ) = 1 2 x f'(x) = \frac{1}{2\sqrt{x}} f′(x)=2x 1, f ′ ( 4 ) = 0.25 f'(4) = 0.25 f′(4)=0.25。

利用线性近似:
4.1 ≈ f ( 4 ) + f ′ ( 4 ) ( 4.1 − 4 ) = 2 + 0.25 × 0.1 = 2.025 \sqrt{4.1} \approx f(4) + f'(4)(4.1-4) = 2 + 0.25 \times 0.1 = 2.025 4.1 ≈f(4)+f′(4)(4.1−4)=2+0.25×0.1=2.025

实际值约 2.024845 2.024845 2.024845,近似效果很好。这体现了"以直代曲"的微分思想。

1.5 总结

对于初学者来说,记住微积分的核心思想:

  1. 微分 :用无穷小的变化( d x dx dx)去研究瞬间的变化率(导数)。
  2. 积分:用无穷小的累积(求和)去研究整体的总量。
  3. 微积分基本定理:告诉我们这两个操作互为逆运算,积分可以通过求导的逆过程(找原函数)来计算。

微积分并不神秘,它就是我们理解和描述动态世界(变化与累积)的强大语言。

下一章 机器学习微积分--(2)定积分

相关推荐
绝不原创的飞龙2 小时前
使用机器学习和数学预测美国 GDP
人工智能·机器学习
competes2 小时前
学生需求 交易累计积分,积分兑换奖品
java·大数据·开发语言·人工智能·java-ee
大势智慧2 小时前
使用低空大师进行无人机巡查一段时间后,如何确定重点整治区域?
人工智能·ai·无人机·实景三维·低空经济·事件预警
小小数媒成员2 小时前
Shader中的光照模型
人工智能·计算机视觉
忧郁的橙子.2 小时前
12-大模型压缩预训练、知识蒸馏
人工智能·量化·模型蒸馏
科学创新前沿2 小时前
物理信息神经网络:从数据驱动到物理嵌入的科学计算新范式!
人工智能·深度学习·dft·pinn·流体力学·固体力学·断裂力学
高光视点2 小时前
海康存储亮相CFMS 2026全场景解决方案赋能AI存储新生态
人工智能
有Li2 小时前
一种病理学内容感知变速率学习图像压缩框架 (PathoLIC)/文献速递-多模态应用技术
人工智能·深度学习·算法·计算机视觉·医学生
昊叔3 小时前
AI 时代,计算思维更值钱
人工智能·语言模型·agi·vibe coding·氛围编程