11-机器学习与大模型开发数学教程-第1章1-3 极限与连续性

在数学史上,牛顿和莱布尼茨在研究"变化率"时,发现一个问题:如果直接用"瞬时变化"来定义速度,公式会出问题。于是,他们引入了 极限(limit) 的思想。

在机器学习中,我们也经常遇到类似的问题:

  • 梯度下降法里,要计算某一点的"斜率",其实就是在算一个极限。
  • 神经网络的损失函数必须是"连续"的,否则优化会卡住。
  • 在概率分布中,积分和期望的定义本质上也依赖于极限。

换句话说,极限是所有连续变化的起点


极限的直观理解

我们先来看一个生活类比:

  • 你走向一扇自动门,距离越来越小。
  • 当你无限接近门口时,你和门之间的距离"趋近于 0"。

这就是极限思想:不一定真的等于某个值,而是无限接近某个值。

数学上,如果函数 f(x)f(x)f(x) 在 xxx 趋近于某个点 aaa 时,也越来越接近某个数 LLL,那么就记作:

lim⁡x→af(x)=L\lim_{x \to a} f(x) = Llimx→af(x)=L

比如:

lim⁡x→0sin⁡xx=1\lim_{x \to 0} \frac{\sin x}{x} = 1limx→0xsinx=1


极限与函数连续性

极限思想直接引出了函数的"连续性"。

直观理解:

  • 如果你在画一条曲线,中间不用抬笔,那么这个函数就是连续的。
  • 如果需要"跳跃"或者"断开",那就是不连续。

形式化地说:

函数 f(x)f(x)f(x) 在点 aaa 处连续,当且仅当:

lim⁡x→af(x)=f(a)\lim_{x \to a} f(x) = f(a)limx→af(x)=f(a)


Mermaid 图示:函数连续与不连续

不等于 极限存在 等于函数值 函数在该点连续 函数不连续

说明

  • 如果极限存在,且等于函数值,则函数连续。
  • 如果极限不存在,或存在但不等于函数值,则函数不连续。

机器学习中的"连续性"为什么重要?

  1. 损失函数的连续性

    • 在训练中,我们最关心的是损失函数(Loss Function)。
    • 如果损失函数是连续的,那么模型参数的微小变化,只会带来损失的微小变化,这样优化才"平滑可控"。
    • 如果损失函数不连续,那么优化会"卡壳",梯度下降也无从谈起。

    例子:

    • 均方误差(MSE) 是连续的 → 很适合梯度下降。
    • 0-1 损失函数(预测错了记 1,否则 0)是不连续的 → 无法直接用梯度优化。
    • 这也是为什么深度学习里常用"交叉熵损失"替代"0-1 损失"。
  2. 激活函数的连续性

    • Sigmoid、Tanh、ReLU 等激活函数,之所以能被广泛使用,关键是它们连续(甚至分段连续)。
    • 如果激活函数不连续,神经网络的输出会跳跃,导致训练不稳定。
  3. 大模型训练的稳定性

    • 在大规模模型(如 Transformer)中,优化器(Adam、AdaGrad 等)依赖于连续可导的损失函数。
    • 一旦损失函数出现不连续点,参数更新可能会"震荡",无法收敛。

技术延伸:极限与"渐近复杂度"的联系

在上一节 O(n) 表示法 中,我们研究了算法在大输入规模下的表现。

其实,大 O 表示法就是在用极限思想:

lim⁡n→∞f(n)g(n)=C\lim_{n \to \infty} \frac{f(n)}{g(n)} = Climn→∞g(n)f(n)=C

这说明:复杂度分析和极限的数学基础是一脉相承的。


小结

  • 极限:刻画函数在某个点附近的"趋近行为"。
  • 连续性:要求函数在某点的极限存在,且等于函数值。
  • 在机器学习中:
    • 连续的损失函数保证了可优化性。
    • 连续的激活函数保证了模型的稳定性。
    • 极限思想也支撑了算法复杂度的分析。
相关推荐
jarreyer3 小时前
AB测试相关知识
人工智能·机器学习·ab测试
AiTop1004 小时前
微软VibeVoice-Realtime-0.5B正式上线:实时语音,快到“话未说完音已先到”!
人工智能·语音识别
ZKNOW甄知科技4 小时前
AI-ITSM的时代正在到来:深度解读Gartner最新报告
大数据·运维·人工智能·低代码·网络安全·微服务·重构
zhaodiandiandian4 小时前
AI 重塑就业生态:变革浪潮中的挑战与治理之道
人工智能
xinyuan_1234564 小时前
数智化招采平台实战指南:AI如何让采购管理实现效率与价值落地
大数据·人工智能
爱写代码的小朋友4 小时前
人工智能驱动的教育研究范式转型:从假设驱动到数据驱动的方法论创新
人工智能
Tezign_space4 小时前
技术实战:Crocs如何构建AI驱动的智能内容矩阵,实现内容播放量提升470%?
大数据·人工智能·矩阵·aigc·内容运营·多智能体系统·智能内容矩阵
23遇见4 小时前
AI会议与实时翻译
人工智能
通信小呆呆4 小时前
面向万物互联的通信感知一体化用户端感知与云端通信人工智能体训练研究
人工智能·信息与通信·万物互联·通信感知一体化
free-elcmacom4 小时前
机器学习入门<5>支持向量机形象教学:寻找最安全的“三八线”,人人都能懂的算法核心
人工智能·python·算法·机器学习·支持向量机