【漫话机器学习系列】054.极值(Extrema)

极值(Extrema)

定义

极值是数学分析和优化问题中的一个核心概念,指函数在某个定义域内取得的最大值或最小值。根据极值的性质,可以将其分为两类:

  1. 局部极值(Local Extrema):函数在某点附近的最大值或最小值。
  2. 全局极值(Global Extrema):函数在整个定义域内的最大值或最小值。

分类
  1. 局部极大值(Local Maximum)
    • 若在点 x = a 附近存在某邻域,使得对任意 x 在该邻域内,满足 f(x) ≤ f(a),则称 f(a) 是局部极大值。
  2. 局部极小值(Local Minimum)
    • 若在点 x = a 附近存在某邻域,使得对任意 x 在该邻域内,满足 f(x) ≥ f(a),则称 f(a) 是局部极小值。
  3. 全局极大值(Global Maximum)
    • 若对于函数定义域内的所有 x,都满足 f(x) ≤ f(a),则称 f(a) 是全局极大值。
  4. 全局极小值(Global Minimum)
    • 若对于函数定义域内的所有 xxx,都满足 f(x) ≥ f(a),则称 f(a) 是全局极小值。

数学条件

设函数 f(x) 在点 x = c 处可导,那么:

  1. 一阶导数条件
    • 如果 f'(c) = 0,则 x = c 是一个极值点的候选点。
  2. 二阶导数条件
    • 若 f''(c) > 0,则 f(x) 在 x = c 处取得局部极小值。
    • 若 f''(c) < 0,则 f(x) 在 x = c 处取得局部极大值。
    • 若 f''(c) = 0,无法判断极值,需要更高阶导数或其他方法。

几何解释

在函数图像上:

  • 极大值对应于"峰值"点,图像局部上凸。
  • 极小值对应于"谷底"点,图像局部下凹。

求解方法
  1. 解析方法
    • 通过求解一阶导数 f'(x) = 0 找到驻点。
    • 检查驻点处的二阶导数 f''(x) 或函数变化趋势以确认极值类型。
  2. 数值方法
    • 使用优化算法(如梯度下降或牛顿法)逼近极值点。

应用场景
  1. 优化问题
    • 在机器学习中,用于找到损失函数的最小值或最大值。
  2. 物理学
    • 极值用于确定系统的稳态(如势能最小化)。
  3. 经济学
    • 极值分析可用于寻找利润最大化或成本最小化的策略。
  4. 工程领域
    • 用于设计系统的最佳性能或负载条件。

代码示例

以下是 Python 中使用 sympy 计算极值的示例:

python 复制代码
import sympy as sp

# 定义变量和函数
x = sp.Symbol('x')
f = x**3 - 6*x**2 + 9*x + 15

# 求一阶导数和二阶导数
f_prime = sp.diff(f, x)
f_double_prime = sp.diff(f_prime, x)

# 求驻点
critical_points = sp.solve(f_prime, x)

# 判断极值类型
for point in critical_points:
    second_derivative = f_double_prime.subs(x, point)
    if second_derivative > 0:
        print(f"x = {point} 是局部极小值")
    elif second_derivative < 0:
        print(f"x = {point} 是局部极大值")
    else:
        print(f"x = {point} 无法通过二阶导数判断")
运行结果
Matlab 复制代码
x = 1 是局部极大值
x = 3 是局部极小值

总结

极值是分析函数行为的重要工具,广泛应用于优化、建模和决策中。通过数学条件和数值方法,可以有效地识别和验证极值点,从而指导实际问题的求解。

相关推荐
剑穗挂着新流苏31226 分钟前
117_PyTorch 实战:利用训练好的模型进行单张图片验证
人工智能·python·深度学习
程序员cxuan28 分钟前
人麻了,谁把我 ssh 干没了
人工智能·后端·程序员
数据皮皮侠43 分钟前
中国城市间地理距离矩阵(2024)
大数据·数据库·人工智能·算法·制造
枫叶林FYL1 小时前
【乳腺癌早期筛查(钼靶X光图像AI识别)】第一章:钼靶AI核心算法架构演进——从2D全视野到3D断层合成与视觉Transformer
人工智能·深度学习
TK云大师-KK1 小时前
TikTok自动化直播遇到内容重复问题?这套技术方案了解一下
大数据·运维·人工智能·矩阵·自动化·新媒体运营·流量运营
姚青&1 小时前
大语言模型与私有部署
人工智能·语言模型·chatgpt
WeeJot嵌入式1 小时前
Meta LSP无数据训练深度解析:语言自我对弈的数学原理与实现
人工智能·机器学习·里氏替换原则
foundbug9991 小时前
基于卡尔曼滤波的背景建模与车辆检测(OpenCV实现)
人工智能·opencv·计算机视觉
一个处女座的程序猿1 小时前
AI之Tool:Google Stitch的简介、安装和使用方法、案例应用之详细攻略
人工智能·stitch