【漫话机器学习系列】066.贪心算法(Greedy Algorithms)

贪心算法(Greedy Algorithms)

贪心算法是一种逐步构建解决方案的算法,每一步都选择当前状态下最优的局部选项(即"贪心选择"),以期望最终获得全局最优解。贪心算法常用于解决最优化问题。


核心思想

  1. 贪心选择性质

    在每一步选择中,通过选择当前的局部最优解,能够保证最终得到的解是全局最优解。

  2. 无后效性(No Backtracking)

    当前步骤的选择不会影响之后的选择,即一个问题的解决可以通过局部的选择逐步逼近全局最优。

  3. 最优子结构性质

    一个问题的全局最优解可以通过其子问题的最优解组合得到。


贪心算法的一般步骤

  1. 问题分解:将问题分解为若干个子问题。
  2. 选择策略:为每一步定义贪心选择规则(如最大化或最小化)。
  3. 验证解的可行性:每一步选定的解需满足问题的约束条件。
  4. 检查最优性:选择的局部解是否能保证全局最优。
  5. 重复直到完成:重复贪心选择直至问题结束。

常见应用场景

  1. 活动选择问题(Activity Selection Problem)

    给定多个活动的开始和结束时间,选择最大数量的活动使得它们互不重叠。

  2. 背包问题(Knapsack Problem, 分数背包)

    在分数背包问题中,按单位重量价值排序,并优先选择单位价值最高的物品。

  3. 最小生成树(Minimum Spanning Tree)

    • Prim 算法
    • Kruskal 算法
  4. 最短路径问题(Shortest Path Problem)

    • Dijkstra 算法
  5. 哈夫曼编码(Huffman Encoding)

    用于生成最优前缀编码,减少数据压缩的存储空间。


优点

  1. 简单直观:易于实现,且解决问题的过程清晰。
  2. 高效:通过贪心选择,通常只需线性或接近线性的时间复杂度。
  3. 适用范围广:许多经典问题都能用贪心算法求解。

缺点

  1. 局部最优≠全局最优
    在某些问题中,贪心算法无法保证全局最优解。
    • 例如:0-1 背包问题的全局最优解通常无法通过贪心法获得。
  2. 适用性有限
    只有具有最优子结构性质和贪心选择性质的问题才能用贪心算法。

代码示例:活动选择问题

给定活动的开始和结束时间,选择最多数量的活动,使其不重叠。

python 复制代码
def activity_selection(start_times, end_times):
    activities = sorted(zip(start_times, end_times), key=lambda x: x[1])  # 按结束时间排序
    selected = []
    last_end_time = 0

    for start, end in activities:
        if start >= last_end_time:  # 当前活动的开始时间不早于上一个选择活动的结束时间
            selected.append((start, end))
            last_end_time = end

    return selected

# 示例
start_times = [1, 3, 0, 5, 8, 5]
end_times = [2, 4, 6, 7, 9, 9]
result = activity_selection(start_times, end_times)
print("选择的活动:", result)

运行结果

Matlab 复制代码
选择的活动: [(1, 2), (3, 4), (5, 7), (8, 9)]

总结

贪心算法通过逐步构建解决方案,在每一步都选择当前状态下的最优选项,是解决许多经典最优化问题的强大工具。但在应用贪心算法时,需要验证问题是否满足最优子结构和贪心选择性质,否则可能无法得到正确结果。

相关推荐
Juicedata41 分钟前
JuiceFS v1.3-Beta2:集成 Apache Ranger,实现更精细化的权限控制
运维·人工智能·ai
Work(沉淀版)3 小时前
DAY 40
人工智能·深度学习·机器学习
蓦然回首却已人去楼空4 小时前
Build a Large Language Model (From Scratch) 序章
人工智能·语言模型·自然语言处理
CM莫问4 小时前
<论文>(微软)WINA:用于加速大语言模型推理的权重感知神经元激活
人工智能·算法·语言模型·自然语言处理·大模型·推理加速
拾忆-eleven4 小时前
NLP学习路线图(二十六):自注意力机制
人工智能·深度学习
MYH5165 小时前
在NLP文本处理中,将字符映射到阿拉伯数字(构建词汇表vocab)的核心目的和意义
人工智能·深度学习·自然语言处理
要努力啊啊啊5 小时前
KV Cache:大语言模型推理加速的核心机制详解
人工智能·语言模型·自然语言处理
mzlogin7 小时前
DIY|Mac 搭建 ESP-IDF 开发环境及编译小智 AI
人工智能
归去_来兮7 小时前
知识图谱技术概述
大数据·人工智能·知识图谱
就是有点傻7 小时前
VM图像处理之图像二值化
图像处理·人工智能·计算机视觉