【漫话机器学习系列】066.贪心算法(Greedy Algorithms)

贪心算法(Greedy Algorithms)

贪心算法是一种逐步构建解决方案的算法,每一步都选择当前状态下最优的局部选项(即"贪心选择"),以期望最终获得全局最优解。贪心算法常用于解决最优化问题。


核心思想

  1. 贪心选择性质

    在每一步选择中,通过选择当前的局部最优解,能够保证最终得到的解是全局最优解。

  2. 无后效性(No Backtracking)

    当前步骤的选择不会影响之后的选择,即一个问题的解决可以通过局部的选择逐步逼近全局最优。

  3. 最优子结构性质

    一个问题的全局最优解可以通过其子问题的最优解组合得到。


贪心算法的一般步骤

  1. 问题分解:将问题分解为若干个子问题。
  2. 选择策略:为每一步定义贪心选择规则(如最大化或最小化)。
  3. 验证解的可行性:每一步选定的解需满足问题的约束条件。
  4. 检查最优性:选择的局部解是否能保证全局最优。
  5. 重复直到完成:重复贪心选择直至问题结束。

常见应用场景

  1. 活动选择问题(Activity Selection Problem)

    给定多个活动的开始和结束时间,选择最大数量的活动使得它们互不重叠。

  2. 背包问题(Knapsack Problem, 分数背包)

    在分数背包问题中,按单位重量价值排序,并优先选择单位价值最高的物品。

  3. 最小生成树(Minimum Spanning Tree)

    • Prim 算法
    • Kruskal 算法
  4. 最短路径问题(Shortest Path Problem)

    • Dijkstra 算法
  5. 哈夫曼编码(Huffman Encoding)

    用于生成最优前缀编码,减少数据压缩的存储空间。


优点

  1. 简单直观:易于实现,且解决问题的过程清晰。
  2. 高效:通过贪心选择,通常只需线性或接近线性的时间复杂度。
  3. 适用范围广:许多经典问题都能用贪心算法求解。

缺点

  1. 局部最优≠全局最优
    在某些问题中,贪心算法无法保证全局最优解。
    • 例如:0-1 背包问题的全局最优解通常无法通过贪心法获得。
  2. 适用性有限
    只有具有最优子结构性质和贪心选择性质的问题才能用贪心算法。

代码示例:活动选择问题

给定活动的开始和结束时间,选择最多数量的活动,使其不重叠。

python 复制代码
def activity_selection(start_times, end_times):
    activities = sorted(zip(start_times, end_times), key=lambda x: x[1])  # 按结束时间排序
    selected = []
    last_end_time = 0

    for start, end in activities:
        if start >= last_end_time:  # 当前活动的开始时间不早于上一个选择活动的结束时间
            selected.append((start, end))
            last_end_time = end

    return selected

# 示例
start_times = [1, 3, 0, 5, 8, 5]
end_times = [2, 4, 6, 7, 9, 9]
result = activity_selection(start_times, end_times)
print("选择的活动:", result)

运行结果

Matlab 复制代码
选择的活动: [(1, 2), (3, 4), (5, 7), (8, 9)]

总结

贪心算法通过逐步构建解决方案,在每一步都选择当前状态下的最优选项,是解决许多经典最优化问题的强大工具。但在应用贪心算法时,需要验证问题是否满足最优子结构和贪心选择性质,否则可能无法得到正确结果。

相关推荐
程序员佳佳几秒前
【硬核实测】GPT-5.2-Pro 对决 Gemini-3-Pro (Banana Pro):开发者如何低成本接入下一代 AI 模型?附 Python 源码
人工智能·python·gpt·chatgpt·ai作画·midjourney·ai编程
Pyeako1 分钟前
机器学习--SVM
机器学习·支持向量机·目标跟踪
WitsMakeMen6 分钟前
训练时开启 KV 缓存会和is_causal=False 冲突
人工智能·缓存·语言模型·自然语言处理·llm·transformer
WitsMakeMen7 分钟前
qwen3 训练loss 出现nan
人工智能·语言模型·自然语言处理·llm·qwen3
sukalot8 分钟前
BoostKit TensorFlow 性能优化源码深度解析
人工智能·性能优化·tensorflow
yuanmenghao8 分钟前
自动驾驶中间件iceoryx - 快速上手
人工智能·机器学习·自动驾驶
郝学胜-神的一滴10 分钟前
李航《机器学习方法》全面解析与高效学习指南
人工智能·python·算法·机器学习·数学建模·scikit-learn
丝斯201111 分钟前
AI学习笔记整理(40)——自然语言处理算法之Seq2Seq
人工智能·笔记·学习
Fuly102411 分钟前
大模型蒸馏技术简介
人工智能·深度学习·机器学习
skywalk816312 分钟前
分子动力学轨迹分析工具:高效、灵活的 TorchMD 分子动力学轨迹分析与可视化工具集
人工智能