贪心算法教程(个人总结版)

背景

贪心算法(Greedy Algorithm)是一种在每一步选择中都采取在当前状态下最好或最优的选择,期望通过局部最优选择达到全局最优解决方案的算法。贪心算法的应用广泛,包括图算法、动态规划、贪心选择、装载问题等。它通常用于解决优化问题,例如最短路径、最小生成树、背包问题等。

贪心算法的基本思想

贪心算法的核心思想是,在每一步都选择当前最优解,以期最终达到全局最优。贪心算法通常包括以下几个要素:

  1. 贪心选择性质:可以通过局部最优选择构造出全局最优解。
  2. 最优子结构性质:一个问题的最优解包含其子问题的最优解。

贪心算法的应用

贪心算法在许多经典问题中有着广泛的应用,如:

  1. 活动选择问题:选择不重叠的最大活动集合。
  2. 背包问题:选择最大价值的物品装入背包。
  3. 哈夫曼编码:构造最优前缀码。
  4. 最小生成树问题:如Prim算法和Kruskal算法。
  5. 最短路径问题:如Dijkstra算法。

贪心算法的实现

1. 活动选择问题

问题描述

给定一组活动,每个活动有一个开始时间和结束时间。要求选择尽可能多的互不重叠的活动。

贪心策略

每次选择结束时间最早且不与已选活动重叠的活动。

算法实现
def activity_selection(activities):
    # 按照结束时间排序
    activities.sort(key=lambda x: x[1])
    
    # 选择活动
    selected_activities = []
    last_end_time = 0
    
    for activity in activities:
        if activity[0] >= last_end_time:
            selected_activities.append(activity)
            last_end_time = activity[1]
    
    return selected_activities

# 示例
activities = [(1, 4), (3, 5), (0, 6), (5, 7), (3, 8), (5, 9), (6, 10), (8, 11), (8, 12), (2, 13), (12, 14)]
selected_activities = activity_selection(activities)
print("选择的活动:", selected_activities)
详细解释
  1. 排序:首先按照活动的结束时间对活动进行排序。
  2. 选择活动:遍历排序后的活动列表,每次选择第一个不与已选择活动重叠的活动。
  3. 更新结束时间:每次选择一个活动后,更新最后选择的活动的结束时间。

2. 背包问题

背包问题是经典的优化问题之一,其中包括0-1背包问题和分数背包问题。贪心算法主要适用于分数背包问题。

分数背包问题

分数背包问题允许将物品分割,目的是在总重量不超过背包容量的情况下,选择最大价值的物品集合。

贪心策略

每次选择单位重量价值最高的物品。

算法实现
def fractional_knapsack(items, capacity):
    # 计算单位重量价值
    items.sort(key=lambda x: x[1] / x[0], reverse=True)
    
    total_value = 0
    for weight, value in items:
        if capacity >= weight:
            total_value += value
            capacity -= weight
        else:
            total_value += value * (capacity / weight)
            break
    
    return total_value

# 示例
items = [(2, 10), (3, 5), (5, 15), (7, 7), (1, 6), (4, 18), (1, 3)]
capacity = 15
max_value = fractional_knapsack(items, capacity)
print("最大价值:", max_value)
详细解释
  1. 排序:按照物品的单位重量价值排序。
  2. 选择物品:遍历排序后的物品列表,每次选择单位重量价值最高的物品,直到背包装满。
  3. 处理剩余空间:如果剩余容量小于当前物品的重量,则只取一部分物品。

3. 哈夫曼编码

哈夫曼编码是一种用于数据压缩的贪心算法。

问题描述

给定一组字符及其频率,构造一棵哈夫曼树,使得字符的平均编码长度最短。

贪心策略

每次选择频率最小的两个节点合并。

算法实现
import heapq

class Node:
    def __init__(self, freq, symbol, left=None, right=None):
        self.freq = freq
        self.symbol = symbol
        self.left = left
        self.right = right
        self.huff = ''
    
    def __lt__(self, nxt):
        return self.freq < nxt.freq

def huffman_coding(symbols):
    heap = [Node(freq, symbol) for symbol, freq in symbols]
    heapq.heapify(heap)
    
    while len(heap) > 1:
        left = heapq.heappop(heap)
        right = heapq.heappop(heap)
        
        left.huff = '0'
        right.huff = '1'
        
        new_node = Node(left.freq + right.freq, left.symbol + right.symbol, left, right)
        heapq.heappush(heap, new_node)
    
    return heap[0]

def print_huffman_tree(node, val=''):
    new_val = val + node.huff
    
    if node.left:
        print_huffman_tree(node.left, new_val)
    if node.right:
        print_huffman_tree(node.right, new_val)
    
    if not node.left and not node.right:
        print(f"{node.symbol}: {new_val}")

# 示例
symbols = [('A', 5), ('B', 9), ('C', 12), ('D', 13), ('E', 16), ('F', 45)]
huffman_tree = huffman_coding(symbols)
print_huffman_tree(huffman_tree)
详细解释
  1. 初始化:将每个字符及其频率创建为一个节点,并加入优先队列(最小堆)。
  2. 合并节点:每次从堆中取出频率最小的两个节点,合并为一个新的节点,将新节点加入堆中。
  3. 构建哈夫曼树:重复上述过程,直到堆中只剩一个节点,这个节点即为哈夫曼树的根节点。
  4. 生成编码:从根节点开始,左子树路径为'0',右子树路径为'1',遍历树生成每个字符的哈夫曼编码。

4. 最小生成树问题

最小生成树问题是图论中的经典问题之一,常用的贪心算法有Prim算法和Kruskal算法。

Prim算法

Prim算法用于找到一个连通图的最小生成树,选择从某个顶点开始,每次选择与当前树相连的权重最小的边。

算法实现
import heapq

def prim(graph, start):
    mst = []
    visited = set()
    min_heap = [(0, start)]
    
    while min_heap:
        weight, node = heapq.heappop(min_heap)
        if node not in visited:
            visited.add(node)
            mst.append((weight, node))
            for next_node, next_weight in graph[node]:
                if next_node not in visited:
                    heapq.heappush(min_heap, (next_weight, next_node))
    
    return mst

# 示例
graph = {
    'A': [('B', 1), ('C', 3), ('D', 4)],
    'B': [('A', 1), ('C', 2), ('D', 5)],
    'C': [('A', 3), ('B', 2), ('D', 6)],
    'D': [('A', 4), ('B', 5), ('C', 6)]
}
mst = prim(graph, 'A')
print("最小生成树:", mst)
详细解释
  1. 初始化:从起始顶点开始,将所有相邻边加入优先队列(最小堆)。
  2. 选择边:每次选择权重最小的边,若边的终点未被访问过,则将其加入生成树,并将该顶点的所有相邻边加入堆中。
  3. 重复步骤:直到所有顶点都被访问过,生成树构建完成。

5. 最短路径问题

最短路径问题是图论中的另一个经典问题,Dijkstra算法是常用的贪心算法之一。

Dijkstra算法

Dijkstra算法用于找到从单个源点到所有其他顶点的最短路径,每次选择当前已知最短路径的顶点,并更新其邻接顶点的距离。

算法实现
import heapq

def dijkstra(graph, start):
    distances = {vertex: float('infinity') for vertex in graph}
    distances[start] = 0
    priority_queue = [(0, start)]
    
    while priority_queue:
        current_distance, current_vertex = heapq.heappop(priority_queue)
        
        if current_distance > distances[current_vertex]:
            continue
        
        for neighbor, weight in graph[current_vertex]:
            distance = current_distance + weight
            if distance < distances[neighbor]:
                distances[neighbor] = distance
                heapq.heappush(priority_queue, (distance, neighbor))
    
    return distances

# 示例
graph = {
    'A': [('B', 1), ('C', 4)],
    'B': [('A', 1), ('C', 2), ('D', 5)],
    'C': [('A', 4), ('B', 2), ('D', 1)],
    'D': [('B', 5), ('C', 1)]
}
distances = dijkstra(graph, 'A')
print("最短路径:", distances)
详细解释
  1. 初始化:设置所有顶点到源点的初始距离为无穷大,源点到自身距离为0,将源点加入优先队列。
  2. 选择顶点:每次选择距离最小的顶点,若当前顶点的距离已被更新,则跳过。
  3. 更新邻接顶点的距离:对于当前顶点的每个邻接顶点,计算从源点到该邻接顶点的距离,若新距离小于当前已知距离,则更新并将其加入优先队列。
  4. 重复步骤:直到优先队列为空,所有顶点的最短路径计算完成。

贪心算法的优缺点

优点

  1. 简单易懂:贪心算法的思想简单明了,容易理解和实现。
  2. 高效:贪心算法通常具有较低的时间复杂度,适合处理大规模数据。
  3. 适用于某些特定问题:在一些特定问题中,贪心算法可以快速找到最优解,如最小生成树、最短路径等。

缺点

  1. 局部最优不保证全局最优:贪心算法通过局部最优选择来构建全局解,但在某些情况下,局部最优选择可能导致最终解并非全局最优。
  2. 问题依赖性强:贪心算法适用于特定问题,不能普遍适用于所有问题。

结论

贪心算法是一种强大而高效的算法,广泛应用于各种优化问题中。通过对贪心选择性质和最优子结构性质的理解,可以设计出适合特定问题的贪心算法。在实践中,应根据具体问题的特点选择合适的算法,以充分发挥其优势。

通过本教程的详细介绍和代码示例,希望您对贪心算法有了更深入的理解,并能够在实际项目中应用这些技术。

相关推荐
萱仔学习自我记录2 小时前
PEFT库和transformers库在NLP大模型中的使用和常用方法详解
人工智能·机器学习
BulingQAQ4 小时前
论文阅读:PET/CT Cross-modal medical image fusion of lung tumors based on DCIF-GAN
论文阅读·深度学习·生成对抗网络·计算机视觉·gan
hsling松子4 小时前
使用PaddleHub智能生成,献上浓情国庆福
人工智能·算法·机器学习·语言模型·paddlepaddle
正在走向自律5 小时前
机器学习框架
人工智能·机器学习
dengqingrui1235 小时前
【树形DP】AT_dp_p Independent Set 题解
c++·学习·算法·深度优先·图论·dp
C++忠实粉丝5 小时前
前缀和(8)_矩阵区域和
数据结构·c++·线性代数·算法·矩阵
好吃番茄5 小时前
U mamba配置问题;‘KeyError: ‘file_ending‘
人工智能·机器学习
ZZZ_O^O6 小时前
二分查找算法——寻找旋转排序数组中的最小值&点名
数据结构·c++·学习·算法·二叉树
CV-King6 小时前
opencv实战项目(三十):使用傅里叶变换进行图像边缘检测
人工智能·opencv·算法·计算机视觉
禁默6 小时前
2024年计算机视觉与艺术研讨会(CVA 2024)
人工智能·计算机视觉