文章目录

贪心法
- [找零问题（change-making problem）](#找零问题（change-making problem）)
- - 贪心算法要求
  - - 基本思想
    - 适合求解问题的特征
- ==背包问题==
- 任务调度问题
- 活动选择问题
- - 活动选择------贪心法
  - - 最早结束时间优先------最优性证明
- ==Prim算法==

贪心法

我在当前情况下，我把我做到最好。我也不管全局如何，整体如何。我就考虑我现在的这一个，或者这一小部分怎样最好。

贪心技术是一种设计算法的通用策略。
贪心技术的基本思想：
- 基于贪心选择准则，每次得到局部最优的选择。
- 希望利用局部最后得到全局最优解。
- 贪心选择性质：局部最优可以得到全局最优。
找到正确的贪心选择准则是设计贪心算法的关键。
- 不同的贪心选择准则可以得到不同的结果。

打个比方，我现在有几种选择：

学编程、打游戏、读书、去外面玩、去兼职、......

如果我的目的是提高自己的知识水平，那起码对于现在的这些选择来说，我选择"学编程"或者"读书"就是最优的。

只是说当前这一步怎么走是最优的，也并没有去管后面的路怎么走。

比如你说选择"打游戏"，后面可能也会更成功，但是不管这个。

找零问题（change-making problem）

给定无限多不同面额的硬币 d 1 > . . . > d m d_1>...>d_m d1>...>dm，对于总额 n n n，如何找到最少的硬币数目？
问题：目标函数和约束条件是什么？

例如：

d 1 = 25 c , d 2 = 10 c , d 3 = 5 c , d 4 = 1 c ，而且 n = 48 c d_1=25c,d_2=10c,d_3=5c,d_4=1c，而且n=48c d1=25c,d2=10c,d3=5c,d4=1c，而且n=48c。

我们可能想，要使得硬币数目最少，那简单啊。

先紧着面额最大的来凑就行了。

先拿个25c的、再拿两个10c的，5c的没法拿，于是再拿3个1c的。

于是得到贪婪解：<1,2,0,3>。

我们这个策略就是，很简单，先紧着最大的拿。
但是我们虽然这样做了，而且貌似可行。

但是实际上，它对于大多数情况而言，这样可能是没问题的；但是没法保证所有情况啊，你没法保证对于所有情况、任意某一种情况，这样都没问题。

有一些情况，你这样做，可能就压根不是最优解了。

但是：

对大多数常用的硬币面额都可以得到最优解。
对任意硬币面额，有可能不是最优解。

例如：

d 1 = 25 c , d 2 = 10 c , d 3 = 1 c 而且 n = 30 c d_1=25c,d_2=10c,d_3=1c而且n=30c d1=25c,d2=10c,d3=1c而且n=30c。

那么你还按照上面的规则，

先拿个25c的，然后拿五个1c的。------此时是6个硬币。

但实际上我们可以看出，直接拿三个10c的就够了，而且只用3个硬币。
所以可见，我们刚才的那种简单的想法：先紧着大面额的拿。

这种方法，可能在某些情况下没毛病，但是在有些情况下就不对了、不是最优解了。

**那咋办呢。**是不是我的想法、我的策略设计的有问题呢？

那到底咋样弄，才能对于所有情况都能得到最优解呢？

我们可以用回溯法。（不是讲贪心吗，咋又说回溯了？------后面再说这个问题）

**贪婪法：**建议通过一系列步骤来构造问题的解，每一步对目前构造的部分解做一个扩展，直到获得问题的完全解。（完全解，不是最优解）
必须满足：可行、局部最优、不可取消。

贪心算法要求

可行的：即它必须满足问题的约束。
局部最优：它是当前步骤中所有可行选择中最佳的局部选择。
不可取消：即选择一旦做出，在算法的后面步骤中就无法改变了。

就像人生中的一些选择一样，就是贪心算法么，每次选的是局部最优，而且选了之后就没法取消了。

在每一步中，它要求"贪婪"地选择最佳操作，并希望通过一系列局部的最优选择，能够产生一个整个问题的（全局的）最优解。

基本思想

从问题的某一个初始解出发，通过一系列的贪心选择（当前状态下的局部最优选择），逐步逼近给定的目标，尽可能快地求得更好的解。
在贪心算法（greedy method）中也采用逐步构造最优解的方法。在每个阶段，都做出一个按某个评价函数最优的决策，该评价函数最优称为贪心准则（greedy criterion）。
贪心算法的正确性，就是要证明按贪心准则求得的解是全局最优解。
贪心算法不能对所有问题都得到全局最优解。
但是对于许多问题，它能够产生全局最优解。如单源最短路径问题，最小生成树问题等。

适合求解问题的特征

**贪心选择性质：**可通过局部最优（贪心）选择达到全局最优解。
- 通常以自顶向下的方式进行，每次选择后将问题转化为规模更小的子问题。
- 该性质是贪心法使用成功的保障，否则得到的是近优解。
最优子结构性质：问题的最优解包含它的子问题的最优解 。
- 并不是所有具有最优子结构性质的问题都可以采用贪心策略。
- 往往可以利用最优子结构性质来证明贪心选择性质。

背包问题

0-1背包问题

给定n种物品和一个背包。物品i的重量是 W i W_i Wi，其价值为 V i V_i Vi，背包的容量为C。应如何选择装入背包的物品，使得装入背包中物品的总价值最大？

0-1背包问题，对于一个物品，0就是不拿它，1就是拿它。

在选择装入背包的物品时，对每种物品只有两种选择，要么装入背包、要么不装入背包。不能将一个物品装入背包多次，也不能只装入某物品的一部分。

背包问题

与0-1背包问题类似，所不同的是，在选择物品i装入背包时，可以选择物品i的一部分 ，而不一定要全部装入背包，1≤i≤n。

背包问题，也叫"分数背包问题"，对于一个物品，物品太大了，背包剩余空间不够了，此时我可以把物品拆下来、把一部分放进去。

0/1背包问题

已知
- 背包容量C>0
- n个物品，体积 w i > 0 w_i>0 wi>0，价值 p i > 0 f o r i = 1 , . . . , n p_i>0\ for\ i=1,...,n pi>0 for i=1,...,n
确定 { 1 , 2 , . . . , n } \{1,2,...,n\} {1,2,...,n}的子集，满足：

m a x ∑ i ∈ A p i , s u b j e c t t o ∑ i ∈ A w i ≤ C max\sum_{i∈A}p_i,subject\ to\ \sum_{i∈A}w_i≤C maxi∈A∑pi,subject to i∈A∑wi≤C

0/1背包问题------贪心法

有以下几种贪心选择准则：
- 最大价值优先------先选择最值钱的物品。
紧着最值钱的先往上放。
- 最小体积优先
紧着最小体积的先放，想装的多。
- 最大体积优先
想着一般大的东西都比较值钱？所以先紧着大件先放？
- 最大单位价值优先

这四个规则都有一定道理，那我们该选哪种呢？选最大价值优先？选最大单位价值优先？

没有一种方法能保证得到最优解

最大价值优先

（lb是重量单位，上面是价钱）

可见，最大价值优先，放进来的不一定是最优解。

最小体积优先

可见，最小体积优先，放进来的也不一定是最优解。

最大体积优先

可见，最大体积优先得到的也不一定是最优解。

最大单位价值优先

可见，这个也不一定能得到最优解。

分数背包问题

对于0/1背包问题，没有最优的贪心算法。
分数背包问题：可以将第i个物品的一部分放入背包。
对于分数背包问题，贪心算法是其不二选择，该算法基于最大单位价值的选择准则。（感觉有点类似于微积分里的微元思想）

这个就没啥好犹豫的了，我先紧着最大单位价值的往里面放，放不下整个物品的时候，我把当前最大单位价值的物品切出来一块往里面放。

这样最后包里放的肯定是价值最大的情况。

贪心算法过程：
- 降序排序 v i / w i v_i/w_i vi/wi。
- 根据排序次序增加物品，直到这个物品装完，或是超出背包容量。
- 如果背包没有满，选择下一个物品开始装。

最优解证明

证明：

我们首先假设我们有一个最优解 A 1 A_1 A1，那么我们首先找到 A 1 A_1 A1里面平均价值最高的物品 a m a_m am，然后我们将用商品里面平均价值最高的物品 a 1 a_1 a1将 a m a_m am进行全部替换或者部分替换得到解 A 2 A_2 A2，又因为 v 1 w 1 ≥ v m w m \frac{v_1}{w_1}≥\frac{v_m}{w_m} w1v1≥wmvm，所以 A 2 A_2 A2的总价值高于 A 1 A_1 A1的总价值，这与 A 1 A_1 A1是最优解矛盾，于是得到 A 1 A_1 A1里面包含平均价值最高的物品。

小数背包问题还具有贪心选择性质，用贪心法求解更简单、更快速。
0-1背包问题用贪心法求解不一定能得到最优解。

任务调度问题

9个任务需要调度，每个任务运行时间为3,5,6,10,11,14,15,18,20

如果只有一个处理器，那就没啥说的，每个任务看看按照什么规则往里放就行了，反正最后总时间是一样的。
但是如果有多个处理器呢？

有三个处理器执行这些任务。

当然，对于贪心而言，我们对这一问题也可以有很多种贪心策略。

贪心准则：先运行时间最长的任务。

每次把当前需要运行最长时间的任务，分配给当前任务时间最短的处理器。

因此，三个处理器执行这些任务，花费35分钟时间。

这个解决方法不错，但是我们可能还可以有更好的策略。

另一种贪心准则：优先运行最短任务

这个方式还不如刚才那个，这个需要花费40分钟。

最优解

折腾半天都不是最好的，那我们看看最优解到底是什么样的，如上图所示。

这个解为什么是最优的？

很明显么。因为三个处理器刚好平均分了所有任务的总时长，没有任何的浪费。

但是，可见，若想得到这样的一种解。你要付出的代价就会很高了。

有必要么，实际解决一个问题来说，这样去搞，可能没这个必要。你找到最优解了之后，最优解固然能够帮你节约时间；但是不要忽视了，你寻找这个最优解也要花时间。你为了找一个最优解去节约那一点点时间，然后你花了大量的时间在寻找到最优解上，得不偿失。

类似上图中这个最优解，是咋找到的？可能是暴力穷举吧，或者是什么方法。总之很耗时间才能找出来的。

实际上我就用一种贪心策略，去做，就拉倒了。虽然可能不是最优，但是接近最优差不多就行了。

对于一些特殊的问题，贪心算法能直接找出其最优解，能直接获取最优解那当然更好了。

总之贪心算法可能找到的不是最优解，而只是局部最优解；但是它的实现是很简单的，不会耗费太多时间。

同时，我们在贪心，贪的过程中，也可以利用回溯法的思想，对一些没必要继续探讨下去的情况进行剪枝，而没必要全部贪到底、再去排除。也就是贪心法配合回溯法进行使用。

活动选择问题

这个就是活动选择问题。

我选择哪些活动，能够让活动数量最多？

活动选择------贪心法

贪心法选择准则：
- 最早开始时间优先
- 最小持续时间优先
- 最早完成时间优先
哪个准则更有效？

最早开始时间优先。

假设有一个从0开始的活动，但是它持续时间巨长。

那这显然不是最优解。

如上图。

这个持续时间最小，但是可能因为做了它，它刚好介于两个活动邻接点，导致两个活动都没法做。

显然也不是最优解。

最早结束时间是不是能达到这个问题的最优解？

实际上，按最早结束时间优先，基本上都能取到最优解。
怎么证明这种策略的正确性？怎么知道上面的例子不是它的特例？

需要证明贪心法的正确性。

最早结束时间优先------最优性证明

**定理：**如果活动 a 1 a_1 a1在所有活动中具有最早结束时间，则最优解中一定包含 a 1 a_1 a1。

证明：

令 A A A是最优解， a 1 a_1 a1是贪心法选择的最早结束时间的活动。如果 a 1 ∈ A a_1∈A a1∈A，则定理得证。
如果 a 1 ∉ A a_1∉A a1∈/A，我们证明 A ∗ = A − { a } + { a 1 } A^*=A-\{a\}+\{a_1\} A∗=A−{a}+{a1}是另一个包含 a 1 a_1 a1的最优解，而 a a a是 A A A中具有最早结束时间的活动。
因为活动的结束时间已排序好， f ( a 1 ) ≤ f ( a ) f(a_1)≤f(a) f(a1)≤f(a)。假设 f ( a 1 ) ≤ s ( a ) f(a_1)≤s(a) f(a1)≤s(a)，如果我们把 a 1 a_1 a1加到 A A A，意味着 A A A不是最优的。所以 s ( a ) < f ( a 1 ) s(a)<f(a_1) s(a)<f(a1)，并且 a 1 a_1 a1和 a a a重叠。因为 f ( a 1 ) ≤ f ( a ) f(a_1)≤f(a) f(a1)≤f(a)，如果我们移除 a a a添加 a 1 a_1 a1，可以得到另一个最优解 A ∗ A^* A∗包含了 a 1 a_1 a1。 A ∗ A^* A∗是最优的，因为 ∣ A ∗ ∣ = ∣ A ∣ |A^*|=|A| ∣A∗∣=∣A∣。

没太看懂。

**定理：**贪心子选择一定产生最优解。

即，证明去掉一个 a 1 a_1 a1之后，对剩下的活动做最早结束时间优先策略，得到的也是子集的最优解。

证明：

令 a 1 a_1 a1是贪心算法选择的活动。
令 S ∗ S^* S∗是不与 a 1 a_1 a1重叠的活动子集

S ∗ = { a i ∣ i = 2 , . . . , n a n d s i ≥ f ( a 1 ) } S^*=\{a_i | i=2,...,n\ and\ s_i≥f(a_1)\} S∗={ai∣i=2,...,n and si≥f(a1)}

令 B B B是 S ∗ S^* S∗的最优解。
从 S ∗ S^* S∗的定义可知， A ∗ = { a 1 } ∪ B A^*=\{a_1\}∪B A∗={a1}∪B是可行的，并且是原问题的解。
利用反证法证明 A ∗ A^* A∗是最优解。
假设 A ∗ A^* A∗不是最优解，令 A A A是包含 a 1 a_1 a1的最优解，则 ∣ A ∗ ∣ < ∣ A ∣ |A^*|<|A| ∣A∗∣<∣A∣，且 ∣ A − { a 1 } ∣ > ∣ A ∗ − { a 1 } ∣ = ∣ B ∣ |A-\{a_1\}|>|A^*-\{a_1\}|=|B| ∣A−{a1}∣>∣A∗−{a1}∣=∣B∣。
但是 A − { a 1 } A-\{a_1\} A−{a1}也是 S ∗ S^* S∗的解，与 B B B是 S ∗ S^* S∗的最优解矛盾。
所以 A ∗ A^* A∗一定是原问题的最优解。