算法导论第二章中提出了一个概念--"循环不变式"
那么,何为循环不变式
我的理解是:
"循环不变式是用于证明算法正确性的一种工具"
它应该怎么用呢
- 首先,对于任意的一种算法,我们需要找出其循环不变式
- 然后,需要证明循环不变式的三条性质
对于插入排序算法,它的证明是这样的:
- 设下标j为目前正在排序的数字的索引,开始时j = 1(C++中索引从0开始,我们这里从第二个元素开始排,至于为什么,请往下读)
- 循环不变式:"for循环每次开始时,A[0...j-1]是有序的"
接下来我们证明三条性质:
- 初始化 :循环的第⼀次迭代之前,循环不变式为真
- 保持 :如果循环的某次迭代之前循环不变式为真,那么下次迭代之前它仍为真
- 终止 :终止时不变式要能做到符合结果(比如:完成排序)
证明:
1.初始化:显然,j = 1时,A[0...j-1]就是A[0],只有一个数字,当然是符合循环不变式的
2.保持:若 A[0..j-1] 有序,将 A[j] 插入后,A[0..j] 仍有序
3.终止:终止时,当 j = n 时,A[0..n] 整体有序,排序完成
因此你可以看到,事实上,循环不变式就是用来规范证明算法正确性的工具
如果你对数学归纳法比较熟的话,很容易发现其实循环不变式就是数学归纳法的一个变种
如何找循环不变式?
由于算法是一步步执行的,那么如果每一步(包括初试和结束)都满足一个共同的条件,那么这个条件就是要找的循环不变式(loop invariant)
一个例子:
二分查找
不变式:若目标值存在,则必在子数组 A[l..r] 中
证明要点:
初始化:l=0, r=n-1,覆盖整个数组
保持:根据中间值比较调整边界,目标值仍在新区间内
终止:l > r 时子数组为空,目标不存在 → 返回 -1
我们发现,三条性质都符合我们的要求(初始化和保持满足不变式、终止符合要求的结果),所以算法正确
循环不变式不只是理论工具------它强迫你在写循环时明确"我试图维护什么"。这种思维习惯能显著减少代码错误。
------《算法导论》核心思想
插入排序
算法原理:
插入排序与我们手动整理一副牌的过程类似(这里我们引用算法导论上的比喻)
(注意,目前为了易读,我们讨论升序排序,对于非升序,参考GitHub:《算法导论》笔记src/insertion_sort(插入排序).h中的注释
想象一下:你现在右手放着一副乱序的牌,左手开始时什么都没有
我们规定:右手的牌是无序的,左手始终有序
那么,我们现在从右手拿出一张牌,放到左手中
此时,你左手的牌仍然有序,因为此时只有一张牌,符合规定
接着,我们去拿下一张牌,这时有两种情况:
1.当前的牌面>=左手牌面
2.当前的牌面<左手牌面
对于1,我们直接将牌放于左手的顶部即可
对于2,我们需要将牌放于左手第一张的下面
让我们重复这个过程:
1.取出一张牌,我们记录它的值为key
2.从左手的第一张开始,逐个比较(我们记为A[j]),直到key<=A[j],执行3;
3.那么此时,A[j+1]就是key这个值在左手上的正确位置,我们令A[j+1]=key,
相当于把key插入到对应位置
4.执行1-3,直到整个数列有序
问题是,在计算机中,我们没办法执行插入
这个操作,更具体的说,令A[j+1]=key时,会丢失A[j+1]的值
此时想想排牌时的操作:当我们找到合适位置时,我们会将它右侧的所有牌右移一点,腾出
一个空位来
那么在算法中,我们应该怎么办呢?
很简单,我们做一点点修改:
在上述的过程2中,如果我们发现key>A[j],我们令A[j+1] = A[j]
可以试验一下:
假设左手牌为:2,4
当前的key = 3
当前的j = 1(C++索引从0开始)
执行2:由于4>key,我们让A[j+1] = A[j],即A[2] = A[1]
那么,此时A[j]已经复制到了A[j+1],我们无论怎么操作都不会丢失A[j]的数据,相当于腾出来了一个空位
继续执行2: 此时的j = 0,A[j] = A[0] = 2<key,执行3
执行3: 此时,A[j+1]就是key在左手的正确位置,所以令A[j+1]=key,而此时的A[j+1]就是上一轮的A[j](因为每次j都会-1)
而上一轮的A[j]已复制到上一轮的A[j+1]也就是当前的A[j+2]
所以我们可以直接令A[j+1]=key,不会丢失任何数据
只要我们持续这个操作,右手的所有牌最终都会正确地到达左手的正确位置
如何形式化的验证算法正确性:
算法导论给我们提供了一个方法,类似数学归纳法--"循环不变式"
关于循环不变式的详解:参考docs/循环不变式.md
我们来证明插入排序的循环不变式
如何找循环不变式?
由于算法是一步步执行的,那么如果每一步(包括初始和结束)都满足一个共同的条件,那么这个条件就是要找的循环不变式(loop invariant)
显然的,我们一直在试图维护左手牌堆是有序的这个性质
那么,插入排序的循环不变式就是:循环中,A[0...j-1]是有序的
接下来,我们证明循环不变式的三条性质:
1.初始化:显然,j = 1时,A[0...j-1]就是A[0],只有一个数字(这里我们提前将一张右手牌放入左手,并不影响结果),当然是符合循环不变式的
2.保持:若 A[0..j-1] 有序,将 A[j] 插入后,A[0..j] 仍有序
3.终止:终止时,当 j = n 时,A[0..n] 整体有序,排序完成
因此,插入排序最终被证明为正确的
关于代码实现,参考GitHub:《算法导论》笔记src/insertion_sort(插入排序).h
P.S.在之后的算法设计文档中,我们都使用循环不变式来设计和证明算法
文章及代码已同步到GitHub:《算法导论》笔记,欢迎参考
如有错误,请不吝赐教