《算法导论》笔记——循环不变式及插入排序证明

算法导论第二章中提出了一个概念--"循环不变式"

那么,何为循环不变式

我的理解是:

"循环不变式是用于证明算法正确性的一种工具"

它应该怎么用呢

  • 首先,对于任意的一种算法,我们需要找出其循环不变式
  • 然后,需要证明循环不变式的三条性质

对于插入排序算法,它的证明是这样的:

  • 设下标j为目前正在排序的数字的索引,开始时j = 1(C++中索引从0开始,我们这里从第二个元素开始排,至于为什么,请往下读)
  • 循环不变式:"for循环每次开始时,A0...j-1是有序的"

接下来我们证明三条性质:

  • 初始化 :循环的第⼀次迭代之前,循环不变式为真
  • 保持 :如果循环的某次迭代之前循环不变式为真,那么下次迭代之前它仍为真
  • 终止 :终止时不变式要能做到符合结果(比如:完成排序)

证明:

1.初始化:显然,j = 1时,A0...j-1就是A0,只有一个数字,当然是符合循环不变式的

2.保持:若 A0..j-1 有序,将 Aj 插入后,A0..j 仍有序

3.终止:终止时,当 j = n 时,A0..n 整体有序,排序完成

因此你可以看到,事实上,循环不变式就是用来规范证明算法正确性的工具

如果你对数学归纳法比较熟的话,很容易发现其实循环不变式就是数学归纳法的一个变种

如何找循环不变式?

由于算法是一步步执行的,那么如果每一步(包括初试和结束)都满足一个共同的条件,那么这个条件就是要找的循环不变式(loop invariant)

一个例子:

二分查找

不变式:若目标值存在,则必在子数组 Al..r

证明要点:

初始化:l=0, r=n-1,覆盖整个数组

保持:根据中间值比较调整边界,目标值仍在新区间内

终止:l > r 时子数组为空,目标不存在 → 返回 -1

我们发现,三条性质都符合我们的要求(初始化和保持满足不变式、终止符合要求的结果),所以算法正确

循环不变式不只是理论工具------它强迫你在写循环时明确"我试图维护什么"。这种思维习惯能显著减少代码错误。

------《算法导论》核心思想

插入排序

算法原理:

插入排序与我们手动整理一副牌的过程类似(这里我们引用算法导论上的比喻)

(注意,目前为了易读,我们讨论升序排序,对于非升序,参考GitHub:《算法导论》笔记src/insertion_sort(插入排序).h中的注释

想象一下:你现在右手放着一副乱序的牌,左手开始时什么都没有

我们规定:右手的牌是无序的,左手始终有序

那么,我们现在从右手拿出一张牌,放到左手中

此时,你左手的牌仍然有序,因为此时只有一张牌,符合规定

接着,我们去拿下一张牌,这时有两种情况:

1.当前的牌面>=左手牌面

2.当前的牌面<左手牌面

对于1,我们直接将牌放于左手的顶部即可

对于2,我们需要将牌放于左手第一张的下面

让我们重复这个过程:
1.取出一张牌,我们记录它的值为key
2.从左手的第一张开始,逐个比较(我们记为Aj),直到key<=Aj,执行3;
3.那么此时,Aj+1就是key这个值在左手上的正确位置,我们令Aj+1=key,
相当于把key插入到对应位置
4.执行1-3,直到整个数列有序

问题是,在计算机中,我们没办法执行插入这个操作,更具体的说,令Aj+1=key时,会丢失Aj+1的值

此时想想排牌时的操作:当我们找到合适位置时,我们会将它右侧的所有牌右移一点,腾出一个空位来

那么在算法中,我们应该怎么办呢?

很简单,我们做一点点修改:

在上述的过程2中,如果我们发现key>Aj,我们令Aj+1 = Aj

可以试验一下:

假设左手牌为:2,4

当前的key = 3

当前的j = 1(C++索引从0开始)

执行2:由于4>key,我们让Aj+1 = Aj,即A2 = A1

那么,此时Aj已经复制到了Aj+1,我们无论怎么操作都不会丢失Aj的数据,相当于腾出来了一个空位

继续执行2: 此时的j = 0,Aj = A0 = 2<key,执行3

执行3: 此时,Aj+1就是key在左手的正确位置,所以令Aj+1=key,而此时的Aj+1就是上一轮的Aj(因为每次j都会-1)

而上一轮的Aj已复制到上一轮的Aj+1也就是当前的Aj+2

所以我们可以直接令Aj+1=key,不会丢失任何数据

只要我们持续这个操作,右手的所有牌最终都会正确地到达左手的正确位置

如何形式化的验证算法正确性:

算法导论给我们提供了一个方法,类似数学归纳法--"循环不变式"

关于循环不变式的详解:参考docs/循环不变式.md

我们来证明插入排序的循环不变式

如何找循环不变式?

由于算法是一步步执行的,那么如果每一步(包括初始和结束)都满足一个共同的条件,那么这个条件就是要找的循环不变式(loop invariant)

显然的,我们一直在试图维护左手牌堆是有序的这个性质

那么,插入排序的循环不变式就是:循环中,A0...j-1是有序的

接下来,我们证明循环不变式的三条性质:

1.初始化:显然,j = 1时,A0...j-1就是A0,只有一个数字(这里我们提前将一张右手牌放入左手,并不影响结果),当然是符合循环不变式的

2.保持:若 A0..j-1 有序,将 Aj 插入后,A0..j 仍有序

3.终止:终止时,当 j = n 时,A0..n 整体有序,排序完成

因此,插入排序最终被证明为正确的

关于代码实现,参考GitHub:《算法导论》笔记src/insertion_sort(插入排序).h

P.S.在之后的算法设计文档中,我们都使用循环不变式来设计和证明算法

文章及代码已同步到GitHub:《算法导论》笔记,欢迎参考

如有错误,请不吝赐教

相关推荐
budingxiaomoli23 分钟前
动态规划--斐波那契数列模型
算法·动态规划
IT猿手28 分钟前
多目标优化算法:多目标蛇优化算法(Multiple Objective Snake Optimizer,MOSO)(提供MATLAB代码)
开发语言·算法·matlab·动态路径规划·光伏模型参数估计
MegaDataFlowers1 小时前
101.对称二叉树
算法
Jasmine_llq1 小时前
《B3939 [GESP样题 四级] 绝对素数》
数据结构·算法·素数判断算法·数字拆分与反转算法·区间遍历枚举·双条件判断逻辑
郝学胜-神的一滴1 小时前
干货版《算法导论》07:递归视角下的选择排序与归并排序
java·数据结构·c++·python·程序人生·算法·排序算法
csdn_aspnet1 小时前
javascript 算法 LeetCode 编号 70 - 爬楼梯
开发语言·javascript·算法·leetcode·ecmascript
shehuiyuelaiyuehao2 小时前
多线程入门
java·python·算法
Navigator_Z2 小时前
LeetCode //C - 1073. Adding Two Negabinary Numbers
c语言·算法·leetcode
醇氧2 小时前
【OpenClaw】更换阿里百炼完整配置指南
算法·ai
Tina学编程2 小时前
[HOT100]每日一练------最长连续序列
算法·hot 100