【算法分析与设计】第41篇：确定性与非确定性多项式时间：P与NP的形式化

在专栏第10篇中，我们首次接触了P与NP的概念，并以基于比较的排序下界为例初步感受了复杂度理论的基本推理方式。当时的讨论侧重于建立直观认知------P是"可高效求解的问题"，NP是"可高效验证的问题"，NP完全是"NP中最难的问题"。现在，经过分治、动态规划、贪心、图论、网络流、近似算法等数十篇算法的系统训练，我们有了足够的技术储备来面对这些概念的严格形式化。本文将从图灵机的定义出发，精确地重建P与NP的理论大厦。

一、图灵机：计算的形式化模型

一切复杂度理论的讨论都必须建立在严格的计算模型之上。第2篇中我们介绍了RAM模型用于日常算法分析，但在讨论计算能力的边界时，需要更基础、更简朴的模型------图灵机。

一台确定性图灵机由以下要素构成。一条向两端无限延伸的纸带，划分为一个个可写入符号的格子。一个有限状态控制器，始终处于某个状态。一个读写头，在每一步中根据当前状态和当前读取的符号，按照预定的转移函数，在纸带上写入新符号、将读写头向左或向右移动一格、并转换到新状态。

形式化地，一台确定性图灵机 MM 是一个七元组 (Q,Σ,Γ,δ,q0,qaccept,qreject)(Q,Σ,Γ,δ,q0,qaccept,qreject)。QQ 是有限状态集，ΣΣ 是输入字母表，ΓΓ 是纸带字母表（包含 ΣΣ 和空白符号），δ:Q×Γ→Q×Γ×{L,R}δ:Q×Γ→Q×Γ×{L,R} 是转移函数。q0q0 是初始状态，qacceptqaccept 是接受状态，qrejectqreject 是拒绝状态。

图灵机在输入 x∈Σ∗x∈Σ∗ 上的运行过程是确定的：初始时输入写在纸带上，读写头指向第一个字符，状态为 q0q0。每一步根据当前状态和所读符号由 δδ 唯一决定下一步动作。若在有限步内进入 qacceptqaccept，则 MM 接受 xx，记为 M(x)=1M(x)=1；若进入 qrejectqreject，则 MM 拒绝 xx，记为 M(x)=0M(x)=0；若永不进入停机状态，则称 MM 在 xx 上不停机。

一台图灵机 MM 所判定的语言 L(M)L(M) 定义为：L(M)={x∈Σ∗∣M(x)=1}L(M)={x∈Σ∗∣M(x)=1}。对于 L(M)L(M) 中的任意输入，MM 必须停机并接受；对于不在 L(M)L(M) 中的任意输入，MM 必须停机并拒绝。这一双重停机的要求是"判定"一词的严格含义------判定一个语言意味着算法对所有输入都在有限时间内给出确定的"是/否"答案。

二、P类的形式化定义

一台图灵机 MM 在输入 xx 上的运行时间 tM(x)tM(x) 定义为 MM 从初始状态到进入停机状态所经历的步数。若 MM 在 xx 上不停机，则 tM(x)tM(x) 无定义（但判定器必须在所有输入上停机，故此情况不会发生）。

MM 是多项式时间的，若存在多项式 p(n)p(n)，使得对任意输入 x∈Σ∗x∈Σ∗，有 tM(x)≤p(∣x∣)tM(x)≤p(∣x∣)。这里 ∣x∣∣x∣ 表示输入串的长度------这是复杂度理论中衡量输入规模的统一标准。

P类是所有能被某个确定性多项式时间图灵机判定的语言（判定问题）的集合：

P={L⊆Σ∗∣∃ 确定性多项式时间图灵机 M 判定 L}P={L⊆Σ∗∣∃ 确定性多项式时间图灵机 M 判定 L}

这里有几个关键注释。第一，多项式是相对于输入长度而言的，而非输入的数值大小------我们在第10篇讨论伪多项式时间时已接触过这一区别。第二，多项式的阶数可以任意大------O(n)O(n)、O(n2)O(n2)、O(n100)O(n100) 都算多项式时间，P类包含了所有这些。这在实践中似乎过于宽泛（O(n100)O(n100) 的算法在现实中没有实用价值），但P类的理论价值在于刻画"多项式 vs. 指数"的本质分界------多项式函数在复合下封闭，指数函数则否。第三，Church-Turing论题断言图灵机刻画了"可计算"的直观概念，相应地，加强版的Cook-Karp论题断言"图灵机上的多项式时间"恰对应于"实际中可高效求解"的问题类。尽管 O(n100)O(n100) 算法在工程上不实用，但历史上几乎所有在某个合理计算模型下被发现有多项式算法的问题，最终都被发现具有低次多项式（通常 O(n3)O(n3) 或更低）的算法。因此P仍是对"高效可解"最成功的理论刻画。

三、非确定性与NP类

NP类的"N"代表"非确定性"（Nondeterministic），而非"非多项式"（Not Polynomial）。要理解NP，必须首先理解非确定性图灵机。

一台非确定性图灵机 的转移函数不再是一一对应的确定性映射，而是一个多值映射：δ:Q×Γ→P(Q×Γ×{L,R})δ:Q×Γ→P(Q×Γ×{L,R})。在任意给定状态和读取符号下，机器有有限多个可选的动作。运行时，机器可以在每一步非确定性地 选择任意一个合法动作。一个输入 xx 被接受，当且仅当存在至少一个合法的动作选择序列，使得机器进入接受状态。

非确定性不是概率------它不需要概率分布，而是"猜测+验证"的抽象模型。非确定性图灵机可被想象为：在每一步的分岔处，机器神奇地猜对了通向接受状态的选择。等价地，也可将其视为同时探索所有分支的并行计算模型。

非确定性图灵机 MM 在输入 xx 上的运行时间 tM(x)tM(x) 定义为：在所有接受计算路径中，最短的那条路径的长度。MM 是非确定性多项式时间的，若存在多项式 p(n)p(n)，使得对任意 x∈L(M)x∈L(M)，MM 接受 xx 的最短计算路径不超过 p(∣x∣)p(∣x∣) 步。

NP类是所有能被某个非确定性多项式时间图灵机判定的语言的集合：

NP={L⊆Σ∗∣∃ 非确定性多项式时间图灵机 M 判定 L}NP={L⊆Σ∗∣∃ 非确定性多项式时间图灵机 M 判定 L}

NP有一个等价且更直观的刻画------证书验证视角。L∈NPL∈NP 当且仅当存在一个多项式时间可判定的二元关系 RR 和一个多项式 pp，使得：

x∈L ⟺ ∃y,∣y∣≤p(∣x∣),R(x,y)=1x∈L⟺∃y,∣y∣≤p(∣x∣),R(x,y)=1

这里 yy 称为 xx 属于 LL 的证书（或"见证"）。非确定性图灵机的"猜测"能力在此对应于证书的存在性：非确定性机器可以"猜"出正确的证书，然后通过 RR 在多项式时间内验证其正确性。

以哈密顿回路问题为例：证书 yy 是顶点的一个排列，RR 在多项式时间内检验该排列是否构成一个经过每个顶点恰好一次且首尾相邻的回路。以合数判定问题为例：证书 yy 是一对非平凡因子，RR 检验其乘积是否等于原数。证书验证视角是证明一个问题属于NP的标准方法，也是理解"P vs. NP"问题的关键------它揭示了两类问题的本质区别在于"求解"与"验证"之间的不对称性。

四、P与NP的关系

由定义可直接得 P⊆NPP⊆NP：若一个问题可被确定性多项式时间算法判定，则同一个算法也可视为一个"忽略非确定性能力"的非确定性算法（其转移函数退化为每步只有一个合法选择）。因此 P⊆NPP⊆NP 是平凡的。

反过来，NP⊆PNP⊆P 是否成立？即：对于任意一个"验证容易"的问题，是否必然存在一个"求解也容易"的确定性算法？这个问题就是著名的P vs. NP问题。目前已知的是 P⊆NPP⊆NP，但不知道包含关系是否是严格的。绝大多数理论计算机科学家相信 P≠NPP=NP，即确实存在验证容易但求解困难的问题。证明或否定这一猜想是Clay数学研究所千禧年七大难题之一，悬赏一百万美元。

五、多项式时间归约与NP完全性

即使无法直接证明 P≠NPP=NP，复杂度理论仍可以通过归约将问题的难度进行比较。设 L1L1 和 L2L2 为两个判定问题。若存在多项式时间可计算函数 f:Σ∗→Σ∗f:Σ∗→Σ∗，使得 x∈L1 ⟺ f(x)∈L2x∈L1⟺f(x)∈L2，则称 L1L1 可多项式时间归约到 L2L2，记为 L1≤pL2L1≤pL2。其直观含义是：L2L2 至少和 L1L1 一样难------如果能解决 L2L2，就能通过计算 ff 并查询 L2L2 的解答来解决 L1L1，且归约过程的额外代价仅为多项式时间。

多项式时间归约具有传递性：若 L1≤pL2L1≤pL2 且 L2≤pL3L2≤pL3，则 L1≤pL3L1≤pL3。它也保持P的封闭性：若 L2∈PL2∈P 且 L1≤pL2L1≤pL2，则 L1∈PL1∈P。

NP完全的定义正是建立在归约之上。语言 LL 是NP完全的，若满足两个条件：

L∈NPL∈NP（LL 属于NP类）。
对任意 L′∈NPL′∈NP，有 L′≤pLL′≤pL（LL 是NP难的------NP中的任何问题都可归约到它）。

若存在一个NP完全问题属于P，则 P=NPP=NP。若存在一个NP完全问题不属于P，则 P≠NPP=NP，且所有NP完全问题都不属于P。NP完全问题实质上是NP类中"最难"的那一批问题的代表------它们之间彼此可互相归约，攻破其中任何一个就等于攻破了整个NP类。

六、总结与展望

本文以图灵机为起点，严格建立了P与NP的形式化定义。P是确定性多项式时间可判定的语言类，NP是非确定性多项式时间可判定的语言类，其等价刻画是"存在可在多项式时间内验证的证书"。多项式时间归约使得我们可以在不解决P vs. NP问题本身的前提下，建立问题之间的相对难度关系，NP完全性由此成为理论上标识"NP中最困难问题"的核心概念框架。

然而，所有这些讨论都围绕着一个默认的前提：我们对"高效"的定义是多项式时间。是否可能在多项式时间内解决NP完全问题，是目前仍未可知的核心悬念。在等待答案的同时，理论计算机科学已经建立了从SAT到数千个实际问题的NP完全性证明体系。下一篇，我们将进入NP完全问题的经典证明技术------以SAT、3-SAT和顶点覆盖问题为核心，展示如何通过多项式时间归约链条，将一个问题一个问题的NP完全性逐步建立起来。Cook-Levin定理的证明思想也将在下一篇中给出概要介绍。