【算法基础篇】（五十九）巴什博弈 (Bash Game) 超详解：从原理到实战，搞定经典取石子问题

前言

在算法竞赛的博弈论领域，巴什博弈（Bash Game）是最基础、最经典的公平组合游戏模型，也是入门博弈论的必经之路。它以简单的规则为载体，蕴含着博弈论的核心思想 ------必胜态与必败态的推导，掌握巴什博弈的解题思路，能为后续学习 Nim 博弈、SG 函数等复杂博弈模型打下坚实的基础。本文将从巴什博弈的定义出发，深入推导其核心结论，结合多个经典例题讲解实战用法，同时附上完整的 C++ 代码实现，让你彻底吃透巴什博弈的精髓。下面就让我们正式开始吧！

一、博弈论基础铺垫

在正式讲解巴什博弈之前，我们先快速梳理博弈论中几个核心概念，这是理解所有博弈模型的前提，尤其是**公平组合游戏（ICG）**的定义，巴什博弈正是典型的公平组合游戏。

1.1 公平组合游戏 (ICG)

公平组合游戏是博弈论中最核心的分类之一，满足以下三个关键条件：

游戏由两名玩家轮流进行决策，双方都知晓游戏的全部信息（无隐藏规则）；

任意玩家在某一确定游戏状态下，能做出的决策集合只与当前状态有关，与玩家身份无关（双方规则对等）；

游戏以玩家无法行动为判负条件，且游戏一定会在有限步内结束，不存在平局。

简单来说，公平组合游戏的核心是规则公平、结果确定，不存在运气成分，且两名玩家的操作空间完全由当前游戏状态决定。

1.2 必胜态与必败态

在公平组合游戏中，由于玩家都是绝顶聪明的（会选择对自己最有利的最优策略），因此游戏的每一个状态都有唯一的结果，分为两种：

必胜态：当前状态下，行动的玩家（先手）存在至少一种策略，使得无论对方如何操作，自己最终都能获胜；

必败态：当前状态下，行动的玩家（先手）无论采取何种策略，对方都能找到应对方法，最终自己一定会失败。

博弈论的核心解题思路，就是推导游戏初始状态是必胜态还是必败态，而推导的关键依据是两个核心性质：

必胜态的后继状态中，至少存在一个必败态（先手可以通过操作让对方陷入必败态）；

必败态的后继状态中，全部都是必胜态（无论先手怎么操作，都会让对方进入必胜态）。

这两个性质是所有博弈模型推导的底层逻辑，巴什博弈的结论也正是基于此推导而来。

1.3 非公平组合游戏与反常游戏

与公平组合游戏相对的是非公平组合游戏，其核心区别是：玩家在确定状态下的决策集合与玩家身份有关，比如中国象棋、围棋、国际象棋（双方不能使用对方的棋子），这类游戏的解题思路比公平组合游戏复杂得多。

反常游戏则是规则与经典游戏一致，但胜负判定相反的游戏，比如经典 Nim 游戏是取走最后一颗石子获胜，而反常 Nim 游戏是取走最后一颗石子判负。巴什博弈也存在反常版本，本文重点讲解经典巴什博弈，后续会简单提及反常版本的思路。

二、巴什博弈 (Bash Game) 核心原理

2.1 巴什博弈的经典问题描述

巴什博弈的经典场景是取石子游戏，规则如下：

一共有n颗石子，两名玩家轮流从石子堆中取石子，每次至少取 1 颗，最多取k颗；拿到最后一颗石子的玩家获胜。

问：先手玩家是否存在必胜策略？

这是最标准的巴什博弈模型，所有巴什博弈的变种问题都是基于此规则延伸而来。我们的目标就是通过数学推导，找到n和k之间的关系，直接判断先手的胜负。

2.2 核心结论推导

结合前文提到的必胜态与必败态的核心性质，我们从最简单的情况开始推导，逐步找到规律。

步骤 1：定义基础状态

首先定义必败态的基准 ：当石子数n=0时，当前玩家无石子可取，判负，因此n=0是必败态。

步骤 2：分析小数值的状态规律

假设每次最多取k=3颗石子（方便举例），我们分析n从 1 到 10 的状态：

n=1：先手取 1 颗，直接获胜 → 必胜态；

n=2：先手取 2 颗，直接获胜 → 必胜态；

n=3：先手取 3 颗，直接获胜 → 必胜态；

n=4：先手无论取 1/2/3 颗，后手都能取走剩下的所有石子（比如先手取 1，后手取 3；先手取 2，后手取 2；先手取 3，后手取 1），后手获胜 → 必败态；

n=5：先手取 1 颗，剩下 4 颗（必败态）交给后手 → 必胜态；

n=6：先手取 2 颗，剩下 4 颗（必败态）交给后手 → 必胜态；

n=7：先手取 3 颗，剩下 4 颗（必败态）交给后手 → 必胜态；

n=8：先手无论取 1/2/3 颗，后手都能取走对应数量，让剩下的石子数为 4 颗 → 必败态；

从这个例子中，我们能清晰看到规律：当 n 是 k+1 的倍数时，当前状态为必败态；否则为必胜态。

对应上面的例子，k+1=4，n=4、8是 4 的倍数，均为必败态，其余为必胜态。

步骤 3：通用结论严格证明

通过例子找到的规律需要严格证明，我们结合必胜态和必败态的核心性质，证明巴什博弈的通用结论：

巴什博弈核心结论：对于 n 颗石子、每次取 1~k 颗的取石子游戏，

若n % (k + 1) == 0，则先手必败；

若n % (k + 1) != 0，则先手必胜。

证明过程 ：设m = k + 1，分两种情况讨论：

情况 1：n 是 m 的倍数（n = t * m，t 为正整数）

当前玩家（先手）无论取x颗石子（1 ≤ x ≤ k），剩下的石子数为**n - x = t*m - x。此时后手玩家只需取m - x颗石子（由于1 ≤ x ≤ k，则1 ≤ m - x ≤ k，符合规则），剩下的石子数为(t-1)*m**，依旧是 m 的倍数。

如此反复，后手玩家总能让每次操作后剩下的石子数保持为 m 的倍数，最终先手玩家会面对n=m的状态，无论先手取多少，后手都能取走最后一颗石子，因此n 是 m 的倍数时，先手必败（必败态）。

情况 2：n 不是 m 的倍数（n = t * m + r，1 ≤ r ≤ k）

当前玩家（先手）可以直接取r颗石子，剩下的石子数为t * m，是 m 的倍数，将必败态交给后手玩家。

此后后手玩家处于必败态，无论后手取多少，先手都能按照情况 1 的策略，让每次操作后剩下的石子数保持为 m 的倍数，最终先手取走最后一颗石子，因此n 不是 m 的倍数时，先手必胜（必胜态）。

至此，巴什博弈的核心结论得到严格证明，这个结论是解决所有巴什博弈问题的关键，只需通过一个取模运算就能直接判断胜负，时间复杂度为 O (1)，效率极高。

2.3 巴什博弈的核心思想

巴什博弈的核心是凑数策略 ：先手玩家通过第一次操作，让剩下的游戏状态成为必败态，而后手玩家无论如何操作，都无法摆脱必败态，先手玩家只需全程模仿后手的操作节奏，始终将必败态交给对方，最终获胜。

简单来说，就是先手创造必败态，后手被迫进入必败态，这也是所有公平组合游戏的核心解题思路。

三、巴什博弈经典例题实战

理论结合实践才是掌握算法的关键，本节将结合巴什博弈的经典例题，从基础模板题到变种题，逐一讲解解题思路，并附上完整的 C++ 代码实现，所有代码均经过验证，可直接用于算法竞赛。

3.1 例题 1：取石子游戏 1（巴什博弈基础模板题）

题目链接：https://ac.nowcoder.com/acm/problem/50614

题目来源

牛客网（信息学奥赛一本通）

题目描述

玩家为 2 人，道具为 N 颗石子，规则如下：

双方轮流取石子；
每人每次取走 1~K 颗石子（最少 1 颗，最多 K 颗）；
石子取光游戏结束，最后取石子的一方获胜。

假设两名玩家都非常聪明，问最后谁会获胜？

输入描述

输入仅一行，两个整数 N 和 K，表示石子总数和每次最多取的石子数。

输出描述

输出仅一行，1 表示先手获胜，2 表示后手获胜。

解题思路

这是最标准的巴什博弈模板题，直接套用核心结论即可：

若N % (K+1) != 0，先手必胜，输出 1；

若N % (K+1) == 0，后手必胜，输出 2。

C++ 代码实现

cpp 复制代码

#include <iostream>
using namespace std;

int main() {
    int n, k;
    cin >> n >> k;
    // 直接套用巴什博弈结论
    if (n % (k + 1) != 0) {
        cout << 1 << endl; // 先手必胜
    } else {
        cout << 2 << endl; // 后手必胜
    }
    return 0;
}

示例测试

输入：23 3

计算：23 % (3+1) = 23 %4 = 3 ≠ 0 → 先手必胜

输出：1与题目示例一致，验证代码正确性。

3.2 例题 2：Roy&October 之取石子（巴什博弈变种 1）

题目链接：https://www.luogu.com.cn/problem/P4018

题目来源

洛谷 P4018

题目描述

共有 n 个石子，两人每次只能取p^k个石子（p 为质数，k 为自然数，且p^k ≤ 当前剩余石子数），谁取走最后一个石子谁赢。October 为先手，问她是否有必胜策略？若有，输出October wins!；否则输出Roy wins!。

输入描述

第一行一个正整数 T，表示测试用例组数；第 2~T+1 行，每行一个正整数 n，表示石子个数。

输出描述

T 行，每行输出对应的结果。

解题思路

这道题看似是新的规则，实则是巴什博弈的变种，核心是找到必败态的周期，通过推导可得出结论：

当 n 是 6 的倍数时，先手必败；

当 n 不是 6 的倍数时，先手必胜。

本质上，该规则下每次可取的石子数集合决定了k+1=6，因此转化为巴什博弈的标准模型，直接用 n 对 6 取模即可判断胜负。

C++ 代码实现

cpp 复制代码

#include <iostream>
using namespace std;

int main() {
    int T;
    cin >> T;
    while (T--) {
        int n;
        cin >> n;
        if (n % 6 != 0) {
            cout << "October wins!" << endl;
        } else {
            cout << "Roy wins!" << endl;
        }
    }
    return 0;
}

示例测试

输入：34914

计算：4%6=4≠0 → October wins!

9%6=3≠0 → October wins!

14%6=2≠0 → October wins!

输出与题目示例一致，验证代码正确性。

3.3 例题 3：Roy&October 之取石子 II（巴什博弈变种 2）

题目链接：https://www.luogu.com.cn/problem/P4860

题目来源

洛谷 P4860

题目描述

共有 n 个石子，两人每次只能取p^k个石子（p 为质数，k=0 或 1，且p^k ≤ 当前剩余石子数），谁取走最后一个石子谁赢。October 为先手，问她是否有必胜策略？若有，输出October wins!；否则输出Roy wins!。

输入描述

第一行一个正整数 T，表示测试用例组数；第 2~T+1 行，每行一个正整数 n，表示石子个数。

输出描述

T 行，每行输出对应的结果。

解题思路

这道题是上一题的变种，规则中限制了 k 只能为 0 或 1，推导后可得核心结论：

当 n 是 4 的倍数时，先手必败；

当 n 不是 4 的倍数时，先手必胜。

该规则下k+1=4，依旧是巴什博弈的标准模型，直接用 n 对 4 取模即可。

C++ 代码实现

cpp 复制代码

#include <iostream>
using namespace std;

int main() {
    int T;
    cin >> T;
    while (T--) {
        int n;
        cin >> n;
        if (n % 4 != 0) {
            cout << "October wins!" << endl;
        } else {
            cout << "Roy wins!" << endl;
        }
    }
    return 0;
}

示例测试

输入：35714

计算：5%4=1≠0 → October wins!

7%4=3≠0 → October wins!

14%4=2≠0 → October wins!

四、巴什博弈的延伸与拓展

掌握了经典巴什博弈和其变种后，我们可以对巴什博弈进行进一步的延伸，了解其反常版本和更复杂的组合版本，为后续学习更复杂的博弈模型做铺垫。

4.1 巴什博弈的反常版本

反常巴什博弈的规则与经典版本一致，唯一区别是胜负判定相反：取走最后一颗石子的玩家判负。

对于反常巴什博弈，核心结论需要稍作调整：

一共有 n 颗石子，每次取 1~k 颗，取走最后一颗石子的玩家判负，先手必胜的条件是**(n-1) % (k+1) != 0**。

推导思路 ：反常版本的核心是让对方取走最后一颗石子 ，因此先手玩家需要让剩下的石子数为 1 时，交给对方操作。此时问题转化为：先手玩家需要将 n-1 颗石子的经典巴什博弈必败态交给对方 ，因此只需对n-1套用经典巴什博弈的结论即可。

4.2 巴什博弈与其他博弈模型的组合

在算法竞赛中，纯巴什博弈的题目相对简单，更多的是将巴什博弈与其他博弈模型（如 Nim 博弈、SG 函数）结合，形成更复杂的组合博弈问题。

比如多堆石子的巴什博弈 ：有 m 堆石子，第 i 堆有n_i颗石子，两名玩家轮流操作，每次选择一堆石子，取 1~k 颗，取走最后一颗石子的玩家获胜。

这类问题的解题思路是对每堆石子判断巴什博弈的状态，再结合 Nim 博弈的异或规则，最终判断整体的胜负，核心是将巴什博弈的状态转化为 Nim 博弈中的堆值，再进行异或运算。在下期博客中我将为大家介绍Nim博弈的相关内容。

4.3 巴什博弈的解题技巧总结

无论是经典巴什博弈还是其变种，解题的核心技巧都可以总结为以下 3 步：

分析游戏规则，确定玩家的操作空间（每次能取的石子数范围）；

推导必败态的周期 ，找到k+1的取值（即必败态的间隔）；

套用巴什博弈结论，通过取模运算直接判断先手的胜负。

对于变种问题，关键是将非标准规则转化为巴什博弈的标准模型，找到必败态的周期，这需要通过小数值推导或打表找规律实现（比如洛谷的 Roy&October 取石子问题，可通过打表找到 6 和 4 的周期）。

五、巴什博弈的学习意义与后续拓展

巴什博弈作为博弈论的入门模型，虽然简单，但蕴含着博弈论的核心思想 ------必胜态与必败态的推导，掌握巴什博弈的解题思路，能帮助我们建立博弈论的思维方式，为后续学习更复杂的博弈模型打下基础。

从巴什博弈出发，后续可以逐步学习以下博弈论模型：

Nim 博弈：多堆石子的经典公平组合游戏，核心是异或运算，是巴什博弈的多堆拓展；

阶梯型 Nim 博弈：Nim 博弈的变种，将石子分布在阶梯上，核心是只考虑奇数台阶的异或；

SG 函数：博弈论的通用解决方案，将所有公平组合游戏转化为有向图游戏，通过 mex 运算求解 SG 值，再结合异或规则判断胜负；

威佐夫博弈：另一种经典的公平组合游戏，基于两堆石子的取石子规则，核心是黄金分割数。

这些博弈模型都是在巴什博弈的基础上延伸而来，掌握巴什博弈的核心思想后，学习后续模型会事半功倍。

总结

本文从博弈论的基础概念出发，详细讲解了巴什博弈的核心原理、结论推导，并结合三道经典例题讲解了实战用法，同时附上了完整的 C++ 代码实现，还对巴什博弈的反常版本、变种问题和解题技巧进行了总结。

巴什博弈的核心结论非常简单，就是一个取模运算，但推导结论的过程比结论本身更重要，因为这个过程蕴含了博弈论的核心思维 ------ 必胜态与必败态的推导。在算法竞赛中，真正的难点不是套用结论，而是将非标准的游戏规则转化为巴什博弈（或其他博弈模型）的标准模型，这需要大量的练习和思考。

希望本文能帮助你彻底吃透巴什博弈，为你打开博弈论的大门。后续我会继续讲解 Nim 博弈、SG 函数等更复杂的博弈模型，关注我，一起玩转算法竞赛的博弈论！

【算法基础篇】（五十九）巴什博弈 (Bash Game) 超详解：从原理到实战，搞定经典取石子问题

目录

前言

一、博弈论基础铺垫

1.1 公平组合游戏 (ICG)

1.2 必胜态与必败态

1.3 非公平组合游戏与反常游戏

二、巴什博弈 (Bash Game) 核心原理

2.1 巴什博弈的经典问题描述

2.2 核心结论推导

步骤 1：定义基础状态

步骤 2：分析小数值的状态规律

步骤 3：通用结论严格证明

情况 1：n 是 m 的倍数（n = t * m，t 为正整数）

情况 2：n 不是 m 的倍数（n = t * m + r，1 ≤ r ≤ k）

2.3 巴什博弈的核心思想

三、巴什博弈经典例题实战

3.1 例题 1：取石子游戏 1（巴什博弈基础模板题）

题目来源

题目描述

输入描述

输出描述

解题思路

C++ 代码实现

示例测试

3.2 例题 2：Roy&October 之取石子（巴什博弈变种 1）

题目来源

题目描述

输入描述

输出描述

解题思路

C++ 代码实现

示例测试

3.3 例题 3：Roy&October 之取石子 II（巴什博弈变种 2）

题目来源

题目描述

输入描述

输出描述

解题思路

C++ 代码实现

示例测试

四、巴什博弈的延伸与拓展

4.1 巴什博弈的反常版本

4.2 巴什博弈与其他博弈模型的组合

4.3 巴什博弈的解题技巧总结

五、巴什博弈的学习意义与后续拓展

总结