2017第八届蓝桥杯C/C++省赛真题全解析（A/B/C组）

本文还有配套的精品资源，点击获取

简介：2017年第八届蓝桥杯大赛个人赛省赛（软件类C/C++）真题涵盖A、B、C三组，全面考察参赛者的编程基础、算法设计与问题解决能力。比赛内容涉及C/C++语言核心语法、数据结构、经典算法及数学应用，题目难度层次分明，从基础操作到复杂逻辑均有覆盖。资料附带参考答案，便于学习者自我评估与提升。本套真题是备战蓝桥杯及提升算法编程能力的重要实战资源。

1. C/C++语言基础语法与程序设计核心思想

变量定义与数据类型选择的竞赛规范

在蓝桥杯竞赛中，正确选择数据类型是避免溢出与精度丢失的第一步。应熟练掌握 int 、 long long 、 float 、 double 等基本类型的取值范围，优先使用 scanf/printf 进行输入输出以保证效率。例如：

c 复制代码

int a;
long long b;  // 防止大数溢出
scanf("%d %lld", &a, &b);

合理命名变量（如 cnt 表示计数， flag 标记状态）可提升代码可读性，为后续调试和优化奠定基础。

2. 数据结构的设计与实战应用

在算法竞赛和实际软件开发中，数据结构是程序设计的基石。合理选择并高效使用数据结构不仅能提升代码执行效率，还能显著降低问题求解的复杂度。本章深入探讨数组、链表、树形结构以及图结构的基本原理、实现方式及其在真实场景中的应用策略。通过对不同数据结构的内存布局、访问模式、增删改查性能进行系统性分析，构建起"结构选型---操作实现---性能优化"的完整认知链条。尤其在蓝桥杯等限时编程竞赛中，对数据结构的熟练掌握往往决定了能否在有限时间内完成高难度题目的关键突破。

2.1 数组与链表的操作原理与性能对比

数组与链表作为最基础的线性数据结构，在各类算法实现中无处不在。尽管二者都用于存储有序元素集合，但在底层实现机制、内存管理方式及操作性能上存在本质差异。理解这些差异不仅有助于编写更高效的代码，更能帮助开发者根据具体应用场景做出最优选择。

2.1.1 静态数组与动态数组的内存布局与访问优化

静态数组在编译期即确定大小，其内存空间连续分配于栈或全局区，具有极高的随机访问效率。由于CPU缓存预取机制对连续内存有良好支持，遍历静态数组时可获得接近理论极限的访问速度。相比之下，动态数组（如C++中的 std::vector 或手动通过 malloc/new 分配）在堆上申请内存，虽牺牲了部分安全性，但获得了运行时灵活调整容量的能力。

以C语言为例，定义一个长度为 n 的静态数组：

c 复制代码

int arr[1000];

该数组在函数调用时分配于栈空间，地址连续，每个元素间隔固定字节（ sizeof(int) ），因此任意索引 i 的访问时间复杂度为O(1)，计算公式为：

\text{address}[i] = \text{base_addr} + i \times \text{element_size}

而动态数组则需显式申请内存：

c 复制代码

int *dyn_arr = (int *)malloc(n * sizeof(int));
if (!dyn_arr) {
    fprintf(stderr, "Memory allocation failed\n");
    exit(1);
}
// 使用完毕后必须释放
free(dyn_arr);

代码逻辑逐行解读：

第1行：声明一个整型指针，并调用 malloc 从堆中申请 n * sizeof(int) 字节的空间；
第2~4行：检查返回指针是否为空，防止内存分配失败导致后续段错误；
最后一行：使用结束后调用 free 释放内存，避免内存泄漏。

动态数组的优势在于可在需要时扩容。例如模拟 std::vector 的增长策略：

c 复制代码

typedef struct {
    int *data;
    int size;
    int capacity;
} DynamicArray;

void init(DynamicArray *vec, int initial_capacity) {
    vec->data = (int *)malloc(initial_capacity * sizeof(int));
    vec->size = 0;
    vec->capacity = initial_capacity;
}

void push_back(DynamicArray *vec, int value) {
    if (vec->size == vec->capacity) {
        vec->capacity *= 2;
        vec->data = (int *)realloc(vec->data, vec->capacity * sizeof(int));
    }
    vec->data[vec->size++] = value;
}

上述结构体封装了动态数组的核心属性：数据指针、当前大小和最大容量。 push_back 函数在容量不足时自动调用 realloc 扩展空间，通常采用倍增策略（如乘以1.5或2）以摊销扩容成本，使得均摊插入时间为O(1)。

特性	静态数组	动态数组
内存位置	栈/全局区	堆
大小确定时机	编译期	运行期
扩容能力	不可扩容	可通过 `realloc` 扩容
访问速度	极快（连续+缓存友好）	快（同样连续）
安全风险	溢出易引发栈崩溃	管理不当易造成内存泄漏

graph TD A[程序启动] --> B{是否已知数组大小?} B -- 是 --> C[使用静态数组] B -- 否 --> D[创建动态数组] D --> E[初始化容量] E --> F[插入元素] F --> G{是否超出容量?} G -- 是 --> H[realloc扩容] G -- 否 --> I[直接插入] H --> J[复制旧数据到新空间] J --> F

此流程图展示了动态数组插入过程中的典型行为路径。每当插入前检测到容量不足，便触发一次重新分配操作。虽然单次扩容耗时O(n)，但由于扩容频率呈几何级下降，整体插入操作的 摊还时间复杂度仍为O(1) 。

进一步地，为了优化访问局部性，应尽量保证数组按行优先顺序访问（尤其在多维数组中）。例如二维数组 int mat[100][100]; 在内存中按行连续存储，以下写法更高效：

c 复制代码

for (int i = 0; i < 100; ++i)
    for (int j = 0; j < 100; ++j)
        sum += mat[i][j];  // 行主序，缓存命中率高

若改为列主序访问，则可能导致大量缓存未命中，显著降低性能。

综上所述，静态数组适用于大小已知且不变的场景，具备最高访问效率；动态数组适合大小不确定或需频繁扩展的情况，通过合理的扩容策略可在灵活性与性能之间取得平衡。

2.1.2 单向链表、双向链表的构建与常见操作实现

链表是一种非连续存储的线性结构，由节点串联而成，每个节点包含数据域与指向下一个节点的指针。与数组不同，链表不要求内存连续，因而插入删除操作无需移动大量元素，仅需修改指针即可完成。

单向链表实现

定义单向链表节点结构：

c 复制代码

typedef struct ListNode {
    int val;
    struct ListNode *next;
} ListNode;

ListNode* create_node(int value) {
    ListNode *node = (ListNode *)malloc(sizeof(ListNode));
    node->val = value;
    node->next = NULL;
    return node;
}

插入操作分为头插法与尾插法。头插法简单高效：

c 复制代码

void insert_front(ListNode **head, int value) {
    ListNode *new_node = create_node(value);
    new_node->next = *head;
    *head = new_node;
}

参数说明： head 为二级指针，因需修改头节点本身。时间复杂度O(1)。

尾插法则需遍历至末尾：

c 复制代码

void append(ListNode **head, int value) {
    ListNode *new_node = create_node(value);
    if (*head == NULL) {
        *head = new_node;
        return;
    }
    ListNode *cur = *head;
    while (cur->next != NULL)
        cur = cur->next;
    cur->next = new_node;
}

删除指定值节点：

c 复制代码

void delete_value(ListNode **head, int target) {
    if (*head == NULL) return;
    if ((*head)->val == target) {
        ListNode *temp = *head;
        *head = (*head)->next;
        free(temp);
        return;
    }

    ListNode *cur = *head;
    while (cur->next && cur->next->val != target)
        cur = cur->next;

    if (cur->next) {
        ListNode *to_delete = cur->next;
        cur->next = to_delete->next;
        free(to_delete);
    }
}

该实现处理了删除头节点的特殊情况，并通过前置指针安全删除目标节点。

双向链表增强灵活性

双向链表每个节点额外维护一个前驱指针，便于反向遍历与删除操作：

c 复制代码

typedef struct DoublyNode {
    int val;
    struct DoublyNode *prev;
    struct DoublyNode *next;
} DoublyNode;

删除操作无需查找前驱节点：

c 复制代码

void delete_node(DoublyNode *node) {
    if (node->prev)
        node->prev->next = node->next;
    else
        head = node->next;  // 更新头指针

    if (node->next)
        node->next->prev = node->prev;

    free(node);
}

双向链表特别适用于需要频繁前后移动的场景，如浏览器历史记录、文本编辑器光标操作等。

操作	单向链表	双向链表
插入头部	O(1)	O(1)
删除给定节点	O(n)	O(1)*
反向遍历	不支持	支持
空间开销	小	较大

*前提：已持有待删除节点的指针

graph LR A[头节点] --> B[节点1] B --> C[节点2] C --> D[尾节点] style A fill:#f9f,stroke:#333 style D fill:#bbf,stroke:#333

单向链示意图，箭头表示 next 指针方向。

双向链表可通过前后指针形成闭环结构，甚至构建循环链表，适应更多复杂需求。

2.1.3 在实际题目中选择合适结构的决策依据

面对具体问题时，如何抉择使用数组还是链表？核心考量因素包括：

访问模式 ：若频繁随机访问（如 arr[i] ），首选数组；若主要顺序遍历或中间插入/删除，链表更具优势。
内存约束 ：数组需预估最大规模，可能浪费空间；链表动态分配，空间利用率更高。
缓存性能 ：数组连续存储利于缓存预取，大规模数据下性能远超链表。
实现复杂度 ：数组操作简单，边界易控；链表涉及指针操作，易出错（空指针、野指针）。

例如，在"LRU缓存"问题中，结合哈希表与双向链表可实现O(1)的查询与更新操作：哈希表提供快速定位，双向链表维护访问顺序。而在"滑动窗口最大值"问题中，单调队列基于双端队列（可用数组模拟）实现，充分发挥数组缓存友好的特性。

实践中建议优先考虑标准库容器（如C++的 vector 、 list ），除非有特殊性能要求或竞赛限制。对于蓝桥杯选手而言，熟练手写链表仍是必备技能，因其常出现在指针操作类真题中。

总之，数组与链表各有优劣，唯有深入理解其底层机制，才能在千变万化的算法问题中作出精准的技术选型。

3. 经典算法的设计范式与高效实现

在算法竞赛和实际工程开发中，经典算法不仅是解决问题的基础工具，更是衡量程序员逻辑思维能力与代码实现水平的重要标尺。本章深入剖析排序、查找与字符串处理三大核心领域的经典算法设计思想，揭示其底层运行机制，并通过可执行的代码示例、复杂度分析与性能优化策略，帮助读者构建"从理论到实践"的完整认知链条。这些算法不仅频繁出现在蓝桥杯等编程竞赛中，也在数据库索引、编译器优化、文本编辑器搜索等功能模块中发挥关键作用。掌握它们的本质原理，有助于在面对新问题时快速识别适用模型并进行有效改造。

3.1 排序算法的底层逻辑与适用场景剖析

排序是几乎所有数据处理流程中的前置步骤，无论是为了加速后续查找操作，还是为动态规划提供有序状态空间，高效的排序实现都至关重要。不同排序算法基于不同的设计范式------如分治法、堆结构维护、归并合并等------展现出各异的时间与空间特性。理解每种算法的触发条件、最坏/平均情况行为及其对缓存局部性的利用程度，是在真实应用场景中做出合理选择的前提。

3.1.1 快速排序的分治思想与随机化优化

快速排序（QuickSort）是一种典型的分治算法，其基本思想是选取一个基准元素（pivot），将数组划分为两部分：小于等于 pivot 的元素放在左侧，大于 pivot 的元素置于右侧，然后递归地对左右子区间进行同样操作。该过程不断缩小问题规模，直至子数组长度为0或1时自然有序。

其核心优势在于原地排序（in-place sorting）和良好的平均时间复杂度 $O(n \\log n)$ ，但由于依赖于 pivot 的选择质量，最坏情况下可能退化至 $O(n\^2)$ ，例如当输入已完全有序且每次选首元素作 pivot 时。

为缓解这一问题，引入 随机化快速排序 成为标准做法：每次从当前区间随机选取 pivot 元素并与首元素交换后再执行划分。这种策略显著降低了遭遇最坏情况的概率，使得期望时间复杂度稳定在 $O(n \\log n)$ 。

以下是一个完整的 C++ 实现：

cpp 复制代码

#include <iostream>
#include <vector>
#include <cstdlib>
#include <ctime>

using namespace std;

// 划分函数：返回 pivot 最终位置
int partition(vector<int>& arr, int low, int high) {
    int pivot = arr[high]; // 默认取最后一个元素作为基准
    int i = low - 1;       // 小于 pivot 区域的边界指针

    for (int j = low; j < high; ++j) {
        if (arr[j] <= pivot) {
            swap(arr[++i], arr[j]);
        }
    }
    swap(arr[i + 1], arr[high]); // 将 pivot 放入正确位置
    return i + 1;
}

// 随机化版本：随机选择 pivot 并交换到末尾
int randomPartition(vector<int>& arr, int low, int high) {
    srand(time(nullptr));
    int randomIndex = low + rand() % (high - low + 1);
    swap(arr[randomIndex], arr[high]); // 把随机选中的元素移到末尾
    return partition(arr, low, high);
}

// 快速排序主函数
void quickSort(vector<int>& arr, int low, int high) {
    if (low < high) {
        int pi = randomPartition(arr, low, high); // 获取划分点
        quickSort(arr, low, pi - 1);              // 排左半部分
        quickSort(arr, pi + 1, high);             // 排右半部分
    }
}

代码逻辑逐行解析

partition 函数使用经典的 Lomuto 划分方式：
初始化 i = low - 1 表示已处理中小于等于 pivot 的最后一个位置；
遍历 j 从 low 到 high-1 ，若 arr[j] <= pivot ，则扩展小值区并将 arr[j] 移入其中；
最后将 pivot （位于 high ）与 i+1 处元素交换，确保其处于正确排序位置。
randomPartition 引入随机性：通过 rand() % (range) 在 [low, high] 内均匀采样索引，避免人为构造的极端数据导致性能崩溃。
quickSort 是递归主体，仅在 low < high 时继续分割，防止无限递归。

特性	描述
时间复杂度（平均）	$O(n \\log n)$
时间复杂度（最坏）	$O(n\^2)$
空间复杂度	$O(\\log n)$ （递归栈深度）
是否稳定	否（相同元素相对顺序可能改变）
是否原地	是

graph TD A[开始 quickSort(low, high)] --> B{low < high?} B -- 否 --> C[结束] B -- 是 --> D[调用 randomPartition] D --> E[得到划分点 pi] E --> F[递归排序 left: low ~ pi-1] E --> G[递归排序 right: pi+1 ~ high] F --> H[子任务完成] G --> H H --> C

该流程图清晰展示了快速排序的递归控制流与划分决策路径。值得注意的是，虽然递归带来了简洁性，但在栈深度受限的环境中（如嵌入式系统），可采用显式栈模拟递归来规避栈溢出风险。

此外，在现代C++标准库中， std::sort() 实际采用的是 Introsort ------一种结合了快速排序、堆排序与插入排序的混合算法。它初始使用快排，一旦递归深度超过某阈值（通常为 $2\\log n$ ），自动切换为堆排序以保证最坏情况下的 $O(n \\log n)$ 性能，体现了工程实践中对理论算法的实用化改进。

3.1.2 归并排序的稳定性保障与外部排序扩展

归并排序（Merge Sort）基于"分而治之"策略，先将数组递归拆分为单个元素，再两两合并成有序序列，最终形成整体有序结果。其最大特点是 稳定性强 ，即相等元素的原始顺序不会被打乱，这在需要保持记录先后关系的应用（如多关键字排序）中极为重要。

归并排序的标准实现需额外 $O(n)$ 的辅助空间用于合并操作，但换来的是无论输入如何都能保证 $O(n \\log n)$ 的时间复杂度，适用于对时间确定性要求高的场景。

以下是 C++ 中自底向上（迭代式）归并排序的实现：

cpp 复制代码

void merge(vector<int>& arr, vector<int>& temp, int left, int mid, int right) {
    int i = left, j = mid + 1, k = left;

    while (i <= mid && j <= right) {
        if (arr[i] <= arr[j]) {
            temp[k++] = arr[i++];
        } else {
            temp[k++] = arr[j++];
        }
    }

    while (i <= mid) temp[k++] = arr[i++];
    while (j <= right) temp[k++] = arr[j++];

    for (int idx = left; idx <= right; ++idx) {
        arr[idx] = temp[idx];
    }
}

void mergeSort(vector<int>& arr) {
    int n = arr.size();
    vector<int> temp(n); // 辅助数组

    for (int width = 1; width < n; width *= 2) { // 子数组宽度：1, 2, 4...
        for (int i = 0; i < n; i += 2 * width) {
            int left = i;
            int mid = min(i + width - 1, n - 1);
            int right = min(i + 2 * width - 1, n - 1);

            if (mid < right) { // 至少有两个子数组需要合并
                merge(arr, temp, left, mid, right);
            }
        }
    }
}

参数说明与逻辑分析

width 控制当前合并的子数组长度，逐步翻倍逼近总长；
left , mid , right 定义待合并的两个区间： [left, mid] 和 [mid+1, right] ；
使用临时数组 temp 存储合并结果，最后拷贝回原数组；
min(..., n-1) 防止越界，适应非2的幂长度输入。

对比维度	快速排序	归并排序
平均时间复杂度	$O(n \\log n)$	$O(n \\log n)$
最坏时间复杂度	$O(n\^2)$	$O(n \\log n)$
空间复杂度	$O(\\log n)$	$O(n)$
稳定性	不稳定	稳定
原地性	是	否

归并排序还有一个重要延伸应用： 外部排序 。当数据量超出内存容量时，可将其分割为多个可在内存中排序的小文件，分别排序后写入磁盘，再通过多路归并的方式逐批读取最小元素输出到最终结果文件。此方法广泛应用于数据库管理系统中的大规模排序任务。

graph LR subgraph 外部排序流程 A[大文件切分为块] --> B[每块加载进内存排序] B --> C[写回有序小文件] C --> D[多路归并读取各文件头部] D --> E[构造最小堆获取全局最小] E --> F[写入输出文件并推进对应指针] F --> D end

上述流程图描绘了外部排序的核心阶段，其中多路归并常借助 败者树 或 优先队列 实现高效最小元提取。

3.1.3 堆排序的优先队列构建与时间复杂度证明

堆排序（Heap Sort）利用二叉堆（通常是最大堆）的性质来逐次选出最大元素并放置于数组末尾。整个过程分为两个阶段：建堆（Build Heap）与排序（Extract Max）。由于堆是一棵完全二叉树，可用数组紧凑表示，无需额外指针开销。

最大堆满足：任意节点值不小于其子节点值。建堆采用自底向上的下沉调整（heapify），时间复杂度仅为 $O(n)$ ，优于逐个插入的 $O(n \\log n)$ 方法。

cpp 复制代码

void heapify(vector<int>& arr, int n, int i) {
    int largest = i;
    int left = 2 * i + 1;
    int right = 2 * i + 2;

    if (left < n && arr[left] > arr[largest])
        largest = left;
    if (right < n && arr[right] > arr[largest])
        largest = right;

    if (largest != i) {
        swap(arr[i], arr[largest]);
        heapify(arr, n, largest); // 继续向下调整
    }
}

void heapSort(vector<int>& arr) {
    int n = arr.size();

    // 构建最大堆：从最后一个非叶子节点开始向上调整
    for (int i = n / 2 - 1; i >= 0; --i)
        heapify(arr, n, i);

    // 逐个提取堆顶元素放到末尾
    for (int i = n - 1; i > 0; --i) {
        swap(arr[0], arr[i]);
        heapify(arr, i, 0); // 堆大小减一，重新调整根节点
    }
}

代码解释与数学证明

heapify 函数比较父节点与其左右子节点，若发现更大子节点，则交换并递归下沉；
建堆循环起始于 n/2 - 1 ，因为这是最后一个拥有孩子的内部节点（基于数组下标从0开始）；
每次 swap(arr[0], arr[i]) 相当于将当前最大值移至排序位置，随后对剩余 i 个元素调用 heapify 维护堆序。

时间复杂度证明 ：

建堆阶段 ：虽然每个节点的调整耗时 $O(h)$ ，但高度为 $h$ 的节点数量约为 $n / 2\^{h+1}$ ，因此总时间为：

T = \sum_{h=0}^{\log n} \frac{n}{2^{h+1}} \cdot O(h) = O(n)

排序阶段 ：共 $n-1$ 次提取，每次调整耗时 $O(\\log n)$ ，合计 $O(n \\log n)$

故整体时间复杂度为 $O(n \\log n)$ ，且空间复杂度为 $O(1)$ （仅递归栈 $O(\\log n)$ ）

堆排序虽不具备稳定性，但其确定性表现和低空间占用使其适合实时系统或资源受限环境。同时，其所依赖的堆结构本身即可作为 优先队列 直接服务于 Dijkstra、Huffman 编码等高级算法。

算法	优点	缺点	典型用途
快速排序	平均快、原地	最坏慢、不稳定	通用排序（std::sort）
归并排序	稳定、时间确定	占用额外空间	外部排序、链表排序
堆排序	时间确定、空间省	不稳定、缓存不友好	实时系统、优先队列基础

综上所述，三种排序算法各有千秋。在竞赛编程中，推荐优先使用 std::sort ，但在特定约束下（如必须稳定、内存极小），应能根据题目需求自主实现最优方案。

4. 高级编程技术与资源管理策略

在算法竞赛和实际系统开发中，掌握基础语法与数据结构只是迈向高效程序设计的第一步。随着问题复杂度的提升，对内存、编译过程、输入输出等底层机制的精细控制成为决定程序性能与稳定性的关键因素。尤其是在蓝桥杯这类时间敏感型竞赛环境中，不合理的资源使用可能导致超时、运行错误甚至程序崩溃。因此，深入理解动态内存管理、预处理指令优化以及文件I/O操作的底层逻辑，是每位高水平选手必须具备的核心能力。

本章将聚焦于三大关键技术领域： 动态内存管理的风险控制与最佳实践 、 预处理指令在竞赛编码中的灵活运用 ，以及 文件I/O与流操作的高效读写方案 。通过结合C/C++语言特性与典型应用场景，系统剖析这些高级编程技术如何影响程序效率与可维护性，并提供具体实现方法与调试技巧，帮助开发者构建既快速又安全的代码体系。

4.1 动态内存管理的风险控制与最佳实践

动态内存管理是C/C++语言区别于许多现代高级语言的重要特征之一。它赋予程序员直接操控堆区内存的能力，从而实现灵活的数据结构构造（如链表、树、图等）和运行时大小可变的对象分配。然而，这种自由也带来了显著风险------若管理不当，极易引发内存泄漏、野指针、重复释放等问题，严重时会导致程序崩溃或不可预测行为。因此，在算法竞赛和工程实践中，掌握 malloc 、 calloc 、 realloc 的正确使用方式，并遵循资源释放的对称性原则，是确保程序健壮性的核心前提。

4.1.1 malloc、calloc、realloc的区别与使用时机

在C语言中，标准库 <stdlib.h> 提供了三种主要的动态内存分配函数： malloc 、 calloc 和 realloc 。它们虽都用于从堆上申请内存空间，但在初始化状态、参数形式和用途上有明显差异。

函数	原型	初始化	使用场景
`malloc`	`void* malloc(size_t size)`	不初始化，内容为随机值	快速分配已知大小的内存块
`calloc`	`void* calloc(size_t num, size_t size)`	全部初始化为0	需要清零的数组或结构体分配
`realloc`	`void* realloc(void* ptr, size_t new_size)`	保留原数据（若成功）	扩展或缩小已有内存块

示例代码对比：

c 复制代码

#include <stdio.h>
#include <stdlib.h>

int main() {
    // 使用 malloc 分配 5 个整数的空间
    int *arr1 = (int*)malloc(5 * sizeof(int));
    if (!arr1) {
        fprintf(stderr, "malloc failed\n");
        return -1;
    }
    printf("malloc: ");
    for (int i = 0; i < 5; ++i)
        printf("%d ", arr1[i]);  // 输出可能是垃圾值
    printf("\n");

    // 使用 calloc 分配并初始化为0
    int *arr2 = (int*)calloc(5, sizeof(int));
    if (!arr2) {
        fprintf(stderr, "calloc failed\n");
        free(arr1);
        return -1;
    }
    printf("calloc: ");
    for (int i = 0; i < 5; ++i)
        printf("%d ", arr2[i]);  // 输出全为0
    printf("\n");

    // 使用 realloc 扩展到10个元素
    int *arr3 = (int*)realloc(arr2, 10 * sizeof(int));
    if (!arr3) {
        fprintf(stderr, "realloc failed\n");
        free(arr1); free(arr2);
        return -1;
    }
    // 注意：realloc 可能移动内存地址，应使用返回值
    arr2 = arr3;

    printf("after realloc: ");
    for (int i = 0; i < 10; ++i) {
        if (i < 5) printf("%d ", arr2[i]);  // 前5个保持原值（0）
        else printf("_ ");  // 后5个未定义
    }
    printf("\n");

    free(arr1); free(arr2);
    return 0;
}

逐行逻辑分析与参数说明：

第7行： malloc(5 * sizeof(int)) 请求连续的20字节（假设 int=4 ），但不进行初始化，访问其内容前需手动赋值。

第13行： calloc(5, sizeof(int)) 等价于 malloc + memset(0) ，适合需要"干净"初始状态的场景，如计数器数组。

第28行： realloc(arr2, 10*sizeof(int)) 尝试扩展原内存块。若无法原地扩展，则系统会分配新空间、拷贝旧数据、释放旧块，并返回新地址。因此 必须接收返回值 ，否则可能造成内存泄漏或访问失效指针。

第36--39行： free() 调用顺序无关，但每个 malloc/calloc/realloc 返回的指针只能被 free 一次，且不能对栈变量或空指针多次释放。

决策流程图（Mermaid）：

graph TD A[需要动态分配内存?] --> B{是否需要初始化为0?} B -->|是| C[calloc(num, size)] B -->|否| D{是否已有指针需调整大小?} D -->|是| E[realloc(ptr, new_size)] D -->|否| F[malloc(size)] C --> G[使用内存] E --> G F --> G G --> H[使用完毕后调用free()]

该流程图为竞赛选手提供了清晰的选择路径：优先判断是否需要清零；再判断是否属于扩容需求；最后选择对应函数。避免滥用 malloc + memset 组合，提高代码效率。

4.1.2 内存泄漏检测与free调用的对称性原则

内存泄漏是指程序在堆上分配了内存却未能及时释放，导致可用内存逐渐耗尽的现象。虽然单次小规模泄漏在短生命周期程序中影响不大，但在递归深、循环频繁或长期运行的应用中，累积效应可能引发致命后果。

对称性释放原则

每调用一次 malloc / calloc / realloc 成功获得非空指针后，必须保证有且仅有一次对应的 free() 调用，且仅作用于该指针本身（非副本或偏移地址）。此即"分配-释放"的对称性原则。

c 复制代码

typedef struct Node {
    int data;
    struct Node* next;
} Node;

Node* create_list(int n) {
    Node* head = NULL;
    for (int i = 0; i < n; ++i) {
        Node* node = (Node*)malloc(sizeof(Node));  // 每次分配一个节点
        if (!node) exit(1);
        node->data = i;
        node->next = head;
        head = node;
    }
    return head;
}

void destroy_list(Node* head) {
    while (head) {
        Node* temp = head;
        head = head->next;
        free(temp);  // 对每个节点执行一次free，严格匹配malloc次数
    }
}

逻辑分析：

create_list 中每次循环调用 malloc 创建一个新节点，共 n 次。

destroy_list 使用临时指针遍历链表，逐个释放节点，确保没有遗漏也没有重复。

若忘记释放某个节点，即构成内存泄漏；若误对 head->next 直接调用 free ，则破坏链式结构，可能导致后续访问非法地址。

内存泄漏检测方法（竞赛实用技巧）

尽管竞赛环境通常不允许引入第三方工具（如 Valgrind），但仍可通过以下方式模拟检测：

计数法 ：全局设置两个静态变量 alloc_count 和 free_count ，分别在封装的 safe_malloc 和 safe_free 中增减，最终检查两者是否相等。

c 复制代码

static int alloc_count = 0, free_count = 0;

void* safe_malloc(size_t size) {
    void* ptr = malloc(size);
    if (ptr) alloc_count++;
    return ptr;
}

void safe_free(void** ptr) {
    if (*ptr) {
        free(*ptr);
        (*ptr) = NULL;  // 防止悬空指针
        free_count++;
    }
}

断言验证 ：在程序末尾添加 assert(alloc_count == free_count); ，便于本地测试时发现问题。

4.1.3 在递归与链表操作中合理释放资源的方法

递归结构天然具有"深度优先"特性，常伴随大量临时内存分配。若处理不慎，极易出现资源未释放的情况。特别是在回溯算法、二叉树遍历、表达式求值等场景中，动态节点的创建与销毁必须精准匹配。

案例：递归构建并释放二叉树

c 复制代码

typedef struct TreeNode {
    int val;
    struct TreeNode *left, *right;
} TreeNode;

TreeNode* build_tree(int depth) {
    if (depth <= 0) return NULL;
    TreeNode* node = (TreeNode*)safe_malloc(sizeof(TreeNode));
    node->val = depth;
    node->left = build_tree(depth - 1);
    node->right = build_tree(depth - 1);
    return node;
}

void free_tree(TreeNode* root) {
    if (!root) return;
    free_tree(root->left);   // 先递归释放左子树
    free_tree(root->right);  // 再递归释放右子树
    safe_free((void**)&root); // 最后释放当前节点
}

执行逻辑说明：

build_tree 采用分治思想，递归构造满二叉树，每层调用 safe_malloc 一次。

free_tree 必须采用后序遍历方式释放：只有当左右子树全部释放后，才能安全释放父节点。若提前释放父节点，则失去访问子树的入口，造成内存泄漏。

使用 (void**)&root 强转是为了让 safe_free 能将 root 置为 NULL ，防止外部继续访问已释放内存。

表格：常见链表操作中的资源管理陷阱与对策

操作类型	易错点	正确做法
删除头节点	直接 `free(head)` 导致链表断裂	保存 `next = head->next` ，再 `free(head)` ，然后更新 `head = next`
插入新节点	忘记释放失败时的中间分配	使用局部指针暂存，失败立即释放
反转链表	修改指针顺序错误导致丢失后续节点	使用三指针法（prev, curr, next）逐步推进
复制链表	浅拷贝导致共享内存	深拷贝：逐个 `malloc` 新节点并复制数据

综上所述，动态内存管理不仅是语法层面的操作，更是一种程序设计哲学。唯有坚持"谁分配、谁释放"、"先释放子结构、再释放父结构"、"释放后置空"三大原则，方能在复杂逻辑中保持资源使用的严谨性与安全性。

5. 算法思维的进阶训练与模型构建

在算法竞赛中，随着问题复杂度的提升，仅依靠基础的数据结构和简单算法已难以应对高难度题型。此时，选手必须具备将现实问题抽象为数学模型的能力，并通过系统化的思维方式设计出高效、可扩展的解决方案。本章聚焦于三种核心高级算法范式------动态规划、贪心策略与图论模型，深入剖析其内在逻辑、构造方法及优化路径。这些算法不仅是蓝桥杯等竞赛中的高频考点，更是工业级系统设计中常用的思想原型。通过对状态空间建模、局部最优决策分析以及网络流结构的理解，可以显著提升对复杂问题的拆解能力。

5.1 动态规划的状态定义与转移方程构造

动态规划（Dynamic Programming, DP）是一种通过将原问题分解为相互重叠的子问题并存储中间结果以避免重复计算的优化技术。它广泛应用于最优化问题求解，如路径规划、资源分配、字符串匹配等场景。掌握DP的关键在于正确地定义"状态"和构建"状态转移方程"，这两者共同决定了算法的可行性与效率。

5.1.1 背包问题系列的状态压缩与空间优化

背包问题是动态规划中最经典的入门模型之一，主要包括0-1背包、完全背包和多重背包等形式。以0-1背包为例，给定 $n$ 个物品，每个物品有重量 $w_i$ 和价值 $v_i$ ，在总承重不超过 $W$ 的前提下，选择若干物品使得总价值最大。

传统二维DP解法的状态定义为：

dp[i][j] = \text{前 } i \text{ 个物品在容量 } j \text{ 下能获得的最大价值}

其状态转移方程为：

dp[i][j] =

\begin{cases}

dp[i-1][j], & j < w_i \

\max(dp[i-1][j], dp[i-1][j - w_i] + v_i), & j \geq w_i

\end{cases}

然而，当数据规模较大时（例如 $W \\leq 10\^4$ ），使用二维数组可能导致内存超限或缓存性能下降。为此，可采用 一维滚动数组 进行空间优化。

c++ 复制代码

#include <iostream>
#include <vector>
using namespace std;

int knapsack(int n, int W, vector<int>& w, vector<int>& v) {
    vector<int> dp(W + 1, 0); // 一维DP数组，初始化为0

    for (int i = 0; i < n; ++i) {
        for (int j = W; j >= w[i]; --j) { // 倒序遍历防止覆盖
            dp[j] = max(dp[j], dp[j - w[i]] + v[i]);
        }
    }
    return dp[W];
}

代码逻辑逐行解读：

vector<int> dp(W + 1, 0); ：创建长度为 $W+1$ 的一维数组，用于表示当前容量下的最大价值。
外层循环 for (int i = 0; i < n; ++i) 遍历每一个物品。
内层循环 for (int j = W; j >= w[i]; --j) 从大到小更新容量，确保每次使用的 dp[j - w[i]] 是上一轮的状态（未被当前物品更新过）。
dp[j] = max(...) 实现状态转移：要么不选第 $i$ 件物品，保持原值；要么选择该物品，加上其价值。

这种倒序遍历是空间优化的核心技巧，若正序则会导致同一物品被多次选取，退化为完全背包。

优化方式	时间复杂度	空间复杂度	适用场景
二维DP	$O(nW)$	$O(nW)$	小规模数据，需回溯方案
一维滚动数组	$O(nW)$	$O(W)$	大容量背包，仅需最大价值

graph TD A[开始] --> B[输入n, W, 物品重量w[], 价值v[]] B --> C[初始化dp[0..W]=0] C --> D[遍历每个物品i] D --> E[从W downto w[i]] E --> F[更新dp[j] = max(dp[j], dp[j-w[i]] + v[i])] F --> G{是否完成所有物品?} G -- 否 --> D G -- 是 --> H[输出dp[W]] H --> I[结束]

该流程图清晰展示了滚动数组实现的控制流结构，突出了内层逆序循环的重要性。此外，在某些特殊限制下（如物品数量有限制），还可进一步结合二进制拆分或单调队列优化实现多重背包的高效求解。

5.1.2 区间DP在字符串合并与矩阵链乘中的应用

区间动态规划适用于处理具有"合并"性质的问题，典型代表包括石子合并、矩阵链乘法和回文串分割等。其基本思想是：枚举区间的起点和长度，逐步合并小区间得到更大区间的最优解。

以 矩阵链乘法 为例，设有 $n$ 个矩阵 $A_1, A_2, ..., A_n$ ，其中 $A_i$ 的维度为 $p_{i-1} \\times p_i$ 。目标是最小化标量乘法次数。

定义状态：

dp[i][j] = \text{计算 } A_i...A_j \text{ 所需的最少乘法次数}

状态转移方程为：

dp[i][j] = \min_{i \leq k < j} \left( dp[i][k] + dp[k+1][j] + p_{i-1} \cdot p_k \cdot p_j \right)

初始条件： $dp\[i\]\[i\] = 0$

c++ 复制代码

#include <iostream>
#include <vector>
#include <climits>
using namespace std;

int matrixChainMultiplication(vector<int>& p) {
    int n = p.size() - 1; // n个矩阵
    vector<vector<int>> dp(n+1, vector<int>(n+1, 0));

    for (int len = 2; len <= n; ++len) {           // 枚举区间长度
        for (int i = 1; i <= n - len + 1; ++i) {   // 枚举左端点
            int j = i + len - 1;
            dp[i][j] = INT_MAX;
            for (int k = i; k < j; ++k) {
                int cost = dp[i][k] + dp[k+1][j] + p[i-1]*p[k]*p[j];
                dp[i][j] = min(dp[i][j], cost);
            }
        }
    }
    return dp[1][n];
}

参数说明与逻辑分析：

p 数组存储维度信息， $p\[i-1\] \\times p\[i\]$ 表示第 $i$ 个矩阵的大小。
外层循环 len 控制合并区间的长度，从小到大推进。
中间循环 i 确定起始位置， j 自动确定右边界。
内层 k 枚举断点，尝试所有可能的分割方式。
cost 计算左右两部分代价加本次乘法开销。

该算法时间复杂度为 $O(n\^3)$ ，空间复杂度 $O(n\^2)$ 。虽然无法进一步降低时间复杂度，但在特定条件下（如凸多边形三角剖分）可通过Knuth优化降至 $O(n\^2)$ 。

应用场景	状态含义	转移方式
矩阵链乘	最少乘法次数	分割点枚举
回文串分割	最小切割次数使均为回文	判断子串是否回文后转移
石子合并	合并区间石子的最小/最大代价	左右合并代价 + 当前合并值

此表归纳了常见区间DP问题的建模模式，有助于快速识别题目类型并套用模板。

5.1.3 数位DP处理数字统计类问题的通用框架

数位DP用于解决与"数字各位上的性质"相关的问题，例如统计 $\[L, R\]$ 范围内满足某种条件的整数个数（如不含某数字、各位和为某值等）。其核心在于将数字按位拆解，利用记忆化搜索进行状态压缩。

考虑经典问题：求 $1$ 到 $N$ 中不包含连续两个1的二进制数的个数。

我们定义状态：

dp[pos][prev][tight]

其中：

pos ：当前处理的位置（从高位到低位）
prev ：上一位是否为1
tight ：是否受到原数上限的约束

c++ 复制代码

#include <iostream>
#include <vector>
#include <cstring>
using namespace std;

vector<int> digits;
long long dp[20][2][2];

long long dfs(int pos, int prev, bool tight) {
    if (pos == digits.size()) return 1;
    if (dp[pos][prev][tight] != -1) return dp[pos][prev][tight];

    int limit = tight ? digits[pos] : 1;
    long long res = 0;

    for (int d = 0; d <= limit; ++d) {
        if (prev == 1 && d == 1) continue; // 连续两个1非法
        res += dfs(pos + 1, d, tight && (d == limit));
    }

    return dp[pos][prev][tight] = res;
}

long long solve(long long n) {
    digits.clear();
    while (n) {
        digits.push_back(n % 2);
        n /= 2;
    }
    reverse(digits.begin(), digits.end());
    memset(dp, -1, sizeof(dp));
    return dfs(0, 0, true);
}

代码解析：

digits 存储 $N$ 的二进制表示，便于逐位处理。
dfs 函数实现记忆化搜索：
pos == digits.size() 表示已处理完所有位，返回1（合法方案）。
limit 决定当前位可取的最大值：若受限制则不能超过原数对应位。
循环枚举当前位取值 d ，跳过 prev==1 && d==1 的情况。
新的 tight 条件为：原受限制且当前取到了上限值。
solve 函数负责预处理并启动搜索。

该方法可推广至十进制数位DP，只需调整进制和判断逻辑即可。例如统计"不含数字4或62"的十进制数个数。

stateDiagram-v2 [*] --> Start Start --> ExtractDigits : 分解N的每一位 ExtractDigits --> InitDP : 初始化dp数组为-1 InitDP --> DFS DFS --> CheckBaseCase : pos == length? CheckBaseCase --> CountOne : 是 → 返回1 CheckBaseCase --> EnumerateDigit : 否 → 枚举当前位 EnumerateDigit --> CheckConstraint : 是否违反规则? CheckConstraint --> Skip : 是 → 跳过 CheckConstraint --> Recurse : 否 → 继续递归 Recurse --> UpdateDP UpdateDP --> ReturnResult ReturnResult --> [*]

该状态图展示了数位DP的整体执行流程，强调了边界判断、约束传播与记忆化机制的协同作用。熟练掌握此类结构后，可应对绝大多数数位统计类问题。

5.2 贪心策略的正确性证明与反例分析

贪心算法在每一步选择中都采取当前状态下最优的选择，期望最终结果全局最优。其优势在于实现简单、运行高效，但关键难点在于 如何证明贪心选择的正确性 。一旦贪心策略错误，往往只能得到近似解甚至错误答案。

5.2.1 活动选择问题与最优子结构性质验证

活动选择问题是贪心算法的经典案例：给定 $n$ 个活动，每个活动有开始时间 $s_i$ 和结束时间 $f_i$ ，选出最多互不冲突的活动集合。

贪心策略：按结束时间升序排序，依次选择最早结束且与已选活动不冲突的活动。

c++ 复制代码

#include <iostream>
#include <vector>
#include <algorithm>
using namespace std;

struct Activity {
    int start, finish;
    bool operator<(const Activity& a) const {
        return finish < a.finish;
    }
};

int activitySelection(vector<Activity>& acts) {
    sort(acts.begin(), acts.end()); // 按结束时间排序

    int count = 1;
    int lastFinish = acts[0].finish;

    for (int i = 1; i < acts.size(); ++i) {
        if (acts[i].start >= lastFinish) {
            ++count;
            lastFinish = acts[i].finish;
        }
    }
    return count;
}

逻辑分析：

operator< 定义自定义排序规则，确保按结束时间优先。
lastFinish 记录最后一个被选活动的结束时间。
遍历过程中，只要当前活动开始时间不早于上次结束时间，即可安全加入。

该策略的正确性基于以下两个性质：

贪心选择性质 ：存在一个最优解包含最早结束的活动。
最优子结构 ：剩余问题仍是一个更小的活动选择问题。

数学归纳法可严格证明其最优性。假设前 $k$ 步选择正确，则第 $k+1$ 步仍遵循相同原则，整体最优成立。

方法	时间复杂度	是否最优	适用范围
贪心（按结束时间）	$O(n \\log n)$	是	不相交区间最大覆盖
动态规划	$O(n\^2)$	是	加权活动选择

对比可见，贪心在无权重情况下更具优势。

5.2.2 Huffman编码中的贪心构造过程详解

Huffman编码是一种用于数据压缩的前缀编码技术，其核心是构建一棵带权路径长度最短的二叉树。权重通常为字符出现频率。

构造步骤如下：

将每个字符视为一个节点，权重为其频率。
构建最小堆，每次取出两个最小权重节点。
创建新节点，权重为两者之和，作为它们的父节点。
将新节点插入堆中。
重复直到只剩一个节点（即根节点）。

c++ 复制代码

#include <iostream>
#include <queue>
#include <vector>
using namespace std;

struct Node {
    char ch;
    int freq;
    Node *left, *right;
    Node(char c, int f) : ch(c), freq(f), left(nullptr), right(nullptr) {}
};

struct Compare {
    bool operator()(Node* a, Node* b) {
        return a->freq > b->freq; // 最小堆
    }
};

Node* buildHuffmanTree(vector<char>& chars, vector<int>& freq) {
    priority_queue<Node*, vector<Node*>, Compare> pq;

    for (int i = 0; i < chars.size(); ++i)
        pq.push(new Node(chars[i], freq[i]));

    while (pq.size() > 1) {
        Node* left = pq.top(); pq.pop();
        Node* right = pq.top(); pq.pop();

        Node* merged = new Node('$', left->freq + right->freq);
        merged->left = left;
        merged->right = right;

        pq.push(merged);
    }

    return pq.top();
}

参数说明：

priority_queue 使用自定义比较器构建最小堆。
merged 节点标记为 $ 表示非叶子节点。
左分支赋码0，右分支赋码1，形成唯一可解码的前缀码。

该算法时间复杂度为 $O(n \\log n)$ ，其中堆操作主导耗时。生成的编码树保证了带权路径长度最小，从而实现最优压缩。

编码方式	是否前缀码	压缩效率	构造难度
ASCII	否	低	简单
固定长度编码	否	中	简单
Huffman	是	高	中等

5.2.3 局部最优不可行时的回退与修正机制

并非所有问题都能用贪心解决。以"硬币找零"问题为例：面额为 {1, 3, 4}，目标金额为6。

贪心策略（每次选最大可行面额）：

选4 → 剩2 → 选1两次 → 总共3枚

但最优解是：3+3=6，仅需2枚。

这表明贪心不具备最优子结构。此时应改用动态规划：

c++ 复制代码

int coinChange(vector<int>& coins, int amount) {
    vector<int> dp(amount + 1, amount + 1);
    dp[0] = 0;

    for (int i = 1; i <= amount; ++i)
        for (int c : coins)
            if (c <= i)
                dp[i] = min(dp[i], dp[i - c] + 1);

    return dp[amount] > amount ? -1 : dp[amount];
}

该DP解法能正确处理任意面额组合，体现了在贪心失效时转向更稳健算法的必要性。

flowchart LR A[问题输入] --> B{是否存在贪心选择性质?} B -->|是| C[实施贪心策略] B -->|否| D[采用动态规划或搜索] C --> E[输出结果] D --> E

该流程图指导我们在面对新问题时先尝试贪心，再验证其正确性，否则切换至其他方法。

5.3 图论算法的核心模型与扩展应用

图论算法在路径规划、网络流、社交网络分析等领域具有广泛应用。本节重点讲解Dijkstra、Floyd-Warshall与Ford-Fulkerson三大经典算法的实现细节与工程优化。

5.3.1 Dijkstra算法的堆优化实现与负权边规避

Dijkstra用于求解单源最短路径，要求边权非负。

朴素版本时间复杂度为 $O(V\^2)$ ，可通过优先队列优化至 $O((V+E)\\log V)$ 。

c++ 复制代码

#include <iostream>
#include <vector>
#include <queue>
#include <climits>
using namespace std;

typedef pair<int, int> pii; // <distance, vertex>

void dijkstra(int start, vector<vector<pii>>& graph, vector<int>& dist) {
    int n = graph.size();
    dist.assign(n, INT_MAX);
    dist[start] = 0;

    priority_queue<pii, vector<pii>, greater<pii>> pq;
    pq.push({0, start});

    while (!pq.empty()) {
        int u = pq.top().second;
        int d = pq.top().first;
        pq.pop();

        if (d > dist[u]) continue; // 过期节点，跳过

        for (auto& edge : graph[u]) {
            int v = edge.first;
            int w = edge.second;
            if (dist[u] + w < dist[v]) {
                dist[v] = dist[u] + w;
                pq.push({dist[v], v});
            }
        }
    }
}

关键点：

使用 greater<pii> 实现最小堆。
if (d > dist[u]) 是剪枝操作，避免处理已被更新的旧状态。
每条边最多入队一次，总体效率较高。

⚠️ 注意：若存在负权边，Dijkstra会失效。此时应使用Bellman-Ford或SPFA。

5.3.2 Floyd-Warshall算法在多源最短路径中的全量计算

Floyd-Warshall通过三重循环求解所有点对之间的最短路径。

c++ 复制代码

void floydWarshall(vector<vector<int>>& dist, int n) {
    for (int k = 0; k < n; ++k)
        for (int i = 0; i < n; ++i)
            for (int j = 0; j < n; ++j)
                if (dist[i][k] != INT_MAX && dist[k][j] != INT_MAX)
                    dist[i][j] = min(dist[i][j], dist[i][k] + dist[k][j]);
}

适用于 $n \\leq 500$ 的稠密图。

5.3.3 网络流Ford-Fulkerson方法的最大流最小割定理应用

Ford-Fulkerson通过不断寻找增广路径来增加流量，直到无法增广为止。

使用DFS实现Edmonds-Karp变种：

c++ 复制代码

int bfs(int s, int t, vector<int>& parent, vector<vector<int>>& capacity) {
    fill(parent.begin(), parent.end(), -1);
    queue<pair<int, int>> q;
    q.push({s, INT_MAX});

    while (!q.empty()) {
        int u = q.front().first;
        int flow = q.front().second;
        q.pop();

        for (int v = 0; v < capacity.size(); ++v) {
            if (parent[v] == -1 && capacity[u][v] > 0) {
                parent[v] = u;
                int new_flow = min(flow, capacity[u][v]);
                if (v == t) return new_flow;
                q.push({v, new_flow});
            }
        }
    }
    return 0;
}

int maxFlow(int s, int t, vector<vector<int>>& capacity) {
    int total = 0;
    vector<int> parent(capacity.size());
    int flow;

    while ((flow = bfs(s, t, parent, capacity))) {
        total += flow;
        int cur = t;
        while (cur != s) {
            int prev = parent[cur];
            capacity[prev][cur] -= flow;
            capacity[cur][prev] += flow;
            cur = prev;
        }
    }
    return total;
}

该算法体现了"残差网络"与"反向边"的精巧设计，是理解最大流最小割定理的基础。

以上内容系统阐述了动态规划、贪心与图论三大高级算法范式的建模方法与实现技巧，辅以代码实例、表格归纳与流程图展示，旨在帮助读者建立完整的算法思维体系，从容应对各类复杂问题。

6. 数学工具在算法竞赛中的深度融合

6.1 素数筛法的高效实现与预处理优化

在算法竞赛中，素数相关问题是高频考点，尤其在涉及因子分解、模运算或密码学背景题目时。为了快速判断一个数是否为素数，或生成一定范围内的所有素数，直接对每个数进行试除的时间复杂度较高（ $O(n\\sqrt{n})$ ），难以满足大规模数据需求。因此，使用 素数筛法 进行预处理成为必要手段。

埃拉托斯特尼筛法（埃氏筛）

埃氏筛基于"最小质因子"思想，通过标记合数来筛选素数。其核心逻辑是从2开始，将每一个素数的倍数标记为非素数。

c++ 复制代码

#include <iostream>
#include <vector>
using namespace std;

const int MAXN = 1e6 + 5;
vector<bool> is_prime(MAXN, true);
vector<int> primes;

void eratosthenes() {
    is_prime[0] = is_prime[1] = false;
    for (int i = 2; i * i < MAXN; ++i) {
        if (is_prime[i]) {
            for (int j = i * i; j < MAXN; j += i) { // 从i²开始避免重复
                is_prime[j] = false;
            }
        }
    }
    // 收集所有素数
    for (int i = 2; i < MAXN; ++i)
        if (is_prime[i]) primes.push_back(i);
}

时间复杂度 ： $O(n \\log \\log n)$
空间复杂度 ： $O(n)$
优化点 ：内层循环从 $i\^2$ 开始，因为小于 $i\^2$ 的倍数已被更小的素数筛去。

欧拉筛（线性筛）

尽管埃氏筛效率已较高，但仍有重复标记问题。欧拉筛通过记录每个数的"最小质因子"，确保每个合数仅被其最小质因子筛一次，实现真正的线性时间复杂度。

cpp 复制代码

vector<int> min_factor(MAXN);
void euler_sieve() {
    is_prime.assign(MAXN, true);
    is_prime[0] = is_prime[1] = false;
    for (int i = 2; i < MAXN; ++i) {
        if (is_prime[i]) {
            primes.push_back(i);
            min_factor[i] = i;
        }
        for (int p : primes) {
            if (i * p >= MAXN) break;
            is_prime[i * p] = false;
            min_factor[i * p] = p;
            if (i % p == 0) break; // 关键：保证每个数只被最小质因子筛
        }
    }
}

方法	时间复杂度	是否线性	适用场景
试除法	$O(n\\sqrt{n})$	否	小范围单个判断
埃氏筛	$O(n\\log\\log n)$	否	中等规模批量生成
欧拉筛	$O(n)$	是	大规模预处理+因子分析

实际应用场景举例

在蓝桥杯真题《质因数个数》中，要求统计区间 $\[L, R\]$ 内每个数的质因数个数之和。若采用试除法逐个分解，最坏情况会超时。而结合欧拉筛预处理出 min_factor 数组后，可快速递归分解：

cpp 复制代码

int count_prime_factors(int n) {
    int cnt = 0;
    while (n > 1) {
        int p = min_factor[n];
        while (n % p == 0) {
            n /= p;
            cnt++;
        }
    }
    return cnt;
}

该方法将单次分解复杂度降至 $O(\\log n)$ ，整体效率显著提升。

6.2 模运算与逆元在组合数计算中的关键作用

在涉及大数组合数的问题中（如 $C(n, k) \\mod p$ ），直接计算阶乘会导致溢出且不可逆。此时需借助 模运算性质 与 乘法逆元 完成安全计算。

快速幂求逆元（费马小定理）

当模数 $p$ 为质数时，根据费马小定理：

a^{p-1} \equiv 1 \pmod{p} \Rightarrow a^{-1} \equiv a^{p-2} \pmod{p}

cpp 复制代码

long long mod_exp(long long base, long long exp, long long mod) {
    long long res = 1;
    while (exp > 0) {
        if (exp & 1) res = (res * base) % mod;
        base = (base * base) % mod;
        exp >>= 1;
    }
    return res;
}

long long mod_inverse(long long a, long long p) {
    return mod_exp(a, p - 2, p); // 要求p是质数
}

预处理阶乘及其逆元

为高效计算多个组合数，通常预处理阶乘数组和阶乘逆元数组：

cpp 复制代码

const long long MOD = 1e9 + 7;
vector<long long> fact(MAXN), inv_fact(MAXN);

void precompute_factorials(int n) {
    fact[0] = 1;
    for (int i = 1; i <= n; ++i)
        fact[i] = (fact[i-1] * i) % MOD;

    inv_fact[n] = mod_inverse(fact[n], MOD);
    for (int i = n - 1; i >= 0; --i)
        inv_fact[i] = (inv_fact[i+1] * (i+1)) % MOD;
}

long long comb(int n, int k) {
    if (k < 0 || k > n) return 0;
    return fact[n] * inv_fact[k] % MOD * inv_fact[n-k] % MOD;
}

应用实例：路径计数问题

在一个 $n \\times m$ 网格中，从左上角走到右下角，只能向右或向下走，路径总数为 $C(n+m, n)$ 。若结果需对 $10\^9+7$ 取模，则必须使用上述组合数模板。

cpp 复制代码

int main() {
    precompute_factorials(2e6);
    int n, m; cin >> n >> m;
    cout << comb(n + m, n) << endl;
}

此方法可在 $O(1)$ 时间内回答任意组合查询，极大提升程序效率。

6.3 容斥原理与同余方程的建模技巧

容斥原理解决多条件计数

容斥原理用于处理"至少一个满足"的集合计数问题。公式如下：

|A_1 \cup A_2 \cup \cdots \cup A_n| = \sum |A_i| - \sum |A_i \cap A_j| + \sum |A_i \cap A_j \cap A_k| - \cdots

例如：求 $\[1, N\]$ 中能被 2、3 或 5 整除的整数个数。

cpp 复制代码

long long inclusion_exclusion(int N) {
    return N/2 + N/3 + N/5
           - N/6 - N/10 - N/15
           + N/30;
}

子集大小	符号	对应LCM	项数
1	+	2,3,5	3
2	-	6,10,15	3
3	+	30	1

可通过位枚举实现通用容斥：

cpp 复制代码

vector<int> divisors = {2, 3, 5};
int total = 0;
for (int mask = 1; mask < (1 << divisors.size()); ++mask) {
    int lcm_val = 1, cnt = 0;
    for (int i = 0; i < divisors.size(); ++i) {
        if (mask & (1 << i)) {
            lcm_val = lcm(lcm_val, divisors[i]);
            cnt++;
        }
    }
    if (cnt & 1) total += N / lcm_val;
    else total -= N / lcm_val;
}

同余方程与中国剩余定理初步

形如 $x \\equiv a_i \\pmod{m_i}$ 的方程组，在模两两互质时可用中国剩余定理求解唯一解（模 $M = \\prod m_i$ ）。

简单情形下可通过枚举增量法求解：

cpp 复制代码

// x ≡ 2 (mod 3), x ≡ 3 (mod 5), x ≡ 2 (mod 7)
int solve_congruence() {
    int x = 2;
    while (!(x % 5 == 3 && x % 7 == 2))
        x += 3;
    return x; // 解为23
}

更复杂的系统可通过扩展欧几里得算法联立求解。

graph TD A[输入同余方程组] --> B{模数是否两两互质?} B -->|是| C[应用中国剩余定理] B -->|否| D[转化为等价线性同余方程组] C --> E[计算总模M] E --> F[对每个方程求Mi= M/mi] F --> G[求Mi的模mi逆元] G --> H[累加ai*Mi*inv(Mi)] H --> I[返回结果mod M]

本文还有配套的精品资源，点击获取