数组是计算机科学中的一种基础数据结构,它在算法中有着广泛的应用,其关键要素是索引与索引对应的值。
请注意,这些代码示例需要适当的辅助函数(如 swap )和主函数来运行。此外,一些算法(如KMP算法)需要额外的辅助函数来计算最长公共前缀数组(LPS)。
以下是数组在算法中的一些常见应用:
1 排序
1.1 冒泡排序
通过重复交换相邻元素来排序数组。
void bubbleSort(int arr[], int n) {
for (int i = 0; i < n-1; i++)
for (int j = 0; j < n-i-1; j++)
if (arr[j] > arr[j+1])
swap(&arr[j], &arr[j+1]);
}
1.2 选择排序
每次从未排序的部分选择最小(或最大)的元素放到已排序序列的末尾。
void selectionSort(int arr[], int n) {
int i, j, min_idx;
for (i = 0; i < n-1; i++) {
min_idx = i;
for (j = i + 1; j < n; j++) {
if (arr[j] < arr[min_idx]) {
min_idx = j;
}
}
if (min_idx != i) {
int temp = arr[i];
arr[i] = arr[min_idx];
arr[min_idx] = temp;
}
}
}
1.3 插入排序
构建有序序列,对未排序数据,在已排序序列中从后向前扫描,找到相应位置并插入。
void insertionSort(int arr[], int n) {
int i, key, j;
// 从第二个元素开始遍历数组
for (i = 1; i < n; i++) {
key = arr[i]; // 选择未排序部分的第一个元素
j = i - 1;
// 将选中的元素与已排序部分的元素比较,并将已排序元素向后移动
while (j >= 0 && arr[j] > key) {
arr[j + 1] = arr[j];
j = j - 1;
}
// 将选中的元素插入到正确的位置
arr[j + 1] = key;
}
}
1.4 快速排序
选择一个"基准"元素,将数组分为两部分,一部分比基准小,另一部分比基准大,然后递归排序这两部分。
void quickSort(int arr[], int low, int high) {
if (low < high) {
int pi = partition(arr, low, high);
quickSort(arr, low, pi - 1); // Before pi
quickSort(arr, pi + 1, high); // After pi
}
}
int partition(int arr[], int low, int high) {
int pivot = arr[high]; // pivot
int i = (low - 1); // Index of smaller element
for (int j = low; j <= high - 1; j++) {
// If current element is smaller than or equal to pivot
if (arr[j] <= pivot) {
i++; // increment index of smaller element
swap(&arr[i], &arr[j]);
}
}
swap(&arr[i + 1], &arr[high]);
return (i + 1);
}
void swap(int* a, int* b) {
int t = *a;
*a = *b;
*b = t;
}
2 搜索
2.1 线性搜索
遍历数组,直到找到目标元素。
int linearSearch(int arr[], int n, int x) {
for (int i = 0; i < n; i++) {
if (arr[i] == x) {
return i; // 找到元素,返回索引
}
}
return -1; // 未找到元素,在返回-1
}
2.2 二分搜索
在已排序的数组中,通过比较中间元素与目标值来减少搜索范围。
int binarySearch(int arr[], int l, int r, int x) {
if (r >= l) {
int mid = l + (r - l) / 2;
if (arr[mid] == x)
return mid;
if (arr[mid] > x)
return binarySearch(arr, l, mid - 1, x);
return binarySearch(arr, mid + 1, r, x);
}
return -1;
}
3 动态规划
动态规划(Dynamic Programming,简称DP)是一种在数学、管理科学、计算机科学和经济学中使用的,通过把原问题分解为相对简单的子问题的方式求解复杂问题的方法。
用于解决具有重叠子问题和最优子结构特性的问题,如斐波那契数列、最长公共子序列、背包问题等。
3.1 斐波那契
int fib(int n) {
int f[n+2]; // 1 extra to handle case, n = 0
f[0] = 0;
f[1] = 1;
for (int i = 2; i <= n; i++) {
f[i] = f[i-1] + f[i-2];
}
return f[n];
}
3.2 最长公共子序列
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
// 动态规划求解最长公共子序列的长度
int lcs_length(char *X, char *Y, int m, int n) {
int L[m+1][n+1];
int i, j;
// 构建L[m+1][n+1]表
for (i = 0; i <= m; i++) {
for (j = 0; j <= n; j++) {
if (i == 0 || j == 0)
L[i][j] = 0;
else if (X[i-1] == Y[j-1])
L[i][j] = L[i-1][j-1] + 1;
else
L[i][j] = (L[i-1][j] > L[i][j-1]) ? L[i-1][j] : L[i][j-1];
}
}
// L[m][n]包含了X[0..m-1]和Y[0..n-1]的LCS的长度
return L[m][n];
}
3.3 背包问题
背包问题是一种组合优化的问题。在典型的背包问题中,你给定一组物品,每个物品都有自己的重量和价值,并且存在一个限定的总重量。目标是确定在不超过总重量的前提下,哪些物品应该被选中,以使得总价值最大化。
这里提供的是0-1背包问题的动态规划解决方案的C语言实现。0-1背包问题是指每个物品只有两种选择:要么完全拿走,要么完全不要。
#include <stdio.h>
// 动态规划求解0-1背包问题
int knapSack(int W, int wt[], int val[], int n) {
int i, w;
int K[n+1][W+1];
// 构建dp表
for (i = 0; i <= n; i++) {
for (w = 0; w <= W; w++) {
if (i == 0 || w == 0)
K[i][w] = 0;
else if (wt[i - 1] <= w)
K[i][w] = (val[i - 1] + K[i - 1][w - wt[i - 1]]) > K[i - 1][w] ? (val[i - 1] + K[i - 1][w - wt[i - 1]]) : K[i - 1][w];
else
K[i][w] = K[i - 1][w];
}
}
// 返回最大价值
return K[n][W];
}
4 图算法
4.1 邻接矩阵
表示图中顶点间连接关系的二维数组。
#define V 5 // 5 vertices
void addEdge(int graph[V][V], int src, int dest) {
graph[src][dest] = 1;
graph[dest][src] = 1; // For undirected graph
}
void printGraph(int graph[V][V]) {
for (int i = 0; i < V; i++) {
for (int j = 0; j < V; j++) {
printf("%d ", graph[i][j]);
}
printf("\n");
}
}
4.2 最短路径问题
(如Dijkstra算法、Bellman-Ford算法)。
4.2.1 Dijkstra算法
最短路径问题是图论中的一个经典问题,其中Dijkstra算法是求解单源最短路径问题的一种非常著名的算法。
#include <stdio.h>
#include <limits.h>
// 用于找到最短路径集合中具有最小距离的顶点
int minDistance(int dist[], int sptSet[], int n) {
int min = INT_MAX, min_index;
for (int v = 0; v < n; v++)
if (sptSet[v] == 0 && dist[v] <= min)
min = dist[v], min_index = v;
return min_index;
}
// 实现Dijkstra算法
void dijkstra(int graph[V][V], int src, int n) {
int dist[V]; // dist[i]表示源点到i的最短距离
int sptSet[V]; // sptSet[i]为真,如果i在最短路径集合中
// 初始化所有距离为无穷大,sptSet[]为假
for (int i = 0; i < n; i++)
dist[i] = INT_MAX, sptSet[i] = 0;
// 源点到自己的距离总是为0
dist[src] = 0;
// 找到所有顶点的最短路径
for (int count = 0; count < n - 1; count++) {
// 选择最短距离顶点的最小值
int u = minDistance(dist, sptSet, n);
// 标记这个顶点已经处理
sptSet[u] = 1;
// 更新相邻顶点的距离值
for (int v = 0; v < n; v++)
if (!sptSet[v] && graph[u][v] && dist[u] != INT_MAX &&
dist[u] + graph[u][v] < dist[v])
dist[v] = dist[u] + graph[u][v];
}
// 打印构建的距离数组
for (int i = 0; i < n; i++)
printf("顶点 %d 到源点的最短距离是: %d\n", i, dist[i]);
}
5 字符串处理
5.1 字符串匹配
如KMP算法、Boyer-Moore算法等,使用数组来存储字符串的部分匹配信息。
5.1.1 KMP算法
KMP算法的核心思想是,当在文本字符串中从左到右进行模式匹配时,如果某个字符不匹配,那么我们可以利用之前已经匹配的部分信息,跳过一些不必要的比较,从而提高匹配效率。
void KMPSearch(char *pat, char *txt) {
int M = strlen(pat);
int N = strlen(txt);
int lps[M];
computeLPSArray(pat, M, lps);
int i = 0; // index for txt
int j = 0; // index for pat
while (i < N) {
if (pat[j] == txt[i]) {
i++;
j++;
}
if (j == M) {
printf("Found pattern at index %d\n", i - j);
j = lps[j-1];
} else if (i < N && pat[j] != txt[i]) {
if (j != 0)
j = lps[j-1];
else
i = i+1;
}
}
}
5.1.2 Boyer-Moore算法
Boyer-Moore算法是一种高效的字符串搜索算法,它通过两个关键的预处理函数来优化搜索过程:坏字符规则(Bad Character Heuristic)和好后缀规则(Good Suffix Heuristic)。以下是C语言实现Boyer-Moore算法的关键函数:
- 坏字符规则的预处理函数:
#define NO_OF_CHARS 256
void badCharHeuristic(char* str, int size, int badchar[NO_OF_CHARS]) {
int i;
for (i = 0; i < NO_OF_CHARS; i++)
badchar[i] = -1;
for (i = 0; i < size; i++)
badchar[(int)str[i]] = i;
}
- 搜索函数:
void search(char* txt, char* pat) {
int m = strlen(pat);
int n = strlen(txt);
int badchar[NO_OF_CHARS];
badCharHeuristic(pat, m, badchar);
int s = 0; // s is shift of the pattern with respect to text
while (s <= (n - m)) {
int j = m - 1;
while (j >= 0 && pat[j] == txt[s + j])
j--;
if (j < 0) {
printf("\n pattern occurs at shift = %d", s);
s += (s + m < n) ? m - badchar[txt[s + m]] : 1;
} else {
s += max(1, j - badchar[txt[s + j]]);
}
}
}
在这段代码中, badCharHeuristic 函数用于构建坏字符规则表,它记录了模式字符串中每个字符的最后出现位置。 search 函数则是Boyer-Moore算法的核心,它使用坏字符规则来决定模式字符串应该向右移动的距离。
要使用这些函数,你需要在主函数中调用 search 函数,并传入文本字符串和模式字符串。这样就会打印出模式字符串在文本字符串中出现的所有位置。
在Boyer-Moore算法中,"好后缀"(Good Suffix)是指在模式字符串中,当发生匹配失败时,已经成功匹配的模式字符串的后缀中最长的相同前缀和后缀的子串。这个概念用于在发生不匹配时,决定模式字符串应该向右移动的距离。
例如,假设我们有模式字符串 "ABABC" ,并且我们正在尝试在文本字符串中匹配它。如果我们在某个位置尝试匹配时, "B" 和 "C" 都匹配成功了,但下一个字符不匹配,那么 "BC" 就是一个好后缀。因为 "BC" 是模式字符串的后缀,并且它也是模式字符串的前缀。
在Boyer-Moore算法中,当发生不匹配时,算法会查找这个好后缀在模式字符串中的下一个出现位置。然后,模式字符串会移动到文本字符串中的下一个位置,使得这个好后缀与模式字符串的开始位置对齐。
例如,考虑模式字符串 "ABCDABD" ,如果我们在文本字符串中匹配时在位置 5 处发生了不匹配(即 "D" 不匹配),那么 "ABD" 就是已经匹配的子串,其中 "BD" 是一个好后缀。在模式字符串中, "BD" 也出现在开头,所以模式字符串应该移动到文本字符串中下一个 "B" 的位置,以便 "BD" 能够与模式字符串的开始位置对齐。
以下是构建好后缀规则表的C语言函数:
void goodSuffixHeuristic(char* pat, int m, int goodSuffix[NO_OF_CHARS]) {
int i, j;
for (i = 0; i < m; i++) {
goodSuffix[i] = -1;
}
for (i = 0; i < m - 1; i++) {
int len = 0;
// Check for the longest prefix which is also suffix
for (j = m - 1; j >= 0; j--) {
if (pat[j] == pat[len]) {
len++;
goodSuffix[j] = len;
} else {
break;
}
}
}
for (i = 0; i < m; i++) {
// If the value is not set then it means it is a bad character
if (goodSuffix[i] == -1)
goodSuffix[i] = m;
}
}
这个函数会填充一个数组,该数组用于存储每个字符在模式字符串中对应的好后缀长度。如果在模式字符串中没有找到相同的前缀和后缀,则该位置的值将保持为 -1 。在搜索函数中,这个数组将与坏字符规则表一起使用,以确定在发生不匹配时模式字符串应该移动的最大距离。
请注意,这个函数是一个简化的版本,它只考虑了模式字符串的前缀和后缀相等的情况。在实际应用中,可能需要更复杂的逻辑来处理不同的情况。
6 矩阵操作
6.1 矩阵乘法
计算两个矩阵的乘积。
#include <stdio.h>
#define MAX_ROWS 100
#define MAX_COLS 100
// 矩阵乘法函数
void matrixMultiply(int A[][MAX_COLS], int B[][MAX_COLS], int C[][MAX_COLS], int Arows, int Acols, int Brows, int Bcols) {
for (int i = 0; i < Arows; i++) {
for (int j = 0; j < Bcols; j++) {
C[i][j] = 0; // 初始化结果矩阵的元素为0
for (int k = 0; k < Acols; k++) {
C[i][j] += A[i][k] * B[k][j];
}
}
}
}
6.2 矩阵链乘
矩阵链乘问题是动态规划的经典应用之一。给定一系列矩阵,找出一种乘法顺序,使得计算所有矩阵的乘积所需的标量乘法次数最少。
假设有 A_1, A_2, ..., A_n 个矩阵需要相乘,矩阵 A_i 的维度为 p_{i-1} \times p_i。矩阵链乘问题就是要找到一种乘法顺序,使得总的标量乘法次数最小。
以下是矩阵链乘问题的关键函数,使用动态规划求解:
#include <stdio.h>
#include <limits.h>
// 动态规划解决矩阵链乘问题
void matrixChainOrder(int p[], int n, int **m, int **s) {
// 初始化m和s
for (int i = 1; i < n; i++) {
m[i][i] = 0;
}
for (int l = 2; l < n; l++) { // l是链的长度
for (int i = 1; i < n - l + 1; i++) {
int j = i + l - 1;
m[i][j] = INT_MAX;
for (int k = i; k < j; k++) {
// q = cost/scalar multiplications
int q = m[i][k] + m[k+1][j] + p[i-1] * p[k] * p[j];
if (q < m[i][j]) {
m[i][j] = q;
s[i][j] = k; // s[i][j]是分割点
}
}
}
}
}
// 打印最优乘法顺序
void printOptimalParens(int i, int j, int **s) {
if (i == j) {
printf("A%d", i);
} else {
printf("(");
printOptimalParens(i, s[i][j], s);
printOptimalParens(s[i][j] + 1, j, s);
printf(")");
}
}
// 主函数
int main() {
int arr[] = {30, 35, 15, 5, 10, 20, 25}; // 矩阵的维度
int size = sizeof(arr) / sizeof(arr[0]);
int **m = (int **)malloc(size * sizeof(int *));
int **s = (int **)malloc(size * sizeof(int *));
for (int i = 0; i < size; i++) {
m[i] = (int *)malloc(size * sizeof(int));
s[i] = (int *)malloc(size * sizeof(int));
}
matrixChainOrder(arr, size, m, s);
printf("最少的标量乘法次数是: %d\n", m[1][size - 1]);
printf("最优乘法顺序是: ");
printOptimalParens(1, size - 1, s);
printf("\n");
// 释放内存
for (int i = 0; i < size; i++) {
free(m[i]);
free(s[i]);
}
free(m);
free(s);
return 0;
}
在这个代码中, matrixChainOrder 函数计算了计算所有矩阵乘积的最小标量乘法次数,并存储在二维数组 m 中。数组 s 用于重建最优乘法顺序。
printOptimalParens 函数递归地打印出最优的乘法顺序。
在 main 函数中,我们初始化了矩阵的维度数组 arr ,分配了内存给动态数组 m 和 s ,并调用了 matrixChainOrder 函数来填充这些数组。然后,我们打印出最小的标量乘法次数和最优乘法顺序。
请注意,这段代码假设所有的矩阵都是长方形的,并且它们的相邻矩阵的维度是匹配的,即除了第一个矩阵,每个矩阵的第一个维度都应该与前一个矩阵的第二个维度相同。
7 滑动窗口
滑动窗口是一种常见的解决数组问题的方法,特别是在处理固定长度的子数组或子串时。以下是一个C语言实现的滑动窗口的关键函数示例,用于查找一个数组中最长的无重复字符的子串的长度:
#include <stdio.h>
#include <string.h>
// 函数返回最长无重复字符的子串的长度
int lengthOfLongestSubstring(char* s) {
int n = strlen(s);
int maxLength = 0;
int start = 0; // 滑动窗口的起始位置
// 用于存储字符最后出现的位置
int lastIndex[256] = {0};
for (int end = 0; end < n; end++) {
// 如果字符已经出现过,且其最后出现的位置在当前滑动窗口内
if (lastIndex[s[end]] >= start) {
start = lastIndex[s[end]] + 1;
}
// 更新字符的最后出现位置
lastIndex[s[end]] = end;
// 计算当前滑动窗口的长度,并更新最长长度
maxLength = maxLength > (end - start + 1) ? maxLength : (end - start + 1);
}
return maxLength;
}
// 主函数
int main() {
char s[] = "abcabcbb";
printf("最长无重复字符的子串的长度是: %d\n", lengthOfLongestSubstring(s));
return 0;
}
lengthOfLongestSubstring 函数用于计算字符串 s 中最长的无重复字符的子串的长度。它使用一个滑动窗口,通过 start 和 end 指针表示窗口的起始和结束位置。 lastIndex 数组用于存储每个字符最后出现的位置。
当遇到重复字符时,将窗口的起始位置 start 移动到重复字符的下一个位置。每次迭代都更新最长长度 maxLength 。
在 main 函数中,我们调用 lengthOfLongestSubstring 函数并打印出结果。
这个函数适用于查找字符串中最长的无重复字符的子串,但它可以修改用于解决其他类型的滑动窗口问题。
8 计数问题
8.1 桶排序
桶排序(Bucket Sort)是一种分布式排序算法,它将数组分为多个桶,每个桶内使用其他排序算法(如插入排序)进行排序,然后合并各个桶中的数据。桶排序的关键在于如何合理地分配桶以及如何合并桶中的数据。
以下是一个C语言实现的桶排序的关键函数示例:
#include <stdio.h>
#include <stdlib.h>
#include <math.h>
// 函数声明
void bucketSort(float arr[], int n);
// 桶排序的关键函数
void bucketSort(float arr[], int n) {
// 创建桶
float *buckets[n]; // 桶数组
for (int i = 0; i < n; i++) {
buckets[i] = (float *)malloc(n * sizeof(float)); // 为每个桶分配内存
buckets[i][0] = 0; // 初始化桶的计数为0
}
// 将数组元素分配到各个桶中
for (int i = 0; i < n; i++) {
int idx = (int)(n * arr[i]); // 计算元素应该放入哪个桶
buckets[idx][++buckets[idx][0]] = arr[i]; // 将元素放入桶中,并更新桶的计数
}
// 对每个桶进行排序,这里使用插入排序
for (int i = 0; i < n; i++) {
int size = buckets[i][0];
for (int j = 1; j < size; j++) {
for (int k = j; k > 0 && buckets[i][k] < buckets[i][k - 1]; k--) {
float temp = buckets[i][k];
buckets[i][k] = buckets[i][k - 1];
buckets[i][k - 1] = temp;
}
}
}
// 合并桶中的数据
int idx = 0;
for (int i = 0; i < n; i++) {
for (int j = 0; j < buckets[i][0]; j++) {
arr[idx++] = buckets[i][j];
}
}
// 释放桶的内存
for (int i = 0; i < n; i++) {
free(buckets[i]);
}
}
// 主函数
int main() {
float arr[] = {0.78, 0.17, 0.39, 0.26, 0.72, 0.94, 0.21, 0.12, 0.23, 0.68};
int n = sizeof(arr) / sizeof(arr[0]);
bucketSort(arr, n);
printf("排序后的数组: \n");
for (int i = 0; i < n; i++) {
printf("%0.2f ", arr[i]);
}
printf("\n");
return 0;
}
在这个示例中, bucketSort 函数接受一个浮点数数组 arr 和数组的长度 n 作为参数。它首先创建一个桶数组,并将数组元素分配到各个桶中。然后,对每个桶内的数据使用插入排序算法进行排序。最后,将所有桶中的数据合并回原数组。
在 main 函数中,我们定义了一个浮点数数组 arr ,调用 bucketSort 函数对其进行排序,并打印排序后的数组。
请注意,这个桶排序的实现假设数组的元素在 [0, 1) 区间内。如果数组的元素范围不同,可能需要调整桶的分配策略。此外,为了简化实现,每个桶的大小与原数组相同,这不是最优化的内存使用方式,但可以确保有足够的空间存储每个桶中的元素。
8.2 计数排序
对整数数组进行排序,基于元素出现的次数。
void countSort(int arr[], int n) {
int max = 0;
for (int i = 0; i < n; i++) {
if < n; i++) {
ifarrarr[i] > max) max = arr[i];
}
int count[max+1];
for (int i = 0; i <= max; i++) {
count[i] = 0;
}
for (int i = 0; i < n; i++) {
count[arr[i]]++;
}
int index = 0;
for (int i = 0; i <= max; i++) {
while (count[i] > 0) {
arr[index++] = i;
count[i]--;
}
}
}
9 前缀和
用于快速计算数组的子数组和,常用于解决区间查询问题。
void prefixSum(int arr[], int n) {
int prefix[n];
prefix[0] = arr[0];
for (int i = 1; i < n; i++) {
prefix[i] = prefix[i-1] + arr[i];
}
// prefix[i] now contains sum of arr[0...i]
}
10 堆
10.1 优先队列
使用数组实现的堆结构,可以快速获取最大或最小元素。
最大堆调整
void maxHeapify(int arr[], int n, int i) {
int largest = i;
int l = 2*i + 1;
int r = 2*i + 2;
if (l < n && arr[l] > arr[largest])
largest = l;
if (r < n && arr[r] > arr[largest])
largest = r;
if (largest != i) {
swap(&arr[i], &arr[largest]);
maxHeapify(arr, n, largest);
}
}
11 并查集
用于处理一些不交集的合并及查询问题。
int find(int i, int parent[]) {
if (parent[i] == -1)
return i;
return find(parent[i], parent);
}
void Union(int x, int y, int parent[]) {
int xset = find(x, parent);
int yset = find(y, parent);
if(xset != yset){
parent[xset] = yset;
}
}
12 双指针
用于解决数组中的问题,如"反转字符串"、"判断回文链表"。
12.1 反转字符串
void reverseString(char* s) {
int i = 0, j = strlen(s) - 1;
while (i < j) {
char temp = s[i];
s[i] = s[j];
s[j] = temp;
i++;
j--;
}
}
数组的应用非常广泛,不同的算法根据问题的特性选择不同的数据结构和方法。数组由于其简单性和高效的随机访问特性,在算法设计中扮演着重要角色。