数据结构: 数组在算法中的应用

数组是计算机科学中的一种基础数据结构,它在算法中有着广泛的应用,其关键要素是索引与索引对应的值。

请注意,这些代码示例需要适当的辅助函数(如 swap )和主函数来运行。此外,一些算法(如KMP算法)需要额外的辅助函数来计算最长公共前缀数组(LPS)。

以下是数组在算法中的一些常见应用:

1 排序

1.1 冒泡排序

通过重复交换相邻元素来排序数组。

void bubbleSort(int arr\[\], int n) {

for (int i = 0; i < n-1; i++)

for (int j = 0; j < n-i-1; j++)

if (arrj > arrj+1)

swap(&arrj, &arrj+1);

}

1.2 选择排序

每次从未排序的部分选择最小(或最大)的元素放到已排序序列的末尾。

void selectionSort(int arr\[\], int n) {

int i, j, min_idx;

for (i = 0; i < n-1; i++) {

min_idx = i;

for (j = i + 1; j < n; j++) {

if (arrj < arrmin_idx) {

min_idx = j;

}

}

if (min_idx != i) {

int temp = arri;

arri = arrmin_idx;

arrmin_idx = temp;

}

}

}

1.3 插入排序

构建有序序列,对未排序数据,在已排序序列中从后向前扫描,找到相应位置并插入。

void insertionSort(int arr\[\], int n) {

int i, key, j;

// 从第二个元素开始遍历数组

for (i = 1; i < n; i++) {

key = arri; // 选择未排序部分的第一个元素

j = i - 1;

// 将选中的元素与已排序部分的元素比较,并将已排序元素向后移动

while (j >= 0 && arrj > key) {

arrj + 1 = arrj;

j = j - 1;

}

// 将选中的元素插入到正确的位置

arrj + 1 = key;

}

}

1.4 快速排序

选择一个"基准"元素,将数组分为两部分,一部分比基准小,另一部分比基准大,然后递归排序这两部分。

void quickSort(int arr\[\], int low, int high) {

if (low < high) {

int pi = partition(arr, low, high);

quickSort(arr, low, pi - 1); // Before pi

quickSort(arr, pi + 1, high); // After pi

}

}

int partition(int arr\[\], int low, int high) {

int pivot = arrhigh; // pivot

int i = (low - 1); // Index of smaller element

for (int j = low; j <= high - 1; j++) {

// If current element is smaller than or equal to pivot

if (arrj <= pivot) {

i++; // increment index of smaller element

swap(&arri, &arrj);

}

}

swap(&arri + 1, &arrhigh);

return (i + 1);

}

void swap(int* a, int* b) {

int t = *a;

*a = *b;

*b = t;

}

2 搜索

2.1 线性搜索

遍历数组,直到找到目标元素。

int linearSearch(int arr\[\], int n, int x) {

for (int i = 0; i < n; i++) {

if (arri == x) {

return i; // 找到元素,返回索引

}

}

return -1; // 未找到元素,在返回-1

}

2.2 二分搜索

在已排序的数组中,通过比较中间元素与目标值来减少搜索范围。

int binarySearch(int arr\[\], int l, int r, int x) {

if (r >= l) {

int mid = l + (r - l) / 2;

if (arrmid == x)

return mid;

if (arrmid > x)

return binarySearch(arr, l, mid - 1, x);

return binarySearch(arr, mid + 1, r, x);

}

return -1;

}

3 动态规划

动态规划(Dynamic Programming,简称DP)是一种在数学、管理科学、计算机科学和经济学中使用的,通过把原问题分解为相对简单的子问题的方式求解复杂问题的方法。

用于解决具有重叠子问题和最优子结构特性的问题,如斐波那契数列、最长公共子序列、背包问题等。

3.1 斐波那契

int fib(int n) {

int fn+2; // 1 extra to handle case, n = 0

f0 = 0;

f1 = 1;

for (int i = 2; i <= n; i++) {

fi = fi-1 + fi-2;

}

return fn;

}

3.2 最长公共子序列

#include <stdio.h>

#include <stdlib.h>

#include <string.h>

// 动态规划求解最长公共子序列的长度

int lcs_length(char *X, char *Y, int m, int n) {

int Lm+1n+1;

int i, j;

// 构建Lm+1n+1

for (i = 0; i <= m; i++) {

for (j = 0; j <= n; j++) {

if (i == 0 || j == 0)

Lij = 0;

else if (Xi-1 == Yj-1)

Lij = Li-1j-1 + 1;

else

Lij = (Li-1j > Lij-1) ? Li-1j : Lij-1;

}

}

// Lmn包含了X0..m-1和Y0..n-1的LCS的长度

return Lmn;

}

3.3 背包问题

背包问题是一种组合优化的问题。在典型的背包问题中,你给定一组物品,每个物品都有自己的重量和价值,并且存在一个限定的总重量。目标是确定在不超过总重量的前提下,哪些物品应该被选中,以使得总价值最大化。

这里提供的是0-1背包问题的动态规划解决方案的C语言实现。0-1背包问题是指每个物品只有两种选择:要么完全拿走,要么完全不要。

#include <stdio.h>

// 动态规划求解0-1背包问题

int knapSack(int W, int wt\[\], int val\[\], int n) {

int i, w;

int Kn+1W+1;

// 构建dp表

for (i = 0; i <= n; i++) {

for (w = 0; w <= W; w++) {

if (i == 0 || w == 0)

Kiw = 0;

else if (wti - 1 <= w)

Kiw = (vali - 1 + Ki - 1w - wt\[i - 1]) > Ki - 1w ? (vali - 1 + Ki - 1w - wt\[i - 1]) : Ki - 1w;

else

Kiw = Ki - 1w;

}

}

// 返回最大价值

return KnW;

}

4 图算法

4.1 邻接矩阵

表示图中顶点间连接关系的二维数组。

#define V 5 // 5 vertices

void addEdge(int graphVV, int src, int dest) {

graphsrcdest = 1;

graphdestsrc = 1; // For undirected graph

}

void printGraph(int graphVV) {

for (int i = 0; i < V; i++) {

for (int j = 0; j < V; j++) {

printf("%d ", graphij);

}

printf("\n");

}

}

4.2 最短路径问题

(如Dijkstra算法、Bellman-Ford算法)。

4.2.1 Dijkstra算法

最短路径问题是图论中的一个经典问题,其中Dijkstra算法是求解单源最短路径问题的一种非常著名的算法。

#include <stdio.h>

#include <limits.h>

// 用于找到最短路径集合中具有最小距离的顶点

int minDistance(int dist\[\], int sptSet\[\], int n) {

int min = INT_MAX, min_index;

for (int v = 0; v < n; v++)

if (sptSetv == 0 && distv <= min)

min = distv, min_index = v;

return min_index;

}

// 实现Dijkstra算法

void dijkstra(int graphVV, int src, int n) {

int distV; // disti表示源点到i的最短距离

int sptSetV; // sptSeti为真,如果i在最短路径集合中

// 初始化所有距离为无穷大,sptSet\[\]为假

for (int i = 0; i < n; i++)

disti = INT_MAX, sptSeti = 0;

// 源点到自己的距离总是为0

distsrc = 0;

// 找到所有顶点的最短路径

for (int count = 0; count < n - 1; count++) {

// 选择最短距离顶点的最小值

int u = minDistance(dist, sptSet, n);

// 标记这个顶点已经处理

sptSetu = 1;

// 更新相邻顶点的距离值

for (int v = 0; v < n; v++)

if (!sptSetv && graphuv && distu != INT_MAX &&

distu + graphuv < distv)

distv = distu + graphuv;

}

// 打印构建的距离数组

for (int i = 0; i < n; i++)

printf("顶点 %d 到源点的最短距离是: %d\n", i, disti);

}

5 字符串处理

5.1 字符串匹配

如KMP算法、Boyer-Moore算法等,使用数组来存储字符串的部分匹配信息。

5.1.1 KMP算法

KMP算法的核心思想是,当在文本字符串中从左到右进行模式匹配时,如果某个字符不匹配,那么我们可以利用之前已经匹配的部分信息,跳过一些不必要的比较,从而提高匹配效率。

void KMPSearch(char *pat, char *txt) {

int M = strlen(pat);

int N = strlen(txt);

int lpsM;

computeLPSArray(pat, M, lps);

int i = 0; // index for txt

int j = 0; // index for pat

while (i < N) {

if (patj == txti) {

i++;

j++;

}

if (j == M) {

printf("Found pattern at index %d\n", i - j);

j = lpsj-1;

} else if (i < N && patj != txti) {

if (j != 0)

j = lpsj-1;

else

i = i+1;

}

}

}

5.1.2 Boyer-Moore算法

Boyer-Moore算法是一种高效的字符串搜索算法,它通过两个关键的预处理函数来优化搜索过程:坏字符规则(Bad Character Heuristic)和好后缀规则(Good Suffix Heuristic)。以下是C语言实现Boyer-Moore算法的关键函数:

  1. 坏字符规则的预处理函数:

#define NO_OF_CHARS 256

void badCharHeuristic(char* str, int size, int badcharNO_OF_CHARS) {

int i;

for (i = 0; i < NO_OF_CHARS; i++)

badchari = -1;

for (i = 0; i < size; i++)

badchar(int)str\[i] = i;

}

  1. 搜索函数:

void search(char* txt, char* pat) {

int m = strlen(pat);

int n = strlen(txt);

int badcharNO_OF_CHARS;

badCharHeuristic(pat, m, badchar);

int s = 0; // s is shift of the pattern with respect to text

while (s <= (n - m)) {

int j = m - 1;

while (j >= 0 && patj == txts + j)

j--;

if (j < 0) {

printf("\n pattern occurs at shift = %d", s);

s += (s + m < n) ? m - badchartxt\[s + m] : 1;

} else {

s += max(1, j - badchartxt\[s + j]);

}

}

}

在这段代码中, badCharHeuristic 函数用于构建坏字符规则表,它记录了模式字符串中每个字符的最后出现位置。 search 函数则是Boyer-Moore算法的核心,它使用坏字符规则来决定模式字符串应该向右移动的距离。

要使用这些函数,你需要在主函数中调用 search 函数,并传入文本字符串和模式字符串。这样就会打印出模式字符串在文本字符串中出现的所有位置。

在Boyer-Moore算法中,"好后缀"(Good Suffix)是指在模式字符串中,当发生匹配失败时,已经成功匹配的模式字符串的后缀中最长的相同前缀和后缀的子串。这个概念用于在发生不匹配时,决定模式字符串应该向右移动的距离。

例如,假设我们有模式字符串 "ABABC" ,并且我们正在尝试在文本字符串中匹配它。如果我们在某个位置尝试匹配时, "B" 和 "C" 都匹配成功了,但下一个字符不匹配,那么 "BC" 就是一个好后缀。因为 "BC" 是模式字符串的后缀,并且它也是模式字符串的前缀。

在Boyer-Moore算法中,当发生不匹配时,算法会查找这个好后缀在模式字符串中的下一个出现位置。然后,模式字符串会移动到文本字符串中的下一个位置,使得这个好后缀与模式字符串的开始位置对齐。

例如,考虑模式字符串 "ABCDABD" ,如果我们在文本字符串中匹配时在位置 5 处发生了不匹配(即 "D" 不匹配),那么 "ABD" 就是已经匹配的子串,其中 "BD" 是一个好后缀。在模式字符串中, "BD" 也出现在开头,所以模式字符串应该移动到文本字符串中下一个 "B" 的位置,以便 "BD" 能够与模式字符串的开始位置对齐。

以下是构建好后缀规则表的C语言函数:

void goodSuffixHeuristic(char* pat, int m, int goodSuffixNO_OF_CHARS) {

int i, j;

for (i = 0; i < m; i++) {

goodSuffixi = -1;

}

for (i = 0; i < m - 1; i++) {

int len = 0;

// Check for the longest prefix which is also suffix

for (j = m - 1; j >= 0; j--) {

if (patj == patlen) {

len++;

goodSuffixj = len;

} else {

break;

}

}

}

for (i = 0; i < m; i++) {

// If the value is not set then it means it is a bad character

if (goodSuffixi == -1)

goodSuffixi = m;

}

}

这个函数会填充一个数组,该数组用于存储每个字符在模式字符串中对应的好后缀长度。如果在模式字符串中没有找到相同的前缀和后缀,则该位置的值将保持为 -1 。在搜索函数中,这个数组将与坏字符规则表一起使用,以确定在发生不匹配时模式字符串应该移动的最大距离。

请注意,这个函数是一个简化的版本,它只考虑了模式字符串的前缀和后缀相等的情况。在实际应用中,可能需要更复杂的逻辑来处理不同的情况。

6 矩阵操作

6.1 矩阵乘法

计算两个矩阵的乘积。

#include <stdio.h>

#define MAX_ROWS 100

#define MAX_COLS 100

// 矩阵乘法函数

void matrixMultiply(int A\[\]MAX_COLS, int B\[\]MAX_COLS, int C\[\]MAX_COLS, int Arows, int Acols, int Brows, int Bcols) {

for (int i = 0; i < Arows; i++) {

for (int j = 0; j < Bcols; j++) {

Cij = 0; // 初始化结果矩阵的元素为0

for (int k = 0; k < Acols; k++) {

Cij += Aik * Bkj;

}

}

}

}

6.2 矩阵链乘

矩阵链乘问题是动态规划的经典应用之一。给定一系列矩阵,找出一种乘法顺序,使得计算所有矩阵的乘积所需的标量乘法次数最少。

假设有 A_1, A_2, ..., A_n 个矩阵需要相乘,矩阵 A_i 的维度为 p_{i-1} \times p_i。矩阵链乘问题就是要找到一种乘法顺序,使得总的标量乘法次数最小。

以下是矩阵链乘问题的关键函数,使用动态规划求解:

#include <stdio.h>

#include <limits.h>

// 动态规划解决矩阵链乘问题

void matrixChainOrder(int p\[\], int n, int **m, int **s) {

// 初始化m和s

for (int i = 1; i < n; i++) {

mii = 0;

}

for (int l = 2; l < n; l++) { // l是链的长度

for (int i = 1; i < n - l + 1; i++) {

int j = i + l - 1;

mij = INT_MAX;

for (int k = i; k < j; k++) {

// q = cost/scalar multiplications

int q = mik + mk+1j + pi-1 * pk * pj;

if (q < mij) {

mij = q;

sij = k; // sij是分割点

}

}

}

}

}

// 打印最优乘法顺序

void printOptimalParens(int i, int j, int **s) {

if (i == j) {

printf("A%d", i);

} else {

printf("(");

printOptimalParens(i, sij, s);

printOptimalParens(sij + 1, j, s);

printf(")");

}

}

// 主函数

int main() {

int arr\[\] = {30, 35, 15, 5, 10, 20, 25}; // 矩阵的维度

int size = sizeof(arr) / sizeof(arr0);

int **m = (int **)malloc(size * sizeof(int *));

int **s = (int **)malloc(size * sizeof(int *));

for (int i = 0; i < size; i++) {

mi = (int *)malloc(size * sizeof(int));

si = (int *)malloc(size * sizeof(int));

}

matrixChainOrder(arr, size, m, s);

printf("最少的标量乘法次数是: %d\n", m1size - 1);

printf("最优乘法顺序是: ");

printOptimalParens(1, size - 1, s);

printf("\n");

// 释放内存

for (int i = 0; i < size; i++) {

free(mi);

free(si);

}

free(m);

free(s);

return 0;

}

在这个代码中, matrixChainOrder 函数计算了计算所有矩阵乘积的最小标量乘法次数,并存储在二维数组 m 中。数组 s 用于重建最优乘法顺序。

printOptimalParens 函数递归地打印出最优的乘法顺序。

在 main 函数中,我们初始化了矩阵的维度数组 arr ,分配了内存给动态数组 m 和 s ,并调用了 matrixChainOrder 函数来填充这些数组。然后,我们打印出最小的标量乘法次数和最优乘法顺序。

请注意,这段代码假设所有的矩阵都是长方形的,并且它们的相邻矩阵的维度是匹配的,即除了第一个矩阵,每个矩阵的第一个维度都应该与前一个矩阵的第二个维度相同。

7 滑动窗口

滑动窗口是一种常见的解决数组问题的方法,特别是在处理固定长度的子数组或子串时。以下是一个C语言实现的滑动窗口的关键函数示例,用于查找一个数组中最长的无重复字符的子串的长度:

#include <stdio.h>

#include <string.h>

// 函数返回最长无重复字符的子串的长度

int lengthOfLongestSubstring(char* s) {

int n = strlen(s);

int maxLength = 0;

int start = 0; // 滑动窗口的起始位置

// 用于存储字符最后出现的位置

int lastIndex256 = {0};

for (int end = 0; end < n; end++) {

// 如果字符已经出现过,且其最后出现的位置在当前滑动窗口内

if (lastIndexs\[end] >= start) {

start = lastIndexs\[end] + 1;

}

// 更新字符的最后出现位置

lastIndexs\[end] = end;

// 计算当前滑动窗口的长度,并更新最长长度

maxLength = maxLength > (end - start + 1) ? maxLength : (end - start + 1);

}

return maxLength;

}

// 主函数

int main() {

char s\[\] = "abcabcbb";

printf("最长无重复字符的子串的长度是: %d\n", lengthOfLongestSubstring(s));

return 0;

}

lengthOfLongestSubstring 函数用于计算字符串 s 中最长的无重复字符的子串的长度。它使用一个滑动窗口,通过 start 和 end 指针表示窗口的起始和结束位置。 lastIndex 数组用于存储每个字符最后出现的位置。

当遇到重复字符时,将窗口的起始位置 start 移动到重复字符的下一个位置。每次迭代都更新最长长度 maxLength 。

在 main 函数中,我们调用 lengthOfLongestSubstring 函数并打印出结果。

这个函数适用于查找字符串中最长的无重复字符的子串,但它可以修改用于解决其他类型的滑动窗口问题。

8 计数问题

8.1 桶排序

桶排序(Bucket Sort)是一种分布式排序算法,它将数组分为多个桶,每个桶内使用其他排序算法(如插入排序)进行排序,然后合并各个桶中的数据。桶排序的关键在于如何合理地分配桶以及如何合并桶中的数据。

以下是一个C语言实现的桶排序的关键函数示例:

#include <stdio.h>

#include <stdlib.h>

#include <math.h>

// 函数声明

void bucketSort(float arr\[\], int n);

// 桶排序的关键函数

void bucketSort(float arr\[\], int n) {

// 创建桶

float *bucketsn; // 桶数组

for (int i = 0; i < n; i++) {

bucketsi = (float *)malloc(n * sizeof(float)); // 为每个桶分配内存

bucketsi0 = 0; // 初始化桶的计数为0

}

// 将数组元素分配到各个桶中

for (int i = 0; i < n; i++) {

int idx = (int)(n * arri); // 计算元素应该放入哪个桶

bucketsidx++buckets\[idx0] = arri; // 将元素放入桶中,并更新桶的计数

}

// 对每个桶进行排序,这里使用插入排序

for (int i = 0; i < n; i++) {

int size = bucketsi0;

for (int j = 1; j < size; j++) {

for (int k = j; k > 0 && bucketsik < bucketsik - 1; k--) {

float temp = bucketsik;

bucketsik = bucketsik - 1;

bucketsik - 1 = temp;

}

}

}

// 合并桶中的数据

int idx = 0;

for (int i = 0; i < n; i++) {

for (int j = 0; j < bucketsi0; j++) {

arridx++ = bucketsij;

}

}

// 释放桶的内存

for (int i = 0; i < n; i++) {

free(bucketsi);

}

}

// 主函数

int main() {

float arr\[\] = {0.78, 0.17, 0.39, 0.26, 0.72, 0.94, 0.21, 0.12, 0.23, 0.68};

int n = sizeof(arr) / sizeof(arr0);

bucketSort(arr, n);

printf("排序后的数组: \n");

for (int i = 0; i < n; i++) {

printf("%0.2f ", arri);

}

printf("\n");

return 0;

}

在这个示例中, bucketSort 函数接受一个浮点数数组 arr 和数组的长度 n 作为参数。它首先创建一个桶数组,并将数组元素分配到各个桶中。然后,对每个桶内的数据使用插入排序算法进行排序。最后,将所有桶中的数据合并回原数组。

在 main 函数中,我们定义了一个浮点数数组 arr ,调用 bucketSort 函数对其进行排序,并打印排序后的数组。

请注意,这个桶排序的实现假设数组的元素在 [0, 1) 区间内。如果数组的元素范围不同,可能需要调整桶的分配策略。此外,为了简化实现,每个桶的大小与原数组相同,这不是最优化的内存使用方式,但可以确保有足够的空间存储每个桶中的元素。

8.2 计数排序

对整数数组进行排序,基于元素出现的次数。

void countSort(int arr\[\], int n) {

int max = 0;

for (int i = 0; i < n; i++) {

if < n; i++) {

ifarrarri > max) max = arri;

}

int countmax+1;

for (int i = 0; i <= max; i++) {

counti = 0;

}

for (int i = 0; i < n; i++) {

countarr\[i]++;

}

int index = 0;

for (int i = 0; i <= max; i++) {

while (counti > 0) {

arrindex++ = i;

counti--;

}

}

}

9 前缀和

用于快速计算数组的子数组和,常用于解决区间查询问题。

void prefixSum(int arr\[\], int n) {

int prefixn;

prefix0 = arr0;

for (int i = 1; i < n; i++) {

prefixi = prefixi-1 + arri;

}

// prefixi now contains sum of arr0...i

}

10 堆

10.1 优先队列

使用数组实现的堆结构,可以快速获取最大或最小元素。

最大堆调整

void maxHeapify(int arr\[\], int n, int i) {

int largest = i;

int l = 2*i + 1;

int r = 2*i + 2;

if (l < n && arrl > arrlargest)

largest = l;

if (r < n && arrr > arrlargest)

largest = r;

if (largest != i) {

swap(&arri, &arrlargest);

maxHeapify(arr, n, largest);

}

}

11 并查集

用于处理一些不交集的合并及查询问题。

int find(int i, int parent\[\]) {

if (parenti == -1)

return i;

return find(parenti, parent);

}

void Union(int x, int y, int parent\[\]) {

int xset = find(x, parent);

int yset = find(y, parent);

if(xset != yset){

parentxset = yset;

}

}

12 双指针

用于解决数组中的问题,如"反转字符串"、"判断回文链表"。

12.1 反转字符串

void reverseString(char* s) {

int i = 0, j = strlen(s) - 1;

while (i < j) {

char temp = si;

si = sj;

sj = temp;

i++;

j--;

}

}

数组的应用非常广泛,不同的算法根据问题的特性选择不同的数据结构和方法。数组由于其简单性和高效的随机访问特性,在算法设计中扮演着重要角色。

相关推荐
Darling噜啦啦10 小时前
列表转树算法深度解析:从 Map 到 Reduce 的两种实现,面试高频考点
数据结构·算法·面试
小小工匠1 天前
Redis - 事务机制:能实现 ACID 属性吗
数据结构·redis·性能优化·并发·持久化
玖玥拾1 天前
C/C++ 数据结构(七)栈、容器适配器
c语言·数据结构·c++··容器适配器
Qres8212 天前
算法复键——树状数组
数据结构·算法
牛油果子哥q2 天前
并查集(DSU)超精讲,路径压缩、按秩合并、万能模板、连通性判定、最小生成树与刷题实战全解
数据结构·c++·最小生成树·并查集
凌波粒2 天前
LeetCode--491.递增子序列(回溯算法)
数据结构·算法·leetcode
WL学习笔记2 天前
单项不带头不循环链表
数据结构·链表
小糯米6012 天前
JS 数组
数据结构·算法·排序算法
小欣加油2 天前
leetcode3612 用特殊操作处理字符串I
数据结构·c++·算法·leetcode·职场和发展
凌波粒2 天前
LeetCode--90.子集II(回溯算法)
数据结构·算法·leetcode