动态规划-最长公共子串(c)

动态规划

动态规划(dynamic programming)是一种算法设计方法。基本思想是在对一个问题的多阶段决策中,按照某一顺序,根据每一步所选决策的不同,会引起状态的转移,最后会在变化的状态中获取到一个决策序列。

上面这段话是比较官方的术语描述,还可以这样从编程层面理解:动态规划一般用于求解具有重叠子问题和最优子结构特性的问题。它通过将大问题分解为小问题,并存储小问题的解(通常在一个表格中),避免了重复计算,从而提高了效率。动态规划可以应用于许多类型的问题,包括但不限于最优化问题、计数问题和决策问题。

最长公共子串

比较2个字符串,找出最长的公共子串,这就是最长公共子串问题(longest common substring, 简lcs)。

本文描述的最长子串问题,还有一个输出限制:若存在多个最长公共子串,输出在较短字符串中最先出现的那个lcs。这个限制简化了问题,让我们专注在寻找lcs的算法本源上。

动态规划思路:使用一个二维数组dp_cs记录字符串a和b比较的中间结果,其中dp_cs[i+1][j+1]表示a[0~i]与b[0~j]比较,以a[i]和b[j]结尾的最长子串的长度。如果a[i]==b[j],那么dp_cs[i+1][j+1] = dp[i][j] + 1,否则dp_cs[i+1][j+1] = 0。

代码如下:

c 复制代码
char *dp_longest_common_substring(const char *a, const char *b) {
    int len_a = strlen(a), len_b = strlen(b), maxLen = 0, endPos = 0;
    int dp_cs[len_a + 1][len_b + 1];
    memset(dp_cs, 0, sizeof(dp_cs)); // 默认都为0
    for (int i = 0; i < len_a; i++) {
        for (int j = 0; j < len_b; j++) {
            if (a[i] == b[j]) {
                dp_cs[i + 1][j + 1] = dp_cs[i][j] + 1;
                if (dp_cs[i + 1][j + 1] > maxLen) {
                    maxLen = dp_cs[i + 1][j + 1];   // 记录最长的子串长度
                    endPos = len_a > len_b ? j : i; // 记录最长子串的位置(在最短字符串中的结束位置)
                }
            }
        }
    }
    if (maxLen > 0) {
        char *substr = (char *)malloc(maxLen + 1); // 注意返回的子串需要free掉,否则内存泄漏
        strncpy(substr, len_a > len_b ? &b[endPos - maxLen + 1] : &a[endPos - maxLen + 1], maxLen);
        substr[maxLen] = '\0';
        return substr;
    }
    return NULL;
}

测试代码:

c 复制代码
int test_lcs(int argc, char **argv) {
    string str1s[] = {"123123", "123213", "3243522", "35qeaaaafu", "12aaaaiul"};
    string str2s[] = {"123123", "123213", "3243522", "qeaaaaf", "aaaaiu"};
    for (int i = 0; i < sizeof(str1s) / sizeof(str1s[0]); i++) {
        char *lcs = dp_longest_common_substring(str1s[i].c_str(), str2s[i].c_str());
        if (lcs == NULL) {
            printf(">>>> case[%02d] has no lcs\n", i + 1);
            continue;
        }
        printf(">>>> case[%02d] lcs: '%s'\n", i + 1, lcs);
        free(lcs);
    }
    return 0;
}

测试输出:

相关推荐
悲伤小伞36 分钟前
C++_数据结构_详解二叉搜索树
c语言·数据结构·c++·笔记·算法
佳心饼干-4 小时前
C语言-09内存管理
c语言·算法
物联网牛七七4 小时前
4、数据结构与算法解析(C语言版)--栈
c语言·栈操作
F-2H6 小时前
C语言:指针4(常量指针和指针常量及动态内存分配)
java·linux·c语言·开发语言·前端·c++
余额不足1213810 小时前
C语言基础十六:枚举、c语言中文件的读写操作
linux·c语言·算法
罗伯特祥11 小时前
C调用gnuplot绘图的方法
c语言·plot
嵌入式科普12 小时前
嵌入式科普(24)从SPI和CAN通信重新理解“全双工”
c语言·stm32·can·spi·全双工·ra6m5
虽千万人 吾往矣13 小时前
golang LeetCode 热题 100(动态规划)-更新中
算法·leetcode·动态规划
lqqjuly14 小时前
特殊的“Undefined Reference xxx“编译错误
c语言·c++
2401_8582861115 小时前
115.【C语言】数据结构之排序(希尔排序)
c语言·开发语言·数据结构·算法·排序算法