动态规划-最长公共子串(c)

动态规划

动态规划(dynamic programming)是一种算法设计方法。基本思想是在对一个问题的多阶段决策中,按照某一顺序,根据每一步所选决策的不同,会引起状态的转移,最后会在变化的状态中获取到一个决策序列。

上面这段话是比较官方的术语描述,还可以这样从编程层面理解:动态规划一般用于求解具有重叠子问题和最优子结构特性的问题。它通过将大问题分解为小问题,并存储小问题的解(通常在一个表格中),避免了重复计算,从而提高了效率。动态规划可以应用于许多类型的问题,包括但不限于最优化问题、计数问题和决策问题。

最长公共子串

比较2个字符串,找出最长的公共子串,这就是最长公共子串问题(longest common substring, 简lcs)。

本文描述的最长子串问题,还有一个输出限制:若存在多个最长公共子串,输出在较短字符串中最先出现的那个lcs。这个限制简化了问题,让我们专注在寻找lcs的算法本源上。

动态规划思路:使用一个二维数组dp_cs记录字符串a和b比较的中间结果,其中dp_csi+1j+1表示a0~i与b0~j比较,以ai和bj结尾的最长子串的长度。如果ai==bj,那么dp_csi+1j+1 = dpij + 1,否则dp_csi+1j+1 = 0。

代码如下:

c 复制代码
char *dp_longest_common_substring(const char *a, const char *b) {
    int len_a = strlen(a), len_b = strlen(b), maxLen = 0, endPos = 0;
    int dp_cs[len_a + 1][len_b + 1];
    memset(dp_cs, 0, sizeof(dp_cs)); // 默认都为0
    for (int i = 0; i < len_a; i++) {
        for (int j = 0; j < len_b; j++) {
            if (a[i] == b[j]) {
                dp_cs[i + 1][j + 1] = dp_cs[i][j] + 1;
                if (dp_cs[i + 1][j + 1] > maxLen) {
                    maxLen = dp_cs[i + 1][j + 1];   // 记录最长的子串长度
                    endPos = len_a > len_b ? j : i; // 记录最长子串的位置(在最短字符串中的结束位置)
                }
            }
        }
    }
    if (maxLen > 0) {
        char *substr = (char *)malloc(maxLen + 1); // 注意返回的子串需要free掉,否则内存泄漏
        strncpy(substr, len_a > len_b ? &b[endPos - maxLen + 1] : &a[endPos - maxLen + 1], maxLen);
        substr[maxLen] = '\0';
        return substr;
    }
    return NULL;
}

测试代码:

c 复制代码
int test_lcs(int argc, char **argv) {
    string str1s[] = {"123123", "123213", "3243522", "35qeaaaafu", "12aaaaiul"};
    string str2s[] = {"123123", "123213", "3243522", "qeaaaaf", "aaaaiu"};
    for (int i = 0; i < sizeof(str1s) / sizeof(str1s[0]); i++) {
        char *lcs = dp_longest_common_substring(str1s[i].c_str(), str2s[i].c_str());
        if (lcs == NULL) {
            printf(">>>> case[%02d] has no lcs\n", i + 1);
            continue;
        }
        printf(">>>> case[%02d] lcs: '%s'\n", i + 1, lcs);
        free(lcs);
    }
    return 0;
}

测试输出:

相关推荐
草莓熊Lotso41 分钟前
【CMake】静态库的编译、链接与引用全解析
linux·c语言·数据库·c++·软件工程·cmake
少司府43 分钟前
C++进阶:继承
c语言·开发语言·c++·继承·组合·虚继承
社交怪人1 小时前
【偶数】信息学奥赛一本通C语言解法(题号2051)
c语言
Bluetooth73012 小时前
c语言一维数组
c语言
QiLinkOS13 小时前
【从实验室到商业战场:发明专利如何重塑科技与企业的共生生态】
大数据·c语言·数据结构·c++·人工智能·单片机·算法
一抹晴空15 小时前
Keil MDK AC6 compiler编译报错,与AC5区别
c语言·arm开发·单片机
青山师15 小时前
动态规划算法深度解析:从状态转移方程到工业级优化
数据结构·算法·面试·动态规划·代理模式·java面试
czhaii16 小时前
单片机伺服电机加减速控制子程序
c语言·单片机
qq_3331209717 小时前
C++高并发内存池的整体设计和实现思路_C 语言
java·c语言·c++
luj_176817 小时前
残熵算法的稳健防灾逻辑
c语言·开发语言·c++·经验分享·算法