动态规划-最长公共子串(c)

动态规划

动态规划(dynamic programming)是一种算法设计方法。基本思想是在对一个问题的多阶段决策中,按照某一顺序,根据每一步所选决策的不同,会引起状态的转移,最后会在变化的状态中获取到一个决策序列。

上面这段话是比较官方的术语描述,还可以这样从编程层面理解:动态规划一般用于求解具有重叠子问题和最优子结构特性的问题。它通过将大问题分解为小问题,并存储小问题的解(通常在一个表格中),避免了重复计算,从而提高了效率。动态规划可以应用于许多类型的问题,包括但不限于最优化问题、计数问题和决策问题。

最长公共子串

比较2个字符串,找出最长的公共子串,这就是最长公共子串问题(longest common substring, 简lcs)。

本文描述的最长子串问题,还有一个输出限制:若存在多个最长公共子串,输出在较短字符串中最先出现的那个lcs。这个限制简化了问题,让我们专注在寻找lcs的算法本源上。

动态规划思路:使用一个二维数组dp_cs记录字符串a和b比较的中间结果,其中dp_cs[i+1][j+1]表示a[0~i]与b[0~j]比较,以a[i]和b[j]结尾的最长子串的长度。如果a[i]==b[j],那么dp_cs[i+1][j+1] = dp[i][j] + 1,否则dp_cs[i+1][j+1] = 0。

代码如下:

c 复制代码
char *dp_longest_common_substring(const char *a, const char *b) {
    int len_a = strlen(a), len_b = strlen(b), maxLen = 0, endPos = 0;
    int dp_cs[len_a + 1][len_b + 1];
    memset(dp_cs, 0, sizeof(dp_cs)); // 默认都为0
    for (int i = 0; i < len_a; i++) {
        for (int j = 0; j < len_b; j++) {
            if (a[i] == b[j]) {
                dp_cs[i + 1][j + 1] = dp_cs[i][j] + 1;
                if (dp_cs[i + 1][j + 1] > maxLen) {
                    maxLen = dp_cs[i + 1][j + 1];   // 记录最长的子串长度
                    endPos = len_a > len_b ? j : i; // 记录最长子串的位置(在最短字符串中的结束位置)
                }
            }
        }
    }
    if (maxLen > 0) {
        char *substr = (char *)malloc(maxLen + 1); // 注意返回的子串需要free掉,否则内存泄漏
        strncpy(substr, len_a > len_b ? &b[endPos - maxLen + 1] : &a[endPos - maxLen + 1], maxLen);
        substr[maxLen] = '\0';
        return substr;
    }
    return NULL;
}

测试代码:

c 复制代码
int test_lcs(int argc, char **argv) {
    string str1s[] = {"123123", "123213", "3243522", "35qeaaaafu", "12aaaaiul"};
    string str2s[] = {"123123", "123213", "3243522", "qeaaaaf", "aaaaiu"};
    for (int i = 0; i < sizeof(str1s) / sizeof(str1s[0]); i++) {
        char *lcs = dp_longest_common_substring(str1s[i].c_str(), str2s[i].c_str());
        if (lcs == NULL) {
            printf(">>>> case[%02d] has no lcs\n", i + 1);
            continue;
        }
        printf(">>>> case[%02d] lcs: '%s'\n", i + 1, lcs);
        free(lcs);
    }
    return 0;
}

测试输出:

相关推荐
钮钴禄·爱因斯晨36 分钟前
C语言 | 函数核心机制深度解构:从底层架构到工程化实践
c语言·开发语言·数据结构
爱学习的小邓同学1 小时前
数据结构 --- 队列
c语言·数据结构
啟明起鸣8 小时前
【网络编程】简易的 p2p 模型,实现两台虚拟机之间的简单点对点通信,并以小见大观察 TCP 协议的具体运行
c语言·网络·tcp/ip·p2p
秋说13 小时前
【PTA数据结构 | C语言版】线性表循环右移
c语言·数据结构·算法
芯岭技术14 小时前
MS32C001-C单片机,32位ARM M0+内核,宽电压、低功耗、小封装。
c语言·arm开发·单片机
minji...16 小时前
数据结构 算法复杂度(1)
c语言·开发语言·数据结构·算法
秋说17 小时前
【PTA数据结构 | C语言版】在顺序表 list 的第 i 个位置上插入元素 x
c语言·数据结构·list
楼田莉子18 小时前
数据学习之队列
c语言·开发语言·数据结构·学习·算法
秋说18 小时前
【PTA数据结构 | C语言版】返回单链表 list 中第 i 个元素值
c语言·数据结构·list
双叶83619 小时前
(C++)任务管理系统(正式版)(迭代器)(list列表基础教程)(STL基础知识)
c语言·开发语言·数据结构·c++·list