【dp力扣】环绕字符串中唯一的子字符串

题目链接

题目:

java 复制代码
class Solution {
    public int findSubstringInWraproundString(String s) {

    }
}

审题:

给定base这个字符串,它是"abcd......xyz"围成的一个环形无线长度的字符串(只有小写的26个字母)。

在给定一个字符串s,题目要求计算:在s串中的所有的子串(至少包含一个字符)中,有多少个子串在base串中出现过

示例:

细节注意:

在示例二中,我们要知道重复出现的字符我们只记录一次!!!

尽管'cac'中两个c都存在于base串中,但是只算一个。

状态表示:

dp[i]:

[i]表示,以[0,i]为范围,i位置为结尾,所有子数组在base串中出现的总次数。

java 复制代码
class Solution {
    public int findSubstringInWraproundString(String s) {
         
            
             //把字符串变成字符数组,等一下好操作。
             char[] sArr=s.toCharArray(); 
 
                   int n=sArr.length;


            //dp[i]表示,以[0,i]为范围,i位置为结尾,所有子数组在base串中出现的总次数。
            int[] dp=new int[n];

          
    }
}

通过dp计算正确答案(先讲)

这里我们先不推导状态方程,暂且假设dp数组已经被我们填表完成了。

依据这个dp数组,如何求出答案所需要的子数组出现的总次数呢?

一些童鞋可能会直接说dp数组求和即可。按照经验的确如此,刚开始我也是这样想的。

但,事出反常必有妖。

当前这个问题是解决这个算法的重要环节,所以我放到这里讲。

刚才小编在示例处强调过,重复的字符只能计算一次!所以如果直接对dp求和,那么结果只能是>=正确答案(因为加上了重复的次数)。

比如,s="abdb",在dp数组中dp[1]dp和dp[3](dp[i]含义,请看上面代码注释)两个值一定有重复的计数,因为"ab"和"abdb"中都有b这个字符。因此如果是简单的dp求和,结果可能就会比正确答案大。

如何避免重复计数的情况发生呢?(注意下面的内容第一次听可能有点绕,但不难,细心听几遍就懂了)

可以使用哈希的思想避免重复计数。

题目提示说了,s和base一样都是小写的字母,所以定义一个哈希表:

java 复制代码
class Solution {
    public int findSubstringInWraproundString(String s) {
         
            
             //把字符串变成字符数组,等一下好操作。
             char[] sArr=s.toCharArray(); 
 
                   int n=sArr.length;


            //dp[i]表示,以[0,i]为范围,i位置为结尾,所有子数组在base串中出现的总次数。
            int[] dp=new int[n];

            这里假定dp数组已经填表完毕了!!



            //确定返回值(用于去重)
            int[] hash=new int[26];

 
    }
}

把dp表映射到hash表中,hash求和就是答案了(映射前hash的每一个元素都是0)。

那么dp表怎么映射到hash表中呢?

实际上,借助字符数组sArr即可:

hash[0]对应的是sArr[i]=='a'

hash[1对应的是sArr[j]=='b'

所以:

hash[0]=sArr[i]

hash[1]=sArr[j]

不过,以上这种模式并没有实现去重。

如果sArr[i]和sArr[j]都等于'b',怎么办?

这实际上就回到了刚才的"abdb"中,dp[1]和dp[3]出现重复计数的问题了。

其实很简单,直接取最大值:max(dp[1],dp[3])即可。

为什么呢?

dp[i]表示,以[0,i]为范围,i位置为结尾,所有子数组在base串中出现的总次数。

而dp[3]实际上已经包含了子数组dp[1]中的所有情况,

也就是说如果i<j,s[i]==s[j],那么一定有:dp[i]<dp[j]!(细细理解这句话)

java 复制代码
class Solution {
    public int findSubstringInWraproundString(String s) {
         
            
             //把字符串变成字符数组,等一下好操作。
             char[] sArr=s.toCharArray(); 
 
                   int n=sArr.length;


            //dp[i]表示,以[0,i]为范围,i位置为结尾,所有子数组在base串中出现的总次数。
            int[] dp=new int[n];

            这里假定dp数组已经填表完毕了!!

    

            //确定返回值
            int[] hash=new int[26];

                //开始把dp映射到hash(用于去重)
            for(int i=0;i<n;i++){
                hash[sArr[i]-'a']=Math.max(hash[sArr[i]-'a'],dp[i]);
            }

            //hash求和就是答案
            int sum=0;
            for(int h:hash){
                sum+=h;
            }

        return sum;
    }
}

状态方程的初始化以及推导

在回顾以下状态表示dp[i]:[i]表示,以[0,i]为范围,i位置为结尾,所有子数组在base串中出现的总次数。

所以dp[i]和dp[i-1]有什么关系呢?

倘若两个字符s[i]和s[i-1]是连续的,即s[i-1]+1!=s[i](ASCII码)并且s[i-1]!='z'且s[i]!='a'。那么dp[i]=dp[i-1]+1。(以i为结尾,实际上,也就增加了s[i]这一个字母)

反之,如果不满足粗体条件,dp[i]=1。

如下AC代码:

java 复制代码
class Solution {
    public int findSubstringInWraproundString(String s) {
         
            
             //把字符串变成字符数组,等一下好操作。
             char[] sArr=s.toCharArray(); 
 
                   int n=sArr.length;


            //dp[i]表示,以[0,i]为范围,i位置为结尾,所有子数组在base串中出现的总次数。
            int[] dp=new int[n];

            这里假定dp数组已经填表完毕了!!

            dp[0]=1;//涉及i-1,只需要把这个初始化即可!!!!
            for(int i=1;i<n;i++){
                if(sArr[i-1]+1==sArr[i]||(sArr[i-1]=='z'&&sArr[i]=='a')){
                        dp[i]=dp[i-1]+1;
                    }
                else dp[i]=1;
            }

            //确定返回值
            int[] hash=new int[26];

                //开始把dp映射到hash(用于去重)
            for(int i=0;i<n;i++){
                hash[sArr[i]-'a']=Math.max(hash[sArr[i]-'a'],dp[i]);
            }

            //hash求和就是答案
            int sum=0;
            for(int h:hash){
                sum+=h;
            }

        return sum;
    }
}
相关推荐
凌肖战9 分钟前
力扣上刷题之C语言实现(数组)
c语言·算法·leetcode
秋夫人35 分钟前
B+树(B+TREE)索引
数据结构·算法
梦想科研社1 小时前
【无人机设计与控制】四旋翼无人机俯仰姿态保持模糊PID控制(带说明报告)
开发语言·算法·数学建模·matlab·无人机
Milo_K1 小时前
今日 leetCode 15.三数之和
算法·leetcode
Darling_001 小时前
LeetCode_sql_day28(1767.寻找没有被执行的任务对)
sql·算法·leetcode
AlexMercer10121 小时前
【C++】二、数据类型 (同C)
c语言·开发语言·数据结构·c++·笔记·算法
Greyplayground1 小时前
【算法基础实验】图论-BellmanFord最短路径
算法·图论·最短路径
蓑 羽1 小时前
力扣438 找到字符串中所有字母异位词 Java版本
java·算法·leetcode
源代码:趴菜1 小时前
LeetCode63:不同路径II
算法·leetcode·职场和发展
严格格2 小时前
三范式,面试重点
数据库·面试·职场和发展