【算法分析与设计】找到字符串中所有字母异位词

题目

给定两个字符串 sp,找到 s中所有 p异位词的子串,返回这些子串的起始索引。不考虑答案输出的顺序。

异位词指由相同字母重排列形成的字符串(包括相同的字符串)。

示例

示例 1:

复制代码
输入: s = "cbaebabacd", p = "abc"
输出: [0,6]
解释:
起始索引等于 0 的子串是 "cba", 它是 "abc" 的异位词。
起始索引等于 6 的子串是 "bac", 它是 "abc" 的异位词。

示例 2:

复制代码
输入: s = "abab", p = "ab"
输出: [0,1,2]
解释:
起始索引等于 0 的子串是 "ab", 它是 "ab" 的异位词。
起始索引等于 1 的子串是 "ba", 它是 "ab" 的异位词。
起始索引等于 2 的子串是 "ab", 它是 "ab" 的异位词。

方案一:

算法设计与分析

在字符串s中找到给定字符串p的所有字母异位词的Java解决方案。findAnagrams方法遍历s中每个长度为p的可能子字符串,并使用isTrue方法检查它是否是p的字母异位词。isTrue方法对两个字符串的字符数组进行排序,然后进行比较。

算法实现
java 复制代码
class Solution {
    public List<Integer> findAnagrams(String s, String p) {
        String str;
        List<Integer> list=new ArrayList();
        for(int i=0;i<s.length();i++){
            if(i>s.length()-p.length()){
                break;
            }
            str=s.substring(i,i+p.length());
            if(isTrue(str,p)){
                list.add(i);
            }
        }

        return list;
    }
    public Boolean isTrue(String p,String q){
    
        char[] parr= p.toCharArray();
        char[] qarr= q.toCharArray();
        Arrays.sort(parr);
        Arrays.sort(qarr);
        String ps=new String(parr);
        String qs=new String(qarr);
        
        return ps.equals(qs)?true:false;

    }
}
运行结果:

超时。。。

调优

思想(优化后的算法)

采用的是滑动窗口(Sliding Window)算法,这是一种常见的解决子字符串或子数组问题的技术。滑动窗口算法通过维护一个可变大小的窗口在序列上滑动,并在每个位置上执行必要的操作,从而达到解决问题的目的。

在这个具体的问题中,滑动窗口的目标是找到字符串 s 中所有是字符串 p 的字母异位词的子串的起始索引。这里的关键思想是使用两个数组 pCountwindowCount 来分别统计字符串 p 和当前滑动窗口中子字符串的字符频率。

滑动窗口算法通常具有较好的时间复杂度,因为在每一步中,只需要对窗口中新增或移除的元素进行常量时间的操作。在这个特定问题中,使用滑动窗口避免了对整个字符串进行排序,从而将时间复杂度降低到线性级别。

算法调优
  1. 字符频率统计:

    • 使用两个整数数组pCountwindowCount,分别用于统计字符串p和滑动窗口中当前子字符串的字符频率。这两个数组的索引对应字母表中的字母,而数组中的值表示相应字母的出现次数。
  2. 初始化 pCount

    • 在第一个循环中,对字符串p进行遍历,并更新pCount数组中相应字母的频率。
  3. 滑动窗口:

    • 在第二个循环中,遍历字符串s。对于每个字符,将其在windowCount中的频率递增。
    • 如果窗口的大小超过了p的长度,就需要将窗口最左侧字符在windowCount中的频率递减,以保持窗口大小不变。
    • 这样,我们通过一个固定大小的窗口在字符串s上滑动,每次只更新一个字符的频率,而不是重新计算整个子字符串的频率。
  4. 比较频率:

    • 在每一步,通过比较pCountwindowCount数组是否相等来检查当前子字符串是否为p的字母异位词。
    • 如果相等,表示找到了一个字母异位词的起始索引。

通过这种方式,避免了对字符串进行排序,而是通过数组直接比较字符频率,大大提高了算法的效率。这种滑动窗口的方法在处理子字符串问题时通常非常有效,因为它在遍历过程中只对每个字符进行一次操作。

思路图

删去c 加入e如下变换

其他类推...

代码实现
java 复制代码
import java.util.ArrayList;
import java.util.Arrays;
import java.util.List;

class Solution {
    public List<Integer> findAnagrams(String s, String p) {
        List<Integer> result = new ArrayList<>();

        int[] pCount = new int[26];
        int[] windowCount = new int[26];

        for (char ch : p.toCharArray()) {
            pCount[ch - 'a']++;
        }

        for (int i = 0; i < s.length(); i++) {
            windowCount[s.charAt(i) - 'a']++;

            if (i >= p.length()) {
                windowCount[s.charAt(i - p.length()) - 'a']--;
            }

            if (Arrays.equals(pCount, windowCount)) {
                result.add(i - p.length() + 1);
            }
        }

        return result;
    }
}
运行结果
相关推荐
艾莉丝努力练剑几秒前
【Linux指令 (二)】不止于入门:探索Linux系统核心与指令的深层逻辑,理解Linux系统理论核心概念与基础指令
linux·服务器·数据结构·c++·centos
深栈10 分钟前
机器学习:支持向量机
算法·机器学习·支持向量机
it技术14 分钟前
[入门精通] TLjava高薪扩展训练VIP系列179G69
java
ZhengEnCi15 分钟前
ObjectUtils.isEmpty 完全指南-从入门到精通的 Java 空值判断利器
java·后端
FreeBuf_19 分钟前
Happy DOM曝CVSS 9.4严重RCE漏洞,PoC已公开(CVE-2025-61927)
java·c语言·c++·python·php
刘海东刘海东20 分钟前
结构型智能科技理论研究(草稿)
科技·算法
自由的疯27 分钟前
优雅的代码java
java·后端·面试
C嘎嘎嵌入式开发31 分钟前
(10)100天python从入门到拿捏《Python中的数据结构与自定义数据结构》
数据结构·python·算法
熬了夜的程序员32 分钟前
【LeetCode】69. x 的平方根
开发语言·算法·leetcode·职场和发展·动态规划
一只小风华~39 分钟前
Vue Router 导航守卫
java·前端·javascript·vue.js·笔记·html