力扣 187. 重复的DNA序列

1.题目

DNA序列 由一系列核苷酸组成,缩写为 'A', 'C', 'G' 和 'T'.。

例如,"ACGAATTCCG" 是一个 DNA序列 。

在研究 DNA 时,识别 DNA 中的重复序列非常有用。

给定一个表示 DNA序列 的字符串 s ,返回所有在 DNA 分子中出现不止一次的 长度为 10 的序列(子字符串)。你可以按 任意顺序 返回答案。
示例 1:

输入:s = "AAAAACCCCCAAAAACCCCCCAAAAAGGGTTT"

输出:["AAAAACCCCC","CCCCCAAAAA"]
示例 2:

输入:s = "AAAAAAAAAAAAA"

输出:["AAAAAAAAAA"]
提示:

0 <= s.length <= 10^5

s[i]=='A'、'C'、'G' or 'T'
来源:力扣(LeetCode)

2.思路及代码

返回所有在 DNA 分子中出现不止一次的 长度为 10 的序列,即统计不同子字符串的出现的次数,并将出现次数大于1的储存起来。至于如何统计就要用到STL中的map或unordered_map,简单来讲,两者储存的元素都是键(第一个元素)值(第二个元素)对,比如:map<int, int>就类似于vector<int>,而map<string, int>就可以通过string来查询int。至于两者的区别,map的内部是一个红黑树,会根据键的大小自动排序,unordered_map的内部则是哈希表,查找效率更高但更占内存。(具体可看大佬)显然这题用unordered_map更好,但map也不会超时。代码如下:

cpp 复制代码
class Solution {
public:
    vector<string> findRepeatedDnaSequences(string s) {
        //当s的长度小于等于10直接返回空数组
        if (s.size() <= 10) return {};
        vector<string>arr;
        unordered_map<string, int>mp;
        string::iterator it = s.begin();
        //遍历字符串,统计所有长度为10的字符串
        for (; it <= s.end() - 10; ++it) {
            string tmp(it, it + 10);
            ++mp[tmp];
        }
        unordered_map<string, int>::iterator it_map = mp.begin();
        //将出现次数超过1的字符串加入数组
        for (; it_map != mp.end(); ++it_map) {
            if (it_map->second > 1) {
                arr.push_back(it_map->first);
            }
        }
        return arr;
    }
};

map的运行结果:

unordered_map的运行结果:

相关推荐
ゞ 正在缓冲99%…9 分钟前
leetcode76.最小覆盖子串
java·算法·leetcode·字符串·双指针·滑动窗口
xuanjiong10 分钟前
纯个人整理,蓝桥杯使用的算法模板day2(0-1背包问题),手打个人理解注释,超全面,且均已验证成功(附带详细手写“模拟流程图”,全网首个
算法·蓝桥杯·动态规划
Zhichao_9727 分钟前
【UE5 C++课程系列笔记】33——商业化Json读写
c++·ue5
惊鸿.Jh29 分钟前
【滑动窗口】3254. 长度为 K 的子数组的能量值 I
数据结构·算法·leetcode
明灯L29 分钟前
《函数基础与内存机制深度剖析:从 return 语句到各类经典编程题详解》
经验分享·python·算法·链表·经典例题
碳基学AI35 分钟前
哈尔滨工业大学DeepSeek公开课:探索大模型原理、技术与应用从GPT到DeepSeek|附视频与讲义免费下载方法
大数据·人工智能·python·gpt·算法·语言模型·集成学习
补三补四39 分钟前
机器学习-聚类分析算法
人工智能·深度学习·算法·机器学习
独好紫罗兰1 小时前
洛谷题单3-P5718 【深基4.例2】找最小值-python-流程图重构
开发语言·python·算法
云边有个稻草人1 小时前
【C++】第八节—string类(上)——详解+代码示例
开发语言·c++·迭代器·string类·语法糖auto和范围for·string类的常用接口·operator[]
正脉科工 CAE仿真1 小时前
基于ANSYS 概率设计和APDL编程的结构可靠性设计分析
人工智能·python·算法