题目
DNA序列 由一系列核苷酸组成,缩写为 'A', 'C', 'G' 和 'T'.。
例如,"ACGAATTCCG" 是一个 DNA序列 。
在研究 DNA 时,识别 DNA 中的重复序列非常有用。
给定一个表示 DNA序列 的字符串 s ,返回所有在 DNA 分子中出现不止一次的 长度为 10 的序列(子字符串)。你可以按 任意顺序 返回答案。
解题思路
- 遍历将字符串每十个字符分割成一个字符串存储到Map中进行统计出现次数;
- 将出现次数超过1次的存储到list当中输出。
代码展示
java
class Solution {
public List<String> findRepeatedDnaSequences(String s) {
Map<String,Integer> data = new HashMap<>();
for (int i = 0; i <= s.length() - 10; i++){
String str = s.substring(i, i + 10);
Integer temp = data.getOrDefault(str, 0);
data.put(str, temp + 1);
}
List<String> ans = new ArrayList<>();
for (String str : data.keySet()){
if(data.get(str) > 1){
ans.add(str);
}
}
return ans;
}
}