https://blog.csdn.net/2601_95366422/article/details/159113241
上节课链接
一.题目

二.思路讲解
2.1 思路讲解
如果沿用之前判断两个字符串是否为字母异位词 的方法,需要逐个比较字符出现次数,但在本题中,字符串数组可能包含多达 10^4 个字符串,两两比较显然不可行。
因此,我们需要一种更高效的分组策略 。字母异位词的本质是由相同字符以不同顺序组成 ,那么如果我们能将每个字符串标准化为一种统一的形式,所有互为异位词的字符串就会变成相同的标准化字符串。
这个标准化操作就是排序 :对每个字符串的字符按字典序排序,排序后得到的字符串就是该组的唯一标识 。例如,"eat"、"tea"、"ate"排序后都变成 "aet"。这样,我们就可以利用一个哈希表,以排序后的字符串为键,将原字符串加入对应的值(一个列表)中。遍历完所有字符串后,哈希表中的所有值即为分组结果。
三.代码演示
cpp
class Solution {
public:
vector<vector<string>> groupAnagrams(vector<string>& strs)
{
unordered_map<string,vector<string>>hash;
vector<vector<string>>ret;
//1.遍历元素然后排序
for(const auto& str : strs)
{
string tmp = str;
sort(tmp.begin(),tmp.end());//排序
hash[tmp].push_back(str);//把str给排一下序,相同的放一起,不过放的是原先的元素也就是没有排序的
}
//2.取出元素分组
for(const auto& [x,y] : hash)
{
ret.push_back(y);
}
return ret;
}
};
四.代码讲解
一、初始化哈希表
为了将互为字母异位词的字符串归类到一起,我们需要一个能够快速定位分组的结构。这里使用 unordered_map<string, vector<string>> 作为哈希表,其中键是字符串的排序后形式,值是一个列表,存放所有与该键对应的原始字符串。这样,所有排序后相同的字符串就会被自动归入同一个组。
二、遍历每个字符串并排序
遍历输入的字符串数组 strs,对于每一个字符串 str,执行以下操作:
-
创建一个临时字符串
tmp并将str复制给它(因为我们要排序,不能改变原字符串)。 -
对
tmp进行排序,使用sort(tmp.begin(), tmp.end())。排序后,所有字母异位词都会变成相同的字符串。例如,"eat"、"tea"、"ate" 排序后都变成 "aet"。 -
以排序后的
tmp作为键,在哈希表中找到对应的值(一个vector<string>),然后将原始字符串str添加到该数组中。这里利用了hash[tmp].push_back(str),如果该键不存在,会自动创建一个空数组。
三、提取分组结果
遍历完所有字符串后,哈希表中存储了若干键值对,每个键对应一组字母异位词。我们需要将这些值(即每组字符串的列表)收集起来,放入最终的结果 ret 中。使用范围 for 循环遍历哈希表,对于每一对 [x, y],将 y 添加到 ret 中。注意,这里 x 是排序后的字符串,我们不需要它,只需要值列表。
四、关键细节
- 排序的作用:通过排序将字母异位词标准化为同一个字符串,从而作为哈希表的键,这是本解法的核心。