题目
给你一个整数数组 nums 和一个整数 k ,请你返回其中出现频率前 k 高的元素。你可以按 任意顺序 返回答案。
示例 1:
输入:nums = [1,1,1,2,2,3], k = 2
输出:[1,2]
示例 2:
输入:nums = [1], k = 1
输出:[1]
示例 3:
输入:nums = [1,2,1,2,1,2,3,1,3,2], k = 2
输出:[1,2]
题解
java
class Solution {
public int[] topKFrequent(int[] nums, int k) {
// 第一步:统计每个元素的出现次数
Map<Integer, Integer> cnt = new HashMap<>();
for (int x : nums) {
cnt.merge(x, 1, Integer::sum); // cnt[x]++
}
int maxCnt = Collections.max(cnt.values());
// 第二步:把出现次数相同的元素,放到同一个桶中
List<Integer>[] buckets = new ArrayList[maxCnt + 1];
Arrays.setAll(buckets, _ -> new ArrayList<>());
for (Map.Entry<Integer, Integer> e : cnt.entrySet()) {
buckets[e.getValue()].add(e.getKey());
}
// 第三步:倒序遍历 buckets,把出现次数前 k 大的元素加入答案
int[] ans = new int[k];
int j = 0;
for (int i = maxCnt; i >= 0 && j < k; i--) {
// 注意题目保证答案唯一,一定会出现某次循环结束后 j 恰好等于 k 的情况
for (int x : buckets[i]) {
ans[j++] = x;
}
}
return ans;
}
}
解析
出自:桶排序,O(n) 线性做法(Python/Java/C++/Go/JS/Rust)
java
class Solution {
public int[] topKFrequent(int[] nums, int k) { // 定义主函数topKFrequent接受两个参数,整型数组和整数k
Map<Integer, Integer> cnt = new HashMap<>(); // 创建HashMap cnt用于存储每个数字的出现次数。这相当于C++中的unordered_map<int, int>
for (int x : nums) { // 遍历nums数组,统计其中每个元素(整型变量x)的频率
cnt.merge(x, 1, Integer::sum); // HashMap中的合并操作。如果键x存在,则将与其关联的值增加1;否则创建一个新条目并将其初始化为整数1。这相当于C++中的unordered_map[x]++或cnt[x] = cnt[x] + 1
} // 如果不使用merge函数,我们需要先检查键是否存在然后再增加计数
int maxCnt = Collections.max(cnt.values()); // 计算出现次数最大的元素的频率
List<Integer>[] buckets = new ArrayList[maxCnt + 1]; // 声明并初始化一个ArrayList数组buckets,用于存储有序号(计数)的列表。这相当于C++中的vector<list<int>> buckets(max + 1)
Arrays.setAll(buckets, _ -> new ArrayList<>()); // 对每个桶进行初始化,以便将其转换为ArrayList对象。这等价于C++中对每个buckets[i] = new ArrayList()的操作
for (Map.Entry<Integer, Integer> e : cnt.entrySet()) { // 遍历HashMap cnt
buckets[e.getValue()].add(e.getKey()); // 将出现次数为e.getValue()的元素添加到buckets中相应位置的列表中。这相当于C++中的"桶排序"或使用索引来将计数映射到该计数对应集合中的项
} // e是一个对象,用于获取键值和值
int[] ans = new int[k]; // 定义长度为k的整型数组ans以存储答案
int j = 0; // 初始化j为0
for (int i = maxCnt;i >= 0 && j < k;i--) { // 反向遍历buckets数组。这相当于从出现次数最大的计数开始,直到0(包括零)以i递增的方式来减小i直到0
for (int x : buckets[i]) { // 对于每个桶中的元素x
ans[j++] = x; // 将x添加到ans中。这相当于在答案数组的第j个位置上放入此数字
} // 然后递增计数器j,直到达到所要求的大小k
} // 这种方法确保出现次数最多的元素首先被考虑(因为我们在反向遍历buckets)。当找到答案时退出循环以避免越界情况并遵守k的限制条件
return ans; // 返回整型ans数组,其中包含前k个出现频率最高的数字
} // 由于问题保证存在这样的答案,代码不必检查j是否等于k。该方法的时间复杂度为O(n),空间复杂度也为O(n),其中n是输入的大小。
} // 因为需要保存所有元素的计数来构建桶排序,并最终构造答案数组前k个出现频率最高的元素。这种方法利用了哈希映射和桶排序将大量数据组织成更易处理或可视化的块的方法。