【算法篇】哈希类(笔记)

目录

一、常见的三种哈希结构

[二、LeetCode 练习](#二、LeetCode 练习)

[1. 有效的字母异位词](#1. 有效的字母异位词)

[2. 两个数组的交集](#2. 两个数组的交集)

[3. 快乐数](#3. 快乐数)

[4. 两数之和](#4. 两数之和)

[5. 四数相加II](#5. 四数相加II)

[6. 赎金信](#6. 赎金信)

[7. 三数之和](#7. 三数之和)

[8. 四数之和](#8. 四数之和)


一、常见的三种哈希结构

当想使用哈希法来解决问题的时候,一般会选择如下三种数据结构。

  • 数组
  • set (集合)
  • map(映射)

在 C++ 中,set 和 map 分别提供以下三种数据结构:

当要使用集合来解决哈希问题的时候,优先使用 unordered_set,因为 它的查询 和 增删效率是 最优的,如果需要 集合是 有序的,那么就用 set,如果 要求不仅有序 还要 有重复 数据的话,那么就用 multiset。

二、LeetCode 练习

1. 有效的字母异位词

242. 有效的字母异位词 - 力扣(LeetCode)https://leetcode.cn/problems/valid-anagram/description/

给定两个字符串 s 和 t ,编写一个函数来判断 t 是否是 s 的字母异位词。

bash 复制代码
示例 1: 
输入: s = "anagram", t = "nagaram" 
输出: true

示例 2: 
输入: s = "rat", t = "car" 
输出: false

说明: 你可以假设字符串只包含小写字母。

思路:

定义一个数组叫做 record 用来上记录字符串 s 里字符出现的 次数。需要把字符映射到 数组也就是 哈希表 的索引下标上,因为字符 a 到字符 z 的 ASCII 是 26 个连续的 数值,所以字符 a 映射为 下标 0,相应的 字符 z 映射为 下标 25。再遍历 字符串 s 的时候,只需要将 s[i] - 'a' 所在的元素做 +1 操作即可,并不需要记住 字符 a 的 ASCII,只要 求出一个相对数值 就可以了。 这样就将 字符串 s 中字符出现的 次数,统计出来了。

同样在遍历 字符串 t 的时候,对 t 中出现的字符映射 哈希表索引上 的数值再做 -1 的操作。最后检查一下,record 数组如果有的元素 不为零 0,说明 字符串 s 和 t 一定是谁多了字符 或者 谁少了字符,return false。最后如果 record 数组所有 元素都为 0,说明 字符串 s 和 t 是字母异位词,return true。

cpp 复制代码
class Solution {
public:
    bool isAnagram(string s, string t) {
        int record[26] = {0};
        for(int i = 0; i < s.size(); i++)
        {
            record[s[i] - 'a']++;
        }
        for(int i = 0; i < t.size(); i++)
        {
            record[t[i] - 'a']--;
        }

        for(int i = 0; i < 26; i++)
        {
            if(record[i] != 0)
            {
                return false;
            }
        }
        return true;
    }
};

2. 两个数组的交集

349. 两个数组的交集 - 力扣(LeetCode)https://leetcode.cn/problems/intersection-of-two-arrays/description/

给定两个数组,编写一个函数来计算它们的交集。

bash 复制代码
示例 1:
输入:nums1 = [1,2,2,1], nums2 = [2,2]
输出:[2]

示例 2:
输入:nums1 = [4,9,5], nums2 = [9,4,9,8,4]
输出:[9,4]
解释:[4,9] 也是可通过的
思路:

输出结果中的每个元素一定是唯一的,也就是说输出的结果的去重的, 同时可以不考虑输出结果的顺序,所以这里使用 unordered_set 哈希结构。

cpp 复制代码
// 写法一
class Solution {
public:
    vector<int> intersection(vector<int>& nums1, vector<int>& nums2) {
        // 普通方法
        int record[1001] = {0};
        vector<int> result;
        for(int num1: nums1)
        {
            record[num1] = 1;
        }
        // 判断
        for(int num2: nums2)
        {
            if(record[num2] != 0)
            {
                result.push_back(num2);
                record[num2] = 0;
            }
        }
        return result;
    }
};



// 写法二
class Solution {
public:
    vector<int> intersection(vector<int>& nums1, vector<int>& nums2) {
        unordered_set<int> result_set; // 存放结果,之所以用set是为了给结果集去重
        unordered_set<int> nums_set(nums1.begin(), nums1.end());
        for (int num : nums2) 
        {
            // 发现nums2的元素 在nums_set里又出现过
            // 找到返回一个指向num元素的迭代器,否则返回特殊迭代器end()
            if (nums_set.find(num) != nums_set.end())  
            {
                result_set.insert(num);
            }
        }
        return vector<int>(result_set.begin(), result_set.end());
    }
};

3. 快乐数

202. 快乐数 - 力扣(LeetCode)https://leetcode.cn/problems/happy-number/description/

编写一个算法来判断一个数 n 是不是快乐数。

「快乐数」定义为:对于一个正整数,每一次将该数替换为它每个位置上的数字的平方和,然后重复这个过程直到这个数变为 1,也可能是 无限循环 但始终变不到 1。如果 可以变为 1,那么这个数就是快乐数。

如果 n 是快乐数就返回 True ;不是,则返回 False 。

bash 复制代码
示例 1:
输入:19
输出:true
解释:
1^2 + 9^2 = 82
8^2 + 2^2 = 68
6^2 + 8^2 = 100
1^2 + 0^2 + 0^2 = 1

示例 2:
输入:n = 2
输出:false
思路:

题目中说了会 无限循环,那么也就是说求和的过程中,sum会重复出现。判断sum是否重复出现就可以使用unordered_set。

cpp 复制代码
class Solution {
public:

    int getsum(int n) {
        int sum = 0;
        while(n != 0) {
            sum += (n % 10) * (n % 10);
            n /= 10;
        }
        return sum;
    }

    bool isHappy(int n) {
        // 只能用 sum 相同跳出循环
        int sum = getsum(n);
        if (sum == 1) {
            return true;
        }

        unordered_set<int> record;
        while(1) {
            // 哈希表中出现过相同的 sum 表示进入死循环
            if (sum == 1) {
                return true;
            }
            else {
                if (record.find(sum) != record.end()) {
                    // 找到了,即进入死循环
                    return false;
                }
                else {
                    record.insert(sum);
                    sum = getsum(sum);
                }
            }
        }
        return false;
    }
};

4. 两数之和

1. 两数之和 - 力扣(LeetCode)https://leetcode.cn/problems/two-sum/description/

给定一个整数数组 nums 和一个目标值 target,请你在该数组中找出和为目标值的那 两个 整数,并返回他们的数组下标。

你可以假设每种输入只会对应一个答案。但是,数组中同一个元素不能使用两遍。

bash 复制代码
示例 1:
输入:nums = [2,7,11,15], target = 9
输出:[0,1]
解释:因为 nums[0] + nums[1] == 9 ,返回 [0, 1] 。

示例 2:
输入:nums = [3,2,4], target = 6
输出:[1,2]

示例 3:
输入:nums = [3,3], target = 6
输出:[0,1]
思路:

这道题目中并不需要key有序,选择std::unordered_map 效率更高。

定义map,map中的存储结构为 {key:数据元素,value:数组元素对应的下标}。在遍历数组的时候,只需要向map去查询是否有和目前遍历元素匹配的数值,如果有,就找到的匹配对,如果没有,就把目前遍历的元素放进map中,因为map存放的就是我们访问过的元素。

cpp 复制代码
class Solution {
public:
    vector<int> twoSum(vector<int>& nums, int target) {
        unordered_map<int, int> map;     // 记录遍历过的数字与下标
        for (int i = 0; i < nums.size(); i++) {
            // 查找保存过的map中有没有满足要求的
            auto it = map.find(target - nums[i]);
            if (it != map.end()) {
                // 找到了返回下标
                return {it->second, i};
            }
            else {
                // 没找到把当前数据插入
                map.insert(pair<int, int>(nums[i], i));
            }
        }
        return {};
    }
};

5. 四数相加II

454. 四数相加 II - 力扣(LeetCode)https://leetcode.cn/problems/4sum-ii/description/

给定四个包含整数的数组列表 A , B , C , D ,计算有多少个元组 (i, j, k, l) ,使得 A[i] + B[j] + C[k] + D[l] = 0。

为了使问题简单化,所有的 A, B, C, D 具有相同的长度 N,且 0 ≤ N ≤ 500 。所有整数的范围在 -2^28 到 2^28 - 1 之间,最终结果不会超过 2^31 - 1 。

bash 复制代码
示例 1:
输入:nums1 = [1,2], nums2 = [-2,-1], nums3 = [-1,2], nums4 = [0,2]
输出:2
解释:
两个元组如下:
1. (0, 0, 0, 1) -> nums1[0] + nums2[0] + nums3[0] + nums4[1] = 1 + (-2) + (-1) + 2 = 0
2. (1, 1, 0, 0) -> nums1[1] + nums2[1] + nums3[0] + nums4[0] = 2 + (-1) + (-1) + 0 = 0

示例 2:
输入:nums1 = [0], nums2 = [0], nums3 = [0], nums4 = [0]
输出:1
思路:
  1. 首先定义 一个 unordered_map,key 放 a 和 b 两数 之和,value 放 a 和 b 两数之和出现的次数。
  2. 遍历 大 A 和 大 B 数组,统计两个数组元素之和,和出现的次数,放到 map 中。
  3. 定义 int 变量 count,用来统计 a+b+c+d = 0 出现的次数。
  4. 再遍历 大 C 和 大 D 数组,找到如果 0-(c+d) 在 map 中出现过的话,就用 count 把 map 中 key 对应的 value 也就是出现次数 统计出来。
  5. 最后返回统计值 count 就可以了
cpp 复制代码
class Solution {
public:
    int fourSumCount(vector<int>& nums1, vector<int>& nums2, vector<int>& nums3, vector<int>& nums4) {
        unordered_map<int, int> map;
        for (int num1: nums1) {
            for (int num2: nums2) {
                map[num1 + num2]++;
            }
        }

        // 对应查找
        int count = 0;
        for (int num3: nums3) {
            for (int num4: nums4) {
                auto it = map.find(0 - (num3 + num4));
                if (it != map.end()) {
                    // 找到了
                    count += map[0 - (num3 + num4)];
                }
            }
        }
        return count;
    }
};

6. 赎金信

383. 赎金信 - 力扣(LeetCode)https://leetcode.cn/problems/ransom-note/description/

给定一个赎金信 (ransom) 字符串和一个杂志(magazine)字符串,判断第一个字符串 ransom 能不能由第二个字符串 magazines 里面的字符构成。如果可以构成,返回 true ;否则返回 false。

(题目说明:为了不暴露赎金信字迹,要从杂志上搜索各个需要的字母,组成单词来表达意思。杂志字符串中的每个字符只能在赎金信字符串中使用一次。)

bash 复制代码
示例 1:
输入:ransomNote = "a", magazine = "b"
输出:false

示例 2:
输入:ransomNote = "aa", magazine = "ab"
输出:false

示例 3:
输入:ransomNote = "aa", magazine = "aab"
输出:true
cpp 复制代码
// 写法一
class Solution {
public:
    bool canConstruct(string ransomNote, string magazine) {
        // map 要维护红黑树或者哈希表,而且还要做哈希函数,是费时的
        unordered_map<char, int> map;
        for (int i = 0; i < magazine.length(); i++) {
            if (map.find(magazine[i]) != map.end()) {
                // 找到了
                map[magazine[i]]++;
            }
            else {
                // 没找到,插入
                map.insert(pair<char, int>(magazine[i], 1));
            }
        }

        // 判断能不能替代
        for (int i = 0; i < ransomNote.length(); i++) {
            if (map.find(ransomNote[i]) != map.end()) {
                // 找到了
                if (map[ransomNote[i]] != 0) {
                    map[ransomNote[i]]--;
                }
                else {
                    return false;
                }
            }
            else {
                // 没找到
                return false;
            }
        }
        return true;
    }
};


// 写法二(使用数组代替 map)
class Solution {
public:
    bool canConstruct(string ransomNote, string magazine) {
        // 使用数组代替 map
        int record[26] = {0};

        if (magazine.length() < ransomNote.length()) {
            return false;
        }

        for (int i = 0; i < magazine.length(); i++) {
            record[magazine[i] - 'a']++;
        }
        // 判断
        for (int j = 0; j < ransomNote.length(); j++) {
            if (record[ransomNote[j] - 'a'] != 0) {
                // 找到了
                record[ransomNote[j] - 'a']--;
            }
            else {
                return false;
            }
        }
        return true;
    }
};

7. 三数之和

15. 三数之和 - 力扣(LeetCode)https://leetcode.cn/problems/3sum/description/

给你一个包含 n 个整数的数组 nums,判断 nums 中是否存在三个元素 a,b,c ,使得 a + b + c = 0 ?请你找出所有满足条件且不重复的三元组。

注意: 答案中不可以包含重复的三元组。

bash 复制代码
示例 1:
输入:nums = [-1,0,1,2,-1,-4]
输出:[[-1,-1,2],[-1,0,1]]
解释:
nums[0] + nums[1] + nums[2] = (-1) + 0 + 1 = 0 。
nums[1] + nums[2] + nums[4] = 0 + 1 + (-1) = 0 。
nums[0] + nums[3] + nums[4] = (-1) + 2 + (-1) = 0 。
不同的三元组是 [-1,0,1] 和 [-1,-1,2] 。
注意,输出的顺序和三元组的顺序并不重要。

示例 2:
输入:nums = [0,1,1]
输出:[]
解释:唯一可能的三元组和不为 0 。

示例 3:
输入:nums = [0,0,0]
输出:[[0,0,0]]
解释:唯一可能的三元组和为 0 。
思路:

首先将数组排序,然后 有一层 for 循环,i 从 下标 0 的地方开始,同时 定一个 下标 left 定义在 i+1 的位置上,定义 下标 right 在数组结尾的 位置上。

依然还是 在数组中找到 abc 使得 a + b + c = 0,我们这里相当于 a = nums[i],b = nums[left],c = nums[right]。

如果nums[i] + nums[left] + nums[right] > 0 就说明 此时三数之和大了,因为数组是 排序后了,所以 right 下标就应该 向左移动,这样才能 让三数之和 小一些。如果 nums[i] + nums[left] + nums[right] < 0 说明 此时 三数之和小了,left 就向右移动,才能让三数之和大一些,直到left与right相遇为止。

cpp 复制代码
class Solution {
public:
    vector<vector<int>> threeSum(vector<int>& nums) {
        vector<vector<int>> result;
        sort(nums.begin(), nums.end());
        // 找出a + b + c = 0
        // a = nums[i], b = nums[left], c = nums[right]
        for (int i = 0; i < nums.size(); i++) {
            // 排序之后如果第一个元素已经大于零,那么无论如何组合都不可能凑成三元组,直接返回结果就可以了
            if (nums[i] > 0) {
                return result;
            }
            // 错误去重a方法,将会漏掉-1,-1,2 这种情况
            /*
            if (nums[i] == nums[i + 1]) {
                continue;
            }
            */
            // 正确去重a方法
            if (i > 0 && nums[i] == nums[i - 1]) {
                continue;
            }
            int left = i + 1;
            int right = nums.size() - 1;
            while (right > left) {
                // 去重复逻辑如果放在这里,0,0,0 的情况,可能直接导致 right<=left 了,从而漏掉了 0,0,0 这种三元组
                /*
                while (right > left && nums[right] == nums[right - 1]) right--;
                while (right > left && nums[left] == nums[left + 1]) left++;
                */
                if (nums[i] + nums[left] + nums[right] > 0) right--;
                else if (nums[i] + nums[left] + nums[right] < 0) left++;
                else {
                    result.push_back(vector<int>{nums[i], nums[left], nums[right]});
                    // 去重逻辑应该放在找到一个三元组之后,对b 和 c去重
                    while (right > left && nums[right] == nums[right - 1]) right--;
                    while (right > left && nums[left] == nums[left + 1]) left++;

                    // 找到答案时,双指针同时收缩
                    right--;
                    left++;
                }
            }

        }
        return result;
    }
};

8. 四数之和

18. 四数之和 - 力扣(LeetCode)https://leetcode.cn/problems/4sum/description/

给定一个包含 n 个整数的数组 nums 和一个目标值 target,判断 nums 中是否存在四个元素 a,b,c 和 d ,使得 a + b + c + d 的值与 target 相等?找出所有满足条件且不重复的四元组。

注意:答案中不可以包含重复的四元组。

bash 复制代码
示例 1:
输入:nums = [1,0,-1,0,-2,2], target = 0
输出:[[-2,-1,1,2],[-2,0,0,2],[-1,0,0,1]]

示例 2:
输入:nums = [2,2,2,2,2], target = 8
输出:[[2,2,2,2]]
思路:

三数之和 的 双指针解法 是 一层 for 循环 num[i] 为确定值,然后循环内有 left 和 right 下标作为双指针,找到 nums[i] + nums[left] + nums[right] == 0。

四数之和 的 双指针解法 是 两层 for 循环 nums[k] + nums[i] 为确定值,依然是循环内有 left 和 right 下标作为 双指针,找出 nums[k] + nums[i] + nums[left] + nums[right] == target的情况。

cpp 复制代码
class Solution {
public:
    vector<vector<int>> fourSum(vector<int>& nums, int target) {
        // 双指针法
        vector<vector<int>> result;
        sort(nums.begin(), nums.end());
        
        if (nums.size() < 4) return result;

        for (int i = 0; i < nums.size(); i++) {
            if (nums[i] > target && nums[i] >= 0) {
                break;
            }

            // 避免重复
            if (i > 0 && nums[i] == nums[i - 1]) {
                continue;
            }

            for (int j = i + 1; j < nums.size(); j++) {
                if (nums[i] + nums[j] > target && nums[i] + nums[j] >= 0) {
                    break;
                }

                // 避免重复
                if (j > i + 1 && nums[j] == nums[j - 1]) {
                    continue;
                }

                int left = j + 1, right = nums.size() - 1;
                
                while (left < right) {
                    if ((long)nums[i] + nums[j] + nums[left] + nums[right] > target) {
                        right--;
                    }
                    else if ((long)nums[i] + nums[j] + nums[left] + nums[right] < target) {
                        left++;
                    }
                    else {
                        // 找到了插入
                        result.push_back(vector<int>{nums[i], nums[j], nums[left], nums[right]});
                        while (left < right && nums[left] == nums[left + 1]) {
                            left++;
                        }
                        while (left < right && nums[right] == nums[right - 1]) {
                            right--;
                        }
                        right--;
                        left++;
                    }
                }
            }
        }
        return result;
    }
};
相关推荐
安大小万5 分钟前
C++ 学习:深入理解 Linux 系统中的冯诺依曼架构
linux·开发语言·c++
田梓燊19 分钟前
图论 八字码
c++·算法·图论
dal118网工任子仪1 小时前
73,【5】BUUCTF WEB [网鼎杯 2020 玄武组]SSRFMe(未解出)
笔记·学习
烟锁迷城1 小时前
软考中级 软件设计师 第一章 第九节 总线
笔记
fks1431 小时前
leetcode 121. 买卖股票的最佳时机
leetcode
Tanecious.1 小时前
C语言--数据在内存中的存储
c语言·开发语言·算法
去往火星1 小时前
opencv在图片上添加中文汉字(c++以及python)
开发语言·c++·python
Bran_Liu1 小时前
【LeetCode 刷题】栈与队列-队列的应用
数据结构·python·算法·leetcode
kcarly2 小时前
知识图谱都有哪些常见算法
人工智能·算法·知识图谱
CM莫问2 小时前
<论文>用于大语言模型去偏的因果奖励机制
人工智能·深度学习·算法·语言模型·自然语言处理