C++进阶：map与set容器的使用

[1. 关联式容器map与set](#1. 关联式容器map与set)
[2. set与multiset的接口与使用](#2. set与multiset的接口与使用)
- [2.1 set的接口与使用](#2.1 set的接口与使用)
- - [2.1.1 成员函数](#2.1.1 成员函数)
  - [2.1.2 迭代器](#2.1.2 迭代器)
  - [2.1.3 容量相关](#2.1.3 容量相关)
  - [2.1.4 修改相关](#2.1.4 修改相关)
- [2.1.5 查找，计数与补充](#2.1.5 查找，计数与补充)
- [2.2 multiset的接口与使用](#2.2 multiset的接口与使用)
[3. map与multimap的接口与使用](#3. map与multimap的接口与使用)
- [3.1 map的接口与使用](#3.1 map的接口与使用)
- - [3.1.1 map的使用补充](#3.1.1 map的使用补充)
  - [3.1.2 插入与operator\[\]](#3.1.2 插入与operator[])
- [3.2 multimap接口与使用](#3.2 multimap接口与使用)
[4. map与set相关练习](#4. map与set相关练习)
- [4.1 随机链表的复制（map实现）](#4.1 随机链表的复制（map实现）)
- [4.2 前K个高频单词](#4.2 前K个高频单词)
- [4.3 两个数组的交集](#4.3 两个数组的交集)

1. 关联式容器map与set

我们在之前的学习中，已经学习了解了许多的STL库中的容器，诸如vector（顺序表），list（链表）,deque（双端队列），这类容器的底层数据结构都为线性序列。

而今天我们所学习的map与set，则是一种区别于此前线性数据结构，叫做关联式数据结构的新容器。

map与set的底层数据结构为红黑树，这一种平衡二叉树，此类关联式数据结构其中存储的数据为<key , value>模型。

这类数据结构，其可以通过键值迅速找到对应的数据，之所以其支持此种数据存储方式，是因为它的搜索效率相较于线性数据结构具有更高。

2. set与multiset的接口与使用

2.1 set的接口与使用

2.1.1 成员函数

<1> set容器其的底层为一颗红黑树
<2> 其数据存储节点所存的值为单参数数据，即key模型
<3> set中不允许存在值相同的数据结点。

构造函数

cpp 复制代码

//迭代器区间构造
template<class InputIterator>
set(InputIterator first, InputIterator last);

//拷贝构造
set(const set& x);

赋值运算符重载

cpp 复制代码

set& operator=(const set& x);

2.1.2 迭代器

<1> set支持迭代器遍历与范围for
<2> 对其进行正向遍历会得到升序的数据序列，逆向遍历会得到降序的数据序列
<3> 将数据插入至set中，并获取遍历得到的数据序列，等于对一组数据进行去重与排序
<4> C++算法库中存在有去重算法unique，向其传递一段迭代器区间，其会这段区间内的数据进行去重，前提为区间内的数据有序。

cpp 复制代码

#include <iostream>
using namespace std;
#include <set>
int main()
{
	int arr[] = { 8, 3, 1, 10, 6, 4, 7, 14, 13 };
	set<int> s;
	 
	for (auto e : arr)
	{
	    s.insert(e);
	}
	
	//正向遍历，升序
	for (auto it = s.begin(); it != s.end(); it++)
	{
	    cout << *it << " ";
	}
	cout << endl;
	
	//逆向遍历，降序
	for (auto rit = s.rbegin(); rit != s.rend(); rit++)
	{
	    cout << *rit << " ";
	}
	cout << endl;
	
	return 0;
}

cpp 复制代码

//非const迭代器
//正向迭代器
iterator begin();
iterator end();

//反向迭代器
reverse_iterator rbegin();
reverse_iterator rend();

//const迭代器
const_iterator cbegin();
const_iterator cend();

const_reverse_iterator crbegin();
const_reverse_iterator crend();

2.1.3 容量相关

cpp 复制代码

//判空
bool empty() const;

//数据长度
size_t size();

//最大存储数据个数
size_t max_size();

2.1.4 修改相关

插入

cpp 复制代码

//插入一个值
pair<iterator, bool> insert(const value_type& val);

//在指定迭代器位置插入一个值，返回新插入元素的迭代器
iterator insert(iterator pos, const value_type& val);

//插入一段迭代器区间
void insert(iterator first, iterator last);

inset的值插入方式，会返回一个pair类型的值。

pair为C++库中定义的一个类，这个类是将两个指定的不同数据类型的值进行了封装

存储到的两个数据在pair类型中分别是名为first与second的成员变量，第一个insert函数的返回值pair
<1> 当新插入元素在set中没有值重复结点时，pair返回值中的second为true，first为返回新插入元素结点的迭代器
<2> 当set存在相同值得结点时，pair返回值中得second为false，first为set中相同值结点得迭代器

set中数据存储结点的key值不可以被改变，会破坏红黑树的结构

删除

cpp 复制代码

//删除一个指定迭代器位置的数据
void erase(iterator pos);

//从set中删除一个为指定值的结点
size_t erase(const value_type& val);

//删除一段指定的迭代器区间
void erase(iterator first, iterator last);

删除指定迭代器位置的数据时，若迭代器不存在，会发生报错

删除set中key值为指定值的结点时，若结点不存在，不会发生报错

2.1.5 查找，计数与补充

查找

cpp 复制代码

iterator find(const value_type& val) const;

查找set中key值为指定值的结点，若找到，返回此结点的迭代器，若未找到，返回end()。

计数

cpp 复制代码

size_t count(const value_type& val) const;

统计set中key值为指定值结点的个数并返回，set中此接口是为了与multiset做统一。

lower_bound与upper_bound

cpp 复制代码

//指定一段区间，获得set中标识此段区间内的迭代器
//左边界
iterator lower_bound(const value_type& val) const;

//右边界
iterator upper_bound(const value_type& val) const;

lower_bound获取区间左边界迭代器，会返回值大于等于val的迭代器

upper_bound获取区间右边界迭代器，会返回值大于val的迭代器

区间边界需要左闭右开[left，right)，这与迭代器的遍历方式相关

2.2 multiset的接口与使用

multiset的接口与使用方式都和set相同，只是multiset支持key值冗余，即相同值结点的插入

在查找时，若multiset中存在着多个key值相同的结点，其会优先返回第一个查找到的key值结点

3. map与multimap的接口与使用

3.1 map的接口与使用

3.1.1 map的使用补充

<1> map的接口与set大体相同，两者之间的区别为其中数据存储结点，其存储的数据有所不同，set中存储key类型的结点，而map中存储<key，value>类型的结点。
<2> 并因此，map一些接口的使用方式也set有所区别。
<3> 因为存储数据模型的原因，其的查找，数据结构排列都是以key值为依照

<1> map中存储数据结点都为pair类型的变量，first做key值，second做value
<2> key值不可改变，而value可以修改
<3> map容器其数据结点的value_type为pair<const key, value>

map的迭代器，重载了operator->运算符，因此，可以使用it->first，it->second的方式访问数据结点内部存储的值。

3.1.2 插入与operator\[\]

插入

cpp 复制代码

//插入一个值
pair<iterator, bool> insert(const value_type& val);

//在指定迭代器位置插入一个值
iterator insert(iterator pos, const value_type& val);

//插入一段迭代器区间内的值
template<class InputIterator>
void insert (InputIterator first, InputIterator last);

pair类型对象的构造，可以采用传递有名对象与匿名对象的方式，除此之外，C++库中还存在着一个函数make_pair可以帮助我们构造一个指定pair类型的对象，方便我们的使用

C++11中，支持了多参数构造函数的隐式类型转换

cpp 复制代码

//make_pair的内部实现，根据传递参数推导类型构造pair对象
template <class T1,class T2>
pair<T1,T2> make_pair (T1 x, T2 y)
{
	return ( pair<T1,T2>(x,y) );
}

//方式1：
insert(make_pair(10, 10));

//方式2：多参数构造函数隐式类型转换方式
inset({10, 10});

operator\[\] 运算符重载

我们传递key值，会返回map中key值所对应结点的value，且为引用类型，可修改。

cpp 复制代码

value_type& operator[](const key& k);

//内部实现等同于
*((this->insert(make_pair(k, map_value_type())).first)).second

//简单模拟实现
V& operator[](const key& k)
{
	pair<const key, V> ret = insert(make_pair(k, V()));
	
	return ret.first->second;
}

insert值插入的返回值为pair<iterator，bool>，取用此pair的first，即插入元素的iterator，并以此迭代器访问其对应结点的second

cpp 复制代码

//使用operator[]可以直接插入统计修改，对应key值的value
int main()
{
	vector<string> v = {"苹果", "西瓜", "菠萝", "菠萝", "西瓜" ,"苹果" ,"苹果" };
    map<string, int> m;

    for (auto e : v)
    {
        m[e]++;
    }
	
	//等同于
	for(auto : v)
	{	
		//插入
		pair<iterator, bool> ret = m.insert(e).first;
		
		//存在，次数++
		if(ret.second == false)
		{
			(ret.first)->second++;
		}
	}

    for (auto e : m)
    {
        cout << e.first << " : " << e.second << endl;
    }
	
	return 0;
}

3.2 multimap接口与使用

multimap与map的关系与multiset与set的关系类似，multimap也支持key冗余，在其他接口的使用上，与map相同。

multimap不支持operator\[\]。

4. map与set相关练习

4.1 随机链表的复制（map实现）

题目链接：
随机链表的复制

思路：映射关系的建立，前提：随机指针指向的是链表中的结点

cpp 复制代码

class Solution 
{
public:
    Node* copyRandomList(Node* head) 
    {
        //记录映射关系，原链表与拷贝链表
        //随机指针都指向链表本身的结点
        //以原链表的随机指针指向结点，找到对应的拷贝结点
        
        //创建拷贝链表，并建立映射关系
        Node* cur = head;
        Node* newhead = nullptr;
        Node* newtail = nullptr;
        map<Node*, Node*> m;
        while(cur)
        {
            Node* newnode = new Node(cur->val);
            if(newhead == nullptr)
            {
                newhead = newnode;
                newtail = newhead;
            }
            else
            {
                newtail->next = newnode;
                newtail = newtail->next;
            }
            m[cur] = newnode;

            cur = cur->next;
        }

        //根据映射关系，调整随机链表
        cur = head;
        while(cur)
        {
            //当前拷贝结点的随机指针，指向原链表随机指针指向结点的映射结点
            m[cur]->random = m[cur->random];
            cur = cur->next;
        }

        return newhead;
    }
};

4.2 前K个高频单词

题目信息：

题目链接：
前K个高频单词

思路：数据小于32为插入排序，大于32为归并排序

cpp 复制代码

class Solution 
{
public:
    struct comp1
    {
        bool operator()(const pair<string, int>& left, const pair<string, int>& right)
        {
            return (left.second > right.second) || (left.second == right.second && left.first < right.first);
        }
    };

    struct comp2
    {
        bool operator()(const pair<string, int>& left, const pair<string, int>& right)
        {   
            //归并排序，稳定，不会打乱map中的字典序
            //11归，22归，44归，...
            return left.second > right.second;
        }
    };

    vector<string> topKFrequent(vector<string>& words, int k) 
    {
        vector<string> ret;
        //向map中插入计数
        map<string, int> m;
        for(auto e : words)
        {
            m[e]++;
        }
        //向vector中插入结点数据并排序
        vector<pair<string, int>> v(m.begin(), m.end());
        //进行排序，快排（不稳定排序），归并（稳定排序）
        //pair的默认排序方式
        //构建的匿名对象comp()
        //sort(v.begin(), v.end(), comp1());
        stable_sort(v.begin(), v.end(), comp2());

        //map排序为字典序的升序
        //根据value排降序
        for(auto it = v.begin(); it != v.begin() + k; it++)
        {
            ret.push_back(it->first);
        }

        return ret;
    }
};

4.3 两个数组的交集

题目信息：

题目链接：
两个数组的交集

思路：
<1> set去重查找
<2> 同步算法

同步算法： （应用：云存储同步）
<1> 将两方数据分别插入至一个set去重排序，可以同时找到数据的交集与差集
<2> 从开始比对，小的为差集，相等的为交集，因为二者都有序，那么小的一定是差集
<3> 若为差集，小的++，若为交集，二者同时++

cpp 复制代码

//方法1：
class Solution 
{
public:
    vector<int> intersection(vector<int>& nums1, vector<int>& nums2) 
    {
        vector<int> ret;
        //插入去重，不能重复
        set<int> s1;
        set<int> s2;
        for(auto e : nums1)
        {
            s1.insert(e);
        }

        for(auto e : nums2)
        {
            s2.insert(e);
        }

        for(auto e : s1)
        {
            if(s2.count(e))
            {
                ret.push_back(e);
            }
        }

        return ret;
    }
};

//方法2：
class Solution 
{
public:
    vector<int> intersection(vector<int>& nums1, vector<int>& nums2) 
    {
        vector<int> ret;
        set<int> s1(nums1.begin(), nums1.end());
        set<int> s2(nums2.begin(), nums2.end());

        //同步算法
        auto it1 = s1.begin();
        auto it2 = s2.begin();
        while(it1 != s1.end() && it2 != s2.end())
        {
            if(*it1 == *it2)
            {
                ret.push_back(*it1);
                it1++;
                it2++;
            }
            else if(*it1 < *it2)
            {
                it1++;
            }
            else
            {
                it2++;
            }
        }

        return ret;
    }
};

C++进阶：map与set容器的使用

目录

1. 关联式容器map与set

2. set与multiset的接口与使用

2.1 set的接口与使用

2.1.1 成员函数

2.1.2 迭代器

2.1.3 容量相关

2.1.4 修改相关

2.1.5 查找，计数与补充

2.2 multiset的接口与使用

3. map与multimap的接口与使用

3.1 map的接口与使用

3.1.1 map的使用补充

3.1.2 插入与operator\[\]

3.2 multimap接口与使用

4. map与set相关练习

4.1 随机链表的复制（map实现）

4.2 前K个高频单词

4.3 两个数组的交集