序言：

在之前，我们已经对STL中的序列式容器进行了相关的学习。本期，我将给大家介绍的则是另外一类容器 ------ 关联式容器！！！

（一）容器回顾

💨【顺序容器】

💨【关联式容器】

[1️⃣ 基本介绍](#1️⃣ 基本介绍)

[2️⃣ multiset的使用](#2️⃣ multiset的使用)

3、map

1️⃣基本介绍

[2️⃣ map的使用](#2️⃣ map的使用)

4、multimap

1️⃣基本介绍

[2️⃣ multimap的使用](#2️⃣ multimap的使用)

（一）容器回顾

在初阶阶段，我们已经接触过STL中的部分容器，比如：vector、list、deque、forward_list 等，这些容器统称为序列式容器，因为其底层为线性序列 的数据结构，里面存储的是元素本身。那什么是关联式容器？它与序列式容器有什么区别？

接下来，我先带大家回顾一下有关容器的一些基本知识，帮助大家唤醒一些"远古"的记忆！

容器可以用于存放各种类型的数据（基本类型的变量，对象等）的数据结构，都是模板类：分为顺序容器、关联式容器、容器适配器三种类型，三种类型容器特性分别如下：

💨【顺序容器】

容器并非排序的，元素的插入位置同元素的值无关。包含 vector、deque、list，具体实现原理如下：

（1）vector 头文件

动态数组。元素在内存连续存放。随机存取任何元素都能在常数时间完成。在尾端增删元素具有较佳的性能。

（2）deque 头文件

双向队列。元素在内存连续存放。随机存取任何元素都能在常数时间完成（仅次于vector）。在两端增删元素具有较佳的性能（大部分情况下是常数时间）

（3）list 头文件

双向链表。元素在内存不连续存放。在任何位置增删元素都能在常数时间完成。不支持随机存取。

💨【关联式容器】

而本期将要介绍的关联式容器也是用来存储数据的，与序列式容器不同的是，其里面存储的是**<key, value>**结构的键值对，在数据检索时比序列式容器效率更高

元素是排序的 ；插入任何元素，都按相应的排序规则来确定其位置；在查找时具有非常好的性能；

通常以平衡二叉树的方式实现。包含set、multiset、map、multimap，具体实现原理如下：

（1）set/multiset 头文件

set 即集合。set中不允许相同元素，multiset中允许存在相同元素。

（2）map/multimap 头文件

map与set的不同在于map中存放的元素有且仅有两个成员变量，一个名为first,另一个名为second；
map根据first值对元素从小到大排序，并可快速地根据first来检索元素。

💨【容器适配器】

封装了一些基本的容器，使之具备了新的函数功能，比如把deque封装一下变为一个具有stack功

能的数据结构。这新得到的数据结构就叫适配器。包含stack,queue,priority_queue，具体实现原

理如下：

（1）stack 头文件

栈是项的有限序列，并满足序列中被删除、检索和修改的项只能是最进插入序列的项（栈顶的
项）；
后进先出

（2）queue 头文件

队列。插入只可以在尾部进行，删除、检索和修改只允许从头部进行；
先进先出

（3）priority_queue 头文件

优先级队列。内部维持某种有序，然后确保优先级最高的元素总是位于头部。最高优先级元素总是第一个出列

（二）键值对

在C++中，键值对是一种常见的数据结构，它将一个唯一的键与一个值相关联。提供了一种高效的方式来存储和检索数据。该结构中一般只包含两个成员变量key 和value ，key代表键值，value表示与key对应的信息。

【场景】

比如：现在要建立一个英汉互译的字典，那该字典中必然有英文单词与其对应的中文含义，而且，英文单词与其中文含义是一一对应的关系，即通过该单词，在词典中就可以找到与其对应的中文含义.

键值对的定义可以采用不同的数据结构或语法表示，具体取决于所使用的编程语言或数据格式。

以下是一些常见的定义方式：

C++关联容器示例：

cpp 复制代码

std::map<std::string, int> myMap;
myMap["apple"] = 10;
myMap["banana"] = 5;

JSON格式示例：

cpp 复制代码

{
  "name": "John",
  "age": 30,
  "city": "New York"
}

Python字典示例：

cpp 复制代码

my_dict = {"key1": "value1", "key2": "value2", "key3": "value3"}

JavaScript对象示例：

cpp 复制代码

var myObject = { key1: "value1", key2: "value2", key3: "value3" };

【说明】

在以上示例中，"key1"、"key2"等都是键，对应的"value1"、"value2"等是对应的值；
你可以使用键值对来存储、访问和处理各种数据，根据具体编程语言和数据结构的不同，提供了丰富的函数和操作来操作和处理键值对。

而在SGI-STL中关于键值对的定义如下：

cpp 复制代码

template <class T1, class T2>
struct pair
{
    typedef T1 first_type;
    typedef T2 second_type;
    T1 first;
    T2 second;

    pair():
     first(T1())
    , second(T2())
    {}

    pair(const T1& a, const T2& b): 
    first(a)
    , second(b)
    {}

};

（三）树形结构的关联式容器

根据应用场景的不桶，STL总共实现了两种不同结构的管理式容器：树型结构与哈希结构；
树型结构的关联式容器主要有四种：map、set、multimap、multiset；
这四种容器的共同点是：使用平衡搜索树 (即红黑树)作为其底层结果，容器中的元素是一个有序的序列。

下面一依次介绍每一个容器：

1、set

1️⃣基本介绍

官方链接如下 ：set文档介绍

简单点来说 set是按照一定次序存储元素的容器，且set中的元素不可以重复。具体的大家可以参照文档进行相应的学习。

2️⃣set的使用

set的模板参数列表：

【说明】

T: set中存放元素的类型，实际在底层存储<value, value>的键值对。
Compare：set中元素默认按照小于来比较
Alloc：set中元素空间的管理方式，使用STL提供的空间配置器管理

接下来，我们简单的来使用下 set：

cpp 复制代码

void test_set1()
{
	set<int> s1;
	s1.insert(3);
	s1.insert(1);
	s1.insert(4);
	s1.insert(2);
	s1.insert(1);
	s1.insert(2);

	set<int>::iterator it1 = s1.begin();
	while (it1 != s1.end())
	{
		cout << *it1 << " ";
		++it1;
	}
	cout << endl;
}

输出展示：

【说明】

首先，我们可以使用迭代器对其进行操作；
其次，我们验证了上述所说的 set中的元素不可以重复，可以发现结果自动进行了去重的操作

紧接着，此时我们就会想，既然可以使用迭代器，那么我们就可以知道 范围for也可以使用：

有的小伙伴可能不知道迭代器和范围for的联系，接下来我简单的描述一下：

迭代器和范围for循环都是在 C++ 中用于遍历容器（如数组、向量、映射等）中的元素的工具。它们之间存在联系和互补关系。

迭代器 ：迭代器是一个对象，用于遍历容器中的元素序列。通过迭代器，可以逐个访问容器中的元素，并进行增加、删除、修改等操作。C++ 标准库提供了多种类型的迭代器，如 begin() 和 end() 返回的迭代器可以表示容器的起始和结束位置。迭代器可以使用 * 运算符来访问当前位置的值，也可以使用 ++ 运算符来移动到下一个位置。
范围for循环 ：范围for循环是一种简洁的语法形式，用于遍历容器中的元素。它可以自动处理迭代器的创建和递增，并以一种更直观的方式对容器中的元素进行访问。范围for循环的语法是 for (element : container)，其中 element 是用于存储当前元素的变量，container 是要遍历的容器。在每次循环迭代中，element 会被赋值为容器中的下一个元素，直到遍历完所有元素。

迭代器和范围for循环的联系在于，范围for循环在内部使用迭代器来实现对容器的遍历。范围for循环抽象了迭代器的创建和递增过程，使得代码更加简洁和易读。范围for循环适用于大多数情况下对容器进行遍历，并且不需要修改容器中的元素。而当需要更精细的控制和操作时，迭代器提供了更灵活的功能。

紧接着，在文档中介绍了 set中的元素不能在容器中修改。举例来验证一下：

【说明】

从上述图片中不难发现在C++的set容器中，元素不允许直接修改；
set是一个有序的集合容器，它通常基于红黑树实现。红黑树是一种平衡二叉搜索树，用于维护元素的有序性。为了保持树的平衡和有序，set 中的元素在插入时按照特定规则被插入到合适的位置，并且不允许直接修改。
具体而言，当你在set 中插入一个元素时，该元素会被自动插入到正确的位置，以保持集合的有序性。红黑树的平衡性是通过左旋、右旋以及颜色调整等操作来维护的。直接修改元素的值可能导致元素位置不再准确，破坏了红黑树的性质，进而影响整个集合的有序性。
因此，在set 中，如果你需要修改一个元素，你需要先将该元素从集合中删除，然后再重新插入修改后的值。

【注意】

如果你需要对集合中的元素进行频繁的修改操作，可能 set 并不是最适合的容器选择；
相应地，可以考虑使用 unordered_set容器，它基于哈希表实现，并提供了快速的查找和修改元素的能力；
在 unordered_set中，元素的位置是根据哈希函数计算得到的，而不是通过有序性进行维护，因此允许直接修改元素的值。

接下来，再给大家介绍一下关于查找元素是否存在的操作。

举例：

cpp 复制代码

void test_set2()
{
	set<int> s1;
	s1.insert(3);
	s1.insert(1);
	s1.insert(4);
	s1.insert(2);
	s1.insert(1);
	s1.insert(2);

	int x;
	while (cin >> x)
	{
		auto ret = s1.find(x);
		if (ret != s1.end())
		{
			cout << "在" << endl;
		}
		else
		{
			cout << "不在" << endl;
		}
	}

}

输出显示：

除了上述方法，我们还可以使用 count函数来进行操作。具体如下：

cpp 复制代码

if (s1.count(x))
{
	cout << "在" << endl;
}
else
{
	cout << "不在" << endl;
}

输出显示：

2、multiset

链接如下：Multiple的文档介绍

1️⃣ 基本介绍

multiset 对比 set，multiset是按照特定顺序存储元素的容器，其中元素是可以重复的

2️⃣ multiset的使用

cpp 复制代码

void test_set3()
{
	multiset<int> s1;
	s1.insert(3);
	s1.insert(1);
	s1.insert(4);
	s1.insert(2);
	s1.insert(1);
	s1.insert(2);

	multiset<int>::iterator it1 = s1.begin();
	while (it1 != s1.end())
	{
		cout << *it1 << " ";
		++it1;
	}
	cout << endl;
}

输出显示：

此时，对于在 set中进行的查找操作，在multiset中该如何表现呢？（因此存在重复的情况）

cpp 复制代码

void test_set3()
{
	multiset<int> s1;
	s1.insert(3);
	s1.insert(1);
	s1.insert(4);
	s1.insert(1);
	s1.insert(2);
	s1.insert(1);
	s1.insert(2);
	s1.insert(1);

	multiset<int>::iterator it1 = s1.begin();
	while (it1 != s1.end())
	{
		cout << *it1 << " ";
		++it1;
	}
	cout << endl;

	// 多个key，find中序的第一个key
	auto ret = s1.find(1);
	while (ret != s1.end() && *ret == 1)
	{
		cout << *ret << " ";
		++ret;
	}
	cout << endl;

}

输出显示：

【说明】

需要注意的是，multiset 中的元素是按键的自然顺序存储的。当存在多个相同的键时，它们按照插入的顺序存储在容器中。使用 find 方法仅返回指向中序遍历的第一个key，而不能一次性找到所有具有相同键的元素。

其次，除了上述的操作之外，multiset 还可以使用 count函数来统计元素出现的次数：

对于其他的操作，在这里就不做过多的介绍。大家结合文档我相信各位都可以看懂的！！！

3、map

1️⃣基本介绍

链接如下：map的使用

【说明】

在正式的学习之前，先要了解在map中，键值key通常用于排序和惟一地标识元素，而值value中存储与此键值key关联的内容；
键值key和值value的类型可能不同，并且在map的内部，key与value通过成员类型value_type绑定在一起，为其取别名称为pair:

2️⃣ map的使用

【说明】

key: 键值对中key的类型
T：键值对中value的类型
Compare: 比较器的类型，map中的元素是按照key来比较的，缺省情况下按照小于来比较，一般情况下(内置类型元素)该参数不需要传递，如果无法比较时(自定义类型)，需要用户自己显式传递比较规则(一般情况下按照函数指针或者仿函数来传递)
Alloc：通过空间配置器来申请底层空间，不需要用户传递，除非用户不想使用标准库提供的空间配置器
注意：在使用map时，需要包含头文件

接下来，我们简单的来使用下 map：

cpp 复制代码

void test_map1()
{
	map<string, string> dict;
	dict.insert(make_pair("insert", "排序"));
	dict.insert(make_pair("count", "计数"));
	dict.insert(make_pair("find", "查找"));
	dict.insert(make_pair("string", "字符串"));
	dict.insert(make_pair("swap", "交换"));

	map<string, string>::iterator dt1 = dict.begin();
	while (dt1 != dict.end())
	{
		cout << (*dt1).first << " ";
		++dt1;
	}
	cout << endl;
}

输出显示：

【说明】

请注意，指针形式的输出在实际编码中可能不常见。通常，可以直接访问 std::pair 对象的成员变量，并以合适的方式打印出所需的内容。例如，cout << dt1->first << " "; 与**cout << (*dt1).first << " ";** 是等效的。

具体如下：

接下来，带大家看个例子，让大家更加深入的理解：

【说明】

在 C++ 的**map**容器中，每个键（key）都是唯一的。当你尝试插入一个已经存在的键时，插入操作会失败；
map 是一个关联容器，它按照键的顺序对元素进行排序，并且保持唯一键的特性。当你插入一个新的键值对时，**map**会自动根据键的顺序将其插入到合适的位置，如果已经存在相同的键，则插入失败。

接下来，我给大家讲一下operator\[\]。首先我先用一下这个，让大家直观的感受：

cpp 复制代码

void test_map2()
{
	string arr[] = { "西瓜", "西瓜", "苹果", "西瓜", "苹果", "苹果", "西瓜", "苹果", "香蕉", "苹果", "香蕉", "梨" };
	map<string, int> countMap;

	for (auto& e : arr)
	{
		countMap[e]++;
	}

	for (auto& kv : countMap)
	{
		cout << kv.first << ":" << kv.second << endl;
	}
}

输出结果：

接下来，带大家详解这个operator\[\] ：

【解释】

在给定的代码中，this 是一个指向当前对象的指针（或引用），make_pair(k, mapped_type()) 创建一个键为 k，值为默认构造的 mapped_type 类型对象的 std::pair 对象。接下来，通过调用 insert 方法将这个 std::pair 对象插入到容器中，并获取插入结果的迭代器。

然后，通过解引用和成员访问操作符 .second，(*((this->insert(make_pair(k, mapped_type ()))).first)).second 表达式从插入结果的迭代器中获取对应元素的值。

其实文档给的有一点太复杂了，在这里我给出简化的版本，供大家参考：

cpp 复制代码

V& operator[](const K& key)
{
	pair<iterator, bool> ret = insert(make_pair(key, V()));
	return ret.first->second;
}

接下来，有了上述operator\[\] 这样的功能，我们就可以使用其进行插入操作了。具体如下:

当我们有这样的代码时：

cpp 复制代码

dict["left"];			// 插入
dict["right"] = "右边"; // 插入+修改
dict["string"] = "(字符串)"; // 修改
cout << dict["string"] << endl; // 查找
cout << dict["string"] << endl; // 查找

输出展示：

接下来，我们通过调试看看：

【总结】

1. map中的的元素是键值对
1. map中的key是唯一的，并且不能修改
1. 默认按照小于的方式对key进行比较
1. map中的元素如果用迭代器去遍历，可以得到一个有序的序列
1. map的底层为平衡搜索树(红黑树)，查找效率比较高 $O(log_2 N)$
1. 支持\[\]操作符，operator\[\]中实际进行插入查找

4、multimap

1️⃣基本介绍

链接如下：multimap的使用

注意：multimap和map的唯一不同就是：map中的key是唯一的，而multimap中key是可以

重复的

2️⃣ multimap的使用

multimap中的接口可以参考map，功能都是类似的。

【注意】

1. multimap中的key是可以重复的。
1. multimap中的元素默认将key按照小于来比较
1. multimap中没有重载operator\[\]操作(同学们可思考下为什么?)。
1. 使用时与map包含的头文件相同：

（四）在OJ中的使用

1、前k个高频单词

692. 前K个高频单词

cpp 复制代码

class Solution {
public:
    vector<string> topKFrequent(vector<string>& words, int k) {
        map<string, int> num;
        for(auto e : words)
            num[e]++;

        //按照单词出现次数的逆序存储单词及其对应的出现次数
        multimap<int, string, greater<int>> arry;
        for(auto e : num)
        {
            arry.insert(make_pair(e.second, e.first));
        }
        vector<string> res;
        auto it = arry.begin();
        for(int i = 0; i < k; i++)
        {
            res.push_back(it->second);
            it++;
        }
        return res;
    }
};

输出结果：

2、两个数组的交集

349. 两个数组的交集

cpp 复制代码

class Solution {
public:
    vector<int> intersection(vector<int>& nums1, vector<int>& nums2) {
        unordered_set<int> set1(nums1.begin(), nums1.end());
        unordered_set<int> set2(nums2.begin(), nums2.end());
    
        vector<int> intersection;
    
        for (auto num : set1) {
            if (set2.find(num) != set2.end()) {
                intersection.push_back(num);
            }
        }
        return intersection;
    }
};

输出结果：

总结

以上便是关于 map和set 的全部知识。感谢大家的观看与支持！！！

【C++】容器篇（五）—— map和set的基本介绍

**（一）**容器回顾

💨【顺序容器】

💨【关联式容器】

💨【容器适配器】

（二）键值对

（三）树形结构的关联式容器

1、set

1️⃣基本介绍

2️⃣set的使用

2、multiset

1️⃣ 基本介绍

2️⃣ multiset的使用

3、map

1️⃣基本介绍

2️⃣ map的使用

4、multimap

1️⃣基本介绍

2️⃣ multimap的使用

（四）在OJ中的使用

1、前k个高频单词

2、两个数组的交集

总结

（一）容器回顾