系统性学习C++-第十九讲-unordered_map 和 unordered_set 的使用

这里写目录标题

[1. unordered_set 系列的使用](#1. unordered_set 系列的使用)
- [1.1 unordered_set 和 unordered_multiset 参考文档](#1.1 unordered_set 和 unordered_multiset 参考文档)
- [1.2 unordered_set 类的介绍](#1.2 unordered_set 类的介绍)
- [1.3 unordered_set 和 set 的使用差异](#1.3 unordered_set 和 set 的使用差异)
- [1.4 unordered_map 和 map 的使用差异](#1.4 unordered_map 和 map 的使用差异)
- [1.5 unordered_multimap / unordered_multiset](#1.5 unordered_multimap / unordered_multiset)
- [1.6 unordered_xxx 的哈希相关接口](#1.6 unordered_xxx 的哈希相关接口)

1. unordered_set 系列的使用

1.1 unordered_set 和 unordered_multiset 参考文档

链接：参考文档

1.2 unordered_set 类的介绍

unordered_set 的声明如下，Key 就是 unordered_set 底层关键字的类型
unordered_set 默认要求 Key 支持转换为整形，如果不支持或者想按自己的需求走，可以自行实支持将 Key 转成整形的仿函数传给第二个模板参数
unordered_set 默认要求 Key 支持比较相等，如果不支持或者想按自己的需求走，可以自行实现⽀持将 Key 比较相等的仿函数传给第三个模板参数
unordered_set 底层存储数据的内存是从空间配置器申请的，如果需要可以自己实现内存池，传给第四个参数
⼀般情况下，我们都不需要传后三个模板参数
unordered_set 底层是用哈希桶实现，增删查平均效率是 O(1) ，迭代器遍历不再有序，为了跟 set 区分，所以取名unordered_set 。
前面部分我们已经学习了 set 容器的使用，set 和 unordered_set 的功能⾼度相似，只是底层结构不同，有一些性能和使用的差异，这里我们只讲他们的差异部分。

1.3 unordered_set 和 set 的使用差异

cpp 复制代码

pair<iterator,bool> insert ( const value_type& val );
size_type erase ( const key_type& k );
iterator find ( const key_type& k );

查看文档我们会发现 unordered_set 的支持增删查跟 set 的使用⼀模⼀样，关于使用我们这里就不再赘述和演示了。
unordered_set 和 set 的第⼀个差异是对 key 的要求不同，set 要求 Key 支持小于比较，⽽ unordered_set 要求 Key 支持转成整形且支持等于比较，要理解 unordered_set 的这个两点要求得后续我们结合哈希表底层实现才能真正理解，也就是说这本质是哈希表的要求。
unordered_set 和 set 的第二个差异是迭代器的差异，set 的 iterator 是双向迭代器，unordered_set 是单向迭代器，其次 set 底层是红黑树，红黑树是二叉搜索树，走中序遍历是有序的，所以 set 迭代器遍历是有序 + 去重。而 unordered_set 底层是哈希表，迭代器遍历是无序 + 去重。
unordered_set 和 set 的第三个差异是性能的差异，整体而言大多数场景下，unordered_set 的增删查改更快⼀些，因为红黑树增删查改效率是 O(logN) ，而哈希表增删查平均效率是 O(1) ，具体可以参看下面代码的演示的对比差异。

cpp 复制代码

#include<unordered_set>
#include<unordered_map>
#include<set>
#include<iostream>
using namespace std;
int test_set2()
{
 	const size_t N = 1000000;
 	unordered_set<int> us;
 	set<int> s;
 	vector<int> v;
 	v.reserve(N);
 	srand(time(0));
 	for (size_t i = 0; i < N; ++i)
 	{
 		//v.push_back(rand()); // N⽐较⼤时，重复值⽐较多 
 		v.push_back(rand()+i); // 重复值相对少 
 		//v.push_back(i); // 没有重复，有序 
 	}
 	
 	size_t begin1 = clock();
 	for (auto e : v)
 	{
 		s.insert(e);
 	}
 	size_t end1 = clock();
 	cout << "set insert:" << end1 - begin1 << endl;
 	size_t begin2 = clock();
 	us.reserve(N);
 	
 	for (auto e : v)
 	{
 		us.insert(e);
 	}
 	size_t end2 = clock();
 	cout << "unordered_set insert:" << end2 - begin2 << endl;
 	int m1 = 0;
 	size_t begin3 = clock();
 	
 	for (auto e : v)
 	{
 		auto ret = s.find(e);
 		if (ret != s.end())
 		{
 			++m1;
 		}
 	}
 	size_t end3 = clock();
 	cout << "set find:" << end3 - begin3 << "->" << m1 << endl;
 	int m2 = 0;
 	size_t begin4 = clock();
 	
 	for (auto e : v)
 	{
 		auto ret = us.find(e);
 		if (ret != us.end())
 		{
 			++m2;
 		}
 	}
 	size_t end4 = clock();
 	cout << "unorered_set find:" << end4 - begin4 << "->" << m2 << endl;
 	cout << "插⼊数据个数：" << s.size() << endl;
 	cout << "插⼊数据个数：" << us.size() << endl << endl;
 	size_t begin5 = clock();
 	
 	for (auto e : v)
 	{
 		s.erase(e);
 	}
 	
 	size_t end5 = clock();
 	cout << "set erase:" << end5 - begin5 << endl;
 	size_t begin6 = clock();
 	for (auto e : v)
 	{
 		us.erase(e);
 	}
 	size_t end6 = clock();
 	cout << "unordered_set erase:" << end6 - begin6 << endl << endl;
 	return 0;
}

int main()
{
 	test_set2();
 
 	return 0;
}

1.4 unordered_map 和 map 的使用差异

cpp 复制代码

pair<iterator,bool> insert ( const value_type& val );
size_type erase ( const key_type& k );
iterator find ( const key_type& k );
mapped_type& operator[] ( const key_type& k );

查看文档我们会发现 unordered_map 的支持增删查改且跟 map 的使用⼀模⼀样，关于使用我们这里就不再赘述和演示了。
unordered_map 和 map 的第一个差异是对 key 的要求不同，map 要求 Key 支持小于比较，而 unordered_map 要求 Key 支持转成整形且支持等于比较，要理解 unordered_map 的这个两点要求得后续我们结合哈希表底层实现才能真正理解，也就是说这本质是哈希表的要求。
unordered_map 和 map 的第二个差异是迭代器的差异，map 的 iterator 是双向迭代器，unordered_map 是单向迭代器，其次map 底层是红黑树，红黑树是二叉搜索树，走中序遍历是有序的，所以 map 迭代器遍历是 Key 有序 + 去重。而 unordered_map 底层是哈希表，迭代器遍历是 Key 无序 + 去重。
unordered_map 和 map 的第三个差异是性能的差异，整体而言大多数场景下，unordered_map 的增删查改更快一些，因为红黑树增删查改效率是O(logN) ，⽽哈希表增删查平均效率是O(1)，具体可以参看下面代码的演示的对比差异。

1.5 unordered_multimap / unordered_multiset

unordered_multimap / unordered_multiset 跟 multimap / multiset 功能完全类似，支持 Key 冗余。
unordered_multimap / unordered_multiset 跟 multimap / multiset 的差异也是三个方面的差异，key 的要求的差异，iterator 及遍历顺序的差异，性能的差异。

1.6 unordered_xxx 的哈希相关接口

Buckets 和 Hash policy 系列的接口分别是跟哈希桶和负载因子相关的接口，日常使用的角度我们不需要太关注，

后面学习了哈希表底层，我们再来看这个系列的接口，一目了然。