[C++进阶]map和set

一、关联式容器

STL中的部分容器，比如：vector、list、deque、forward_list(C++11)等，这些容器统称为序列式容器 ，因为其底层为线性序列的数据结构，里面存储的是元素本身。

那什么是关联式容器 ？它与序列式容器有什么区别？

关联式容器 也是用来存储数据的，与序列式容器 不同的是，其里面存储的是**<key, value>结构** 的键值对，在数据检索时比序列式容器 效率更高

二、pair键值对

用来表示具有一一对应关系的一种结构，该结构中一般只包含两个成员变量key和value，key代表键值，value表示与key对应的信息

stl里面对于pair的定义是这样的

cpp 复制代码

template <class T1, class T2>
struct pair
{
	typedef T1 first_type;
	typedef T2 second_type;
	T1 first;
	T2 second;
	pair() : first(T1()), second(T2())
	{}
	pair(const T1& a, const T2& b) : first(a), second(b)
	{}
};

pair有三种构造函数，不难看出，分别是无参的构造，拷贝构造，以及通过两个值来进行构造

除了三种构造函数以外，它还有一种方式，也可以生成pair对象。这个不是一个成员函数，所以可以直接使用

先看看这些,记住就好

三、set

1. set的介绍

如下图所示：

我们可以注意到它的模板参数是要比其他容器多一个的，这个容器我们也可以看到是一个仿函数。我们使用优先级队列的时候也用过这个仿函数。

集合是按照特定顺序存储唯一元素的容器。

在一个集合中，元素的值也标识它(值本身就是键，类型为 T)，并且每个值必须是唯一的。集合中元素的值在容器中不能修改(元素总是 const 类型的)，但是可以从容器中插入或删除元素。

在内部，集合中的元素总是按照其内部比较对象(类型为 Compare )指示的特定严格弱排序标准排序。

在通过键访问单个元素时，set 容器通常比 unordered_set 容器慢，但是它们允许基于次序对子集进行直接迭代。

集合通常以二叉搜索树的形式实现。这颗二叉搜索树是红黑树。

set其实就相当于key模型的二叉搜索树

注意：set里面的值是不可以被修改的，它实现这一点的原理就是将迭代器和const迭代器都是const迭代器没有任何区别。

2. set的部分接口

1.构造函数

可以注意到，一共有三个构造函数，第一个是全缺省的默认构造函数，第二个是迭代器区间构造，第三个是拷贝构造。

不过这个拷贝构造的代价比较大，因为它是一个树的拷贝，而且析构也一样有很大的代价。

2.insert

pair<iterator,bool> insert (const value_type& val);

pair<iterator,bool> insert (value_type&& val);

插入一个元素，返回一个pair对象，其中包含一个迭代器和bool值

如果插入成功（set中没有该元素），pair中存放插入位置的迭代器和true

如果插入失败（set中已经存在该元素），pair中存放对应元素的迭代器和false

3,erase

size_type erase (const value_type& val);

删除一个元素，返回删除的元素个数

6.find

const_iterator find (const value_type& val) const;

iterator find (const value_type& val);

在set中寻找目标元素并返回其位置的迭代器

如果没有该元素，则返回end()

7.count

size_type count (const value_type& val) const;

返回set中值为val的元素个数

因为set的去重性，所以返回值只会是0或1

8.size

size_type size() const noexcept;

返回set中的元素个数

10.lower_bound和upper_bound

将迭代器返回到下限

返回一个迭代器，该迭代器指向容器中的第一个元素，该元素不被视为位于 val 之前（即，它要么是等效的，要么是位于 val 之后）。

该函数使用其内部比较对象（key_comp）来确定这一点，并向第一个元素返回一个迭代器，key_comp（element，val）将返回 false。

如果使用默认比较类型（less）实例化 set 类，则该函数将返回一个迭代器到不小于 val 的第一个元素。

类似的成员函数 upper_bound 具有与 lower_bound 相同的行为，但集合包含等效于 val 的元素的情况除外：在这种情况下，lower_bound返回指向该元素的迭代器，而 upper_bound返回指向下一个元素的迭代器。

将迭代器返回到上限

返回一个迭代器，该迭代器指向容器中的第一个元素，该元素被视为位于 val 之后。

该函数使用其内部比较对象（key_comp）来确定这一点，并向第一个元素返回迭代器，key_comp（val，element）将返回 true。

如果 set 类使用默认比较类型（less）进行实例化，则该函数将返回一个大于 val 的第一个元素的迭代器。

类似的成员函数 lower_bound 具有与 upper_bound 相同的行为，但集合包含等效于 val 的元素的情况除外：在这种情况下，lower_bound返回指向该元素的迭代器，而 upper_bound返回指向下一个元素的迭代器。

我们继续写一段代码来测试:

cpp 复制代码

void test()
{
	set<int> myset;
	set<int>::iterator itlow, itup;

	for (int i = 1; i < 10; i++) myset.insert(i * 10); // 10 20 30 40 50 60 70 80 90

	itlow = myset.lower_bound(30);
	itup = myset.upper_bound(60);

	myset.erase(itlow, itup);   // 10 20 70 80 90

	for (auto e : myset)
	{
		cout << e << " ";
	}
	cout << endl;
}
int main()
{
	test();
	return 0;
}

运行结果:

lower_bound和upper_bound一个设置为>=，一个设置为<。这样刚好可以将我们输入值所处的区间进行控制，刚好满足左闭右开。无论是构造也好，删除也好，插入也好都是刚好十分方便的。

11. equal_range

获取相等元素的范围

返回一个范围的边界，该范围包括容器中等效于 val 的所有元素。

由于 set 容器中的所有元素都是唯一的，因此返回的范围最多包含单个元素。

如果未找到匹配项，则返回的范围长度为零，根据容器的内部比较对象（key_comp），两个迭代器都指向被视为位于 val 之后的第一个元素。

如果容器的比较对象反射性地返回 false（即，无论元素作为参数传递的顺序如何），则认为集合中的两个元素是等效的。

我们可以看这段代码:

cpp 复制代码

void test()
{
	std::set<int> myset;

	for (int i = 1; i <= 5; i++) myset.insert(i * 10);   // myset: 10 20 30 40 50

	std::pair<std::set<int>::const_iterator, std::set<int>::const_iterator> ret;
	ret = myset.equal_range(35);

	std::cout << "the lower bound points to: " << *(ret.first) << '\n';
	std::cout << "the upper bound points to: " << *(ret.second) << '\n';


	myset.erase(ret.first, ret.second);

	for (auto e : myset)
	{
		cout << e << " ";
	}
	cout << endl;
}
int main()
{
	test();
	return 0;
}

运行结果:

这是因为这段区间内并不存在35，所以会返回一个比他大的数值所在的区间。且这两个是相等的。如果我们要找的是等于30的区间的话，就是这样的。由于set里面没有重复元素，所以其实只能找到那一个元素，从这个容器的角度来看，似乎这个寻找相等区间的函数并没有什么太大的用处，还不如find呢？其实关于这些函数，主要还是为了另外一个容器设置的

3.multiset容器

这个容器是是一个允许键值冗余的一个容器，其接口和set一模一样。所以我们可以认为，刚刚的关于一些范围的容器，都是为了它而设计的

我们可以试用一下这个容器：

cpp 复制代码

void test()
{
	multiset<int> s;
	s.insert(1);
	s.insert(5);
	s.insert(2);
	s.insert(2);
	s.insert(6);
	s.insert(9);
	s.insert(8);
	s.insert(4);
	s.insert(4);
	s.insert(3);

	multiset<int>::iterator it = s.begin();
	while (it != s.end())
	{
		cout << *it << " ";
		it++;
	}
	cout << endl;
}
int main()
{
	test();
	return 0;
}

运行结果：

对于这个容器，find找到某个值，从找到的那个值开始进行打印，就会将从这个值以后的全部打印。其次我们的count也就可以计算出这个值的数量了，之前的在set中的count，由于set天然的去重了，所以只能用于检测是否存在某个值，而现在的话就可以统计数量了。然后关于我们的找某个数的范围，这个函数也就可以查找2的所有范围了。于是我们就可以删除掉2所在的区间了。

所以count和equal_range这两个函数对于multiset容器而言更有意义。

四、map

1.map的介绍

如下所示，这个容器一共有四个参数，Key和T

映射是关联容器，存储由键值和映射值按照特定顺序组合而成的元素。

在map中，键值通常用于排序和唯一标识元素，而映射值存储与该键相关联的内容。键和映射值的类型可能不同，组合在成员类型value_type中，这是一种组合了两者的pair类型:

cpp 复制代码

typdef pair<const Key, T> value_type;

在内部，map中的元素总是按照键进行严格的弱排序，排序标准由内部比较对象(类型为Compare)表示。在通过键访问各个元素时，Map容器通常比unordered_map容器慢，但它们允许根据键的顺序直接迭代子集。映射后的值可以通过方括号运算符((operator\[\])直接访问。

映射通常以二叉查找树的形式实现。这里的模板参数中，Key和T类似于key-val模型中的key和val的模板参数。这些模板类型都被define为了key_type和mapped_type。同时还有value_type就相当于将这两个给结合到一块，放到了pair容器中。方便我们操控里面的数据，并且里面的key_type给的是const类型，这就说明了map中的key是不可以被修改的，但是value是可以被修改的。

2. map的一些接口

1.insert

这个函数有三个重载，后两个是使用迭代器区间进行插入的。第一个是直接插入一个value_type类型的数据。value_type其实就是键值对，因为他是key-val模型的.

插入元素:

通过插入新元素来扩展容器，从而有效地通过插入的元素数来增加容器大小。

由于map中的元素键是唯一的，因此插入操作会检查每个插入的元素是否具有与容器中已有的元素的键等效的键，如果是，则不会插入该元素，从而返回一个迭代器到此现有元素（如果函数返回一个值）。

有关允许重复元素的类似容器，请参阅 multimap。

在map中插入元素的另一种方法是使用成员函数 map：：operator\[\]。

在内部，map容器按照其比较对象指定的标准，按键保持其所有元素的排序。元素始终按照此顺序插入到其各自的位置。

这些参数确定插入了多少个元素以及它们被初始化到哪些值：
对于这个函数的返回值，他返回的也是一个pair类型的对象。

如果插入的时候key已经在树里面，那么返回pair<树里面key的迭代器，false>

如果插入的时候key并未在树里面，那么返回pair<新插入key的迭代器，true>

所以insert从某种程度上也具有了查找的功能

如下代码所示，该段代码演示了我们对map里面插入数据的几种用法，我们可以直接传一个pair对象过去，也可以传pair的匿名对象，也可以使用make_pair函数来进行，当然我们可能会认为make_pair函数要通过调用一个函数来进行创建对象对否开销有点大，其实不是的，在这里编译器会直接将这个变成内联函数进行优化，实际效率相当于直接传入一个对象。除了前面三种以外，C++11还支持了多参数的构造函数隐式类型转换。所以我们可以直接使用多参数的构造函数隐式类型转换。

上面几种方式都是非常不错的，但是比较建议使用make_pair函数来创建。这个比较简洁，且有的C++编译器如果不支持C++11的话这个函数也是可以直接使用的。

在map里面我们取出的数据都是pair类型的，这是因为C++只能返回一个值，不能返回多个值。所以我们必须使用pair对象进行返回。然后C++也不支持pair的流插入和流提取，因为并没有进行重载。所以我们需要解引用后，拿到的只是一个结构体，我们还需要在访问里面的值。或者我们可以直接使用->也是很方便的。

cpp 复制代码

void test_map1()
{
	map<string, string> dict;
	pair<string, string> kv1("insert", "插入");
	dict.insert(kv1);
	dict.insert(pair<string, string>("sort", "排序"));
	dict.insert(make_pair("remove", "改革"));
	dict.insert({ "process","过程" });//C++11 多参数的构造函数隐式类型转换

	map<string, string>::iterator it = dict.begin();
	while (it != dict.end())
	{
		cout << (*it).first << (*it).second << endl;
		cout << it->first << it->second << endl;
		it++;
	}

	for (const auto& e : dict)
	{
		cout << e.first << " " << e.second << endl;
	}
}

int main()
{
	test_map1();
	return 0;
}

运行结果：

需要注意的是，如果插入的时候，key相同，但是val不相同，是不会插入进去的，也不会覆盖进去的。即插入过程中，只比较key。key相同就不插入了。

2.erase

上面是关于map的一些插入接口，还有一些接口是删除接口。也比较常见，三种删除，分别是直接删除某个迭代器位置的删除，或者给一个key去删除，注意不是val，只需要一个key就可以删除了。第三种就是删除一个迭代器区间。

我们也可以注意到，查找和删除都只与key有关系，与其他无关。
擦除元素

从容器中删除单个元素或一系列元素（[first，last））。

这有效地减小了容器尺寸，减少了被移除的元素数量，这些元素被破坏了。

3.find

获取元素的迭代器

在容器中搜索键等同 于 k 的元素，如果找到，则返回一个迭代器，否则返回一个迭代器到 map：：end。

如果容器的比较对象反射性地返回 false（即，无论元素作为参数传递的顺序如何），则认为两个键是等效的。

另一个成员函数 map：：count 可用于检查特定键是否存在。

4.count

对具有特定键的元素进行计数

在容器中搜索键等效于 k 的元素，并返回匹配项数。

由于map容器中的所有元素都是唯一的，因此该函数只能返回 1（如果找到元素）或 0 （否则）。

如果容器的比较对象反射性地返回 false（即，无论键作为参数传递的顺序如何），则认为两个键是等效的。

3. map的\[\]运算符重载

当我们使用map的insert接口和find接口的时候，我们可以来实现在之前二叉搜索树中的统计个数的代码。

cpp 复制代码

void test_map2()
{
	string arr[] = { "铅笔", "书本", "书本", "铅笔", "钢笔", "钢笔", "橡皮","铅笔", "橡皮", "书本", "橡皮" };
	map<string, int> countMap;
	for (auto e : arr)
	{
		map<string, int>::iterator pos = countMap.find(e);
		if (pos == countMap.end())
		{
			countMap.insert(make_pair(e, 1));
		}
		else
		{
			pos->second++;
		}
	}
	map<string, int>::iterator it = countMap.begin();
	while (it != countMap.end())
	{
		cout << it->first << ":" << it->second << endl;
		it++;
	}
}

int main()
{
	test_map2();
	return 0;
}

运行结果:

但是事实上我们可以将代码变得更加简洁。我们来看一下map的\[\]运算符重载

访问元素

如果 k 与容器中元素的键匹配，则该函数将返回对其映射值的引用。

如果 k 与容器中任何元素的键不匹配，则该函数将插入一个带有该键的新元素，并返回对其映射值的引用。请注意，即使没有为元素分配映射值（元素是使用其默认构造函数构造的），这也会始终将size增加 1。

类似的成员函数 map：：at 在具有键的元素存在时具有相同的行为，但在不存在时会引发异常。

对此函数的调用等效于：
cpp 复制代码
（*（（this->insert（make_pair（k，mapped_type（）））.first））.second

简而言之，就是给一个key，如果这个key在map中存在，返回它的val，如果不存在，那么就创建一个pair对象插入进去，这个pair对象的first是key,pair中的second是val类型的默认构造函数。

这样我们就可以将上面代码简化为下面代码了。countMap对象中，它的两个参数是string和int，第一次的时候不存在，所以会创建一个pair<string,int>对象。int则会调用它的默认构造函数，即结果为0。然后有一个++，所以最终会将这个值给插入进去。

cpp 复制代码

void test_map3()
{
	string arr[] = { "铅笔", "书本", "书本", "铅笔", "钢笔", "钢笔", "橡皮","铅笔", "橡皮", "书本", "橡皮" };
	map<string, int> countMap;
	for (auto e : arr)
	{
		countMap[e]++;
	}
	map<string, int>::iterator it = countMap.begin();
	while (it != countMap.end())
	{
		cout << it->first << ":" << it->second << endl;
		it++;
	}
}
int main()
{
	test_map3();
	return 0;
}

运行结果:

这个\[\]运算符重载其实就是靠插入函数实现的，因为无论插入成功与否，insert会返回一个pair对象，pair对象的first就是就是新插入进去结点或者已有结点的迭代器。然后我们直接访问这个迭代器指向的second即可。

除了上面的统计个数的场景，我们还可以试一下下面的单词翻译的场景

cpp 复制代码

void test_map4()
{
	map<string, string> dict;
	pair<string, string> kv1("insert", "插入");
	dict.insert(kv1);
	dict.insert(pair<string, string>("sort", "排序"));
	dict.insert(make_pair("remove", "改革"));
	dict.insert({ "process","过程" });//C++11 多参数的构造函数隐式类型转换

	dict["remov"] = "xxx";
	dict["process"] = "进程";
	dict["access"] = "接受，道路";
	cout << (dict["set"] = "集合") << endl;
	for (auto e : dict)
	{
		cout << e.first << " " << e.second << endl;
	}
}
int main()
{
	test_map4();
	return 0;
}

运行结果:

我们可以注意到，通过\[\]运算符重载，我们可以实现对原来的值进行修改，如果原来没有可以插入。也可以进行查找+插入等等一系列操作。

4. multimap容器

这个容器与map之间的关系就好像set与multiset之间的关系一样。接口都是一样的，不同的就是这个容器允许重复元素出现

还有一共不同就是这个容器没有提供\[\]运算符重载了，其实也是比较合理的，因为此时一个key可以有很多个val，是没法确定要哪一个的。

insert也有一些变化，他的返回值就不在是一共pair了，里面就没有所谓的bool了，只是单纯的返回新插入结点的迭代器，因为他插入永远成功

那么既然一个key可以有多个val,我们可以注意到他是可以根据key进行删除的，那么它是全删除掉吗？

擦除元素

从multimao容器中移除元素。

这有效地减小了容器size，减少了被移除的元素数量，这些元素被破坏了。

这些参数确定删除的元素：

本节主要讲解了map与set的基本使用。如有错误感谢指正!

[C++进阶]map和set

一、关联式容器

二、pair键值对

三、set

1. set的介绍

2. set的部分接口

1.构造函数

2.insert

3,erase

4.swap

5.clear

6.find

7.count

8.size

9.empty

10.lower_bound和upper_bound

11. equal_range

3.multiset容器

四、map

1.map的介绍

2. map的一些接口

1.insert

2.erase

3.find

4.count

3. map的\[\]运算符重载

4. multimap容器