C++ map和set - 技术栈

一、关联式容器

在初阶阶段，我们已经接触过STL中的部分容器，比如：vector、list、deque forward_list(C++11)等，这些容器统称为序列式容器，因为其底层为线性序列的数据结构，里面存储的是元素本身。那什么是关联式容器？它与序列式容器有什么区别？

关联式容器也是用来存储数据的，与序列式容器不同的是，其里面存储的是<key, value>结构的

键值对，在数据检索时比序列式容器效率更高。

二、键值对

用来表示具有一一对应关系的一种结构，该结构中一般只包含两个成员变量key和value，key代

表键值，value表示与key对应的信息。比如：现在要建立一个英汉互译的字典，那该字典中必然

有英文单词与其对应的中文含义，而且，英文单词与其中文含义是一一对应的关系，即通过该应

该单词，在词典中就可以找到与其对应的中文含义SGI-STL中关于键值对的定义：

cpp 复制代码

template <class T1, class T2>
struct pair
{
    typedef T1 first_type;
    typedef T2 second_type;
    T1 first;
    T2 second;
    pair() 
        :first(T1())//key
        ,second(T2())//value
    {
    }

    pair(const T1& a, const T2& b) : first(a), second(b)
    {
    }
};

三、树形结构的关联式容器

根据应用场景的不桶，STL总共实现了两种不同结构的管理式容器：树型结构与哈希结构。树型结

构的关联式容器主要有四种：map、set、multimap、multiset。这四种容器的共同点是：使

用平衡搜索树(即红黑树)作为其底层结果，容器中的元素是一个有序的序列。下面一依次介绍每一个容器。

3.1 set

3.1.1 set的介绍

set介绍

set是按照一定次序存储元素的容器
在set中，元素的value也标识它(value就是key，类型为T)，并且每个value必须是唯一的。set中的元素不能在容器中修改(元素总是const)，但是可以从容器中插入或删除它们。
在内部，set中的元素总是按照其内部比较对象(类型比较)所指示的特定严格弱排序准则进行序。
set容器通过key访问单个元素的速度通常比unordered_set容器慢，但它们允许根据顺序对子集进行直接迭代。
set在底层是用二叉搜索树(红黑树)实现的。

5.set也就是二叉搜索树key的搜索模型

注意：

1.与map / multimap不同，map / multimap中存储的是真正的键值对<key, value>，set中只放value，但在底层实际存放的是由<value, value>构成的键值对。

2.set中插入元素时，只需要插入value即可，不需要构造键值对。

3.set中的元素不可以重复(因此可以使用set进行去重)。

4.使用set的迭代器遍历set中的元素，可以得到有序序列

5.set中的元素默认按照小于来比较

6.set中查找某个元素，时间复杂度为：log_2 n

7.set中的元素不允许修改(为什么?)

8.set中的底层使用二叉搜索树(红黑树)来实现。

3.1.2set的使用：

set模板参数列表：

T: set中存放元素的类型，实际在底层存储的键值对

Compare：set中元素默认按照小于来比较

Alloc：set中元素空间的管理方式，使用STL提供的空间配置器管理

set相关成员函数：

set使用：

cpp 复制代码

void test_set1()
{
	//set排序
	set<int> s;
	s.insert(2);
	s.insert(1);
	s.insert(5);
	s.insert(3);
	s.insert(4);
	//set去重
	s.insert(2);
	s.insert(1);
	s.insert(5);
	s.insert(3);
	s.insert(4);

	set<int>::iterator it = s.begin();
	while (it != s.end())
	{
		cout << *it << " ";
		++it;
	}
	cout << endl;

	//删除3
	auto pos = s.find(3);
	if (pos != s.end())
	{
		s.erase(pos);
	}
	//要删除也可以直接八值给s删除
	s.erase(1);
}
void test_set2()
{
	// 用数组array中的元素构造set
	int array[] = { 1, 3, 5, 7, 9, 2, 4, 6, 8, 0, 1, 3, 5, 7, 9, 2, 4, 6, 8, 0 };
	set<int> s(array, array + sizeof(array) / sizeof(array));
	cout << s.size() << endl;

	// 正向打印set中的元素，从打印结果中可以看出：set可去重
	for (auto& e : s)
	{
		cout << e << " ";
	}
	cout << endl;

	// 使用迭代器逆向打印set中的元素
	for (auto it = s.rbegin(); it != s.rend(); ++it)
	{
		cout << *it << " ";
	}
	cout << endl;

	// set中值为3的元素出现了几次
	cout << s.count(3) << endl;
}
void test_set3()
{
	set<int> myset;
	set<int>::iterator itlow, itup;

	for (int i = 1; i < 10; i++) // 10 20 30 40 50 60 70 80 90
	{
		myset.insert(i * 10);
	}

	//[itlow , itup）
	itlow = myset.lower_bound(30);                //lower_bound返回的是>=这个值的节点    
	itup = myset.upper_bound(60);                 //upper_bound返回的是>这个值的节点

	myset.erase(itlow, itup);                     // 10 20 70 80 90
	for (auto e : myset)
	{
		cout << e << " ";
	}
	cout << endl;
}

3.2 multiset

3.2.1multiset的介绍

multiset是按照特定顺序存储元素的容器，其中元素是可以重复的。
在multiset中，元素的value也会识别它(因为multiset中本身存储的就是<value, value>组成的键值对，因此value本身就是key，key就是value，类型为T).multiset元素的值不能在容器中进行修改(因为元素总是const的)，但可以从容器中插入或删除。
在内部，multiset中的元素总是按照其内部比较规则(类型比较)所指示的特定严格弱排序准则进行排序。
multiset容器通过key访问单个元素的速度通常比unordered_multiset容器慢，但当使用迭代器遍历时会得到一个有序序列。
multiset底层结构为二叉搜索树(红黑树)。

3.2.2multiset的使用

cpp 复制代码

void test_multiset()
{
	multiset<int> s;
	//multiset排序但是不去重
	s.insert(2);
	s.insert(3);
	s.insert(2);
	s.insert(3); 
	s.insert(2);
	s.insert(3);
	s.insert(4);
	for (auto e : s)
	{
		cout << e << " ";
	}

	//输出3出现的次数
	cout << s.count(3) << endl;

	//使用find查找3会返回中序的3
	multiset<int>::iterator pos = s.find(3);
	while (pos != s.end())
	{
		cout << *pos << " ";
		++pos;
	}
	cout << endl;

	//删除出现的3
	auto ret = s.equal_range(3);
	auto itlow = ret.first;
	auto itup = ret.second;
	//删除[itlow， itup）
	s.erase(itlow, itup);
	for (auto e: s)
	{
		cout << e << " ";
	}
	cout << endl;
}

注意：

multiset中再底层中存储的是<value, value>的键值对
mtltiset的插入接口中只需要插入即可
与set的区别是，multiset中的元素可以重复，set是中value是唯一的
使用迭代器对multiset中的元素进行遍历，可以得到有序的序列
multiset中的元素不能修改
在multiset中找某个元素，时间复杂度为O(log_2 N)
multiset的作用：可以对元素进行排序

3.3 map

3.3.1 map的介绍

map是关联容器，它按照特定的次序(按照key来比较)存储由键值key和值value组合而成的元素。
在map中，键值key通常用于排序和惟一地标识元素，而值value中存储与此键值key关联的内容。键值key和值value的类型可能不同，并且在map的内部，key与value通过成员类型value_type绑定在一起，为其取别名称为pair :

cpp 复制代码

typedef pair<const key, T> value_type;

在内部，map中的元素总是按照键值key进行比较排序的。
map中通过键值访问单个元素的速度通常比unordered_map容器慢，但map允许根据顺序对元素进行直接迭代(即对map中的元素进行迭代时，可以得到一个有序的序列)。
map支持下标访问符，即在\[\]中放入key，就可以找到与key对应的value。
map通常被实现为二叉搜索树(更准确的说：平衡二叉搜索树(红黑树))

注意：map是典型的key_value模型

3.3.2 map的使用

map的模板参数说明

key: 键值对中key的类型。

T：键值对中value的类型。

Compare : 比较器的类型，map中的元素是按照key来比较的，缺省情况下按照小于来比较，一般情况下(内置类型元素)该参数不需要传递，如果无法比较时(自定义类型)，需要用户自己显式传递比较规则(一般情况下按照函数指针或者仿函数来传递)。

Alloc：通过空间配置器来申请底层空间，不需要用户传递，除非用户不想使用标准库提供的空间配置器。

map的成员函数：

map的使用：

cpp 复制代码

void test_map1()
{
	map<string, string> m1;
	//第一种写法：
	pair<string, string> p1("hello", "你好");
	m1.insert(p1);
	//第二种写法：
	m1.insert(pair<string, string>("miss", "想念"));
	//第三种写法：
	m1.insert(make_pair("love", "爱"));//C++98
	//第四种写法：
	m1.insert({ "person","人" });//C++11支持的多参数的构造函数隐式类型的转换

	//隐式类型的转换+优化
	string str1 = "name";
	pair<string, string> p = { "name","名字" };
}

注意：

关于insert，它不仅可以实现插入，也可以实现查找的功能：

insert的返回类型：pair<iterator,bool>

1.如果插入的值在树中不存在，那么返回类型就是pair<iterator,true>，这里的迭代器是插入的节点位置。

2.如果插入的值在树种已经存在，那么返回类型就是pair<iterator,false>,这里的迭代器就是找到的与插入节点相等的节点位置。

cpp 复制代码

void test_map2()
{
	//构造一个字典
	map<string, string> m1;
	m1.insert(make_pair("hello", "你好"));
	m1.insert(make_pair("love", "爱"));
	m1.insert(make_pair("like", "喜欢"));
	m1.insert(make_pair("miss", "想念、错过"));

	//key相同，value不相同，不插入不覆盖
	m1.insert(make_pair("miss", "xxxx"));

	//遍历m1(迭代器)
	map<string, string>::iterator it = m1.begin();
	while (it != m1.end())
	{
		cout << (*it).first << ":" << (*it).second << endl;
		//也可以使用箭头进行访问
		cout << it->first << ":" << it->second << endl;
		++it;
	}
	cout << endl;

	//范围for的遍历
	for (const auto& e : m1)//此处的e相当于前面的*it
	{
		cout << e.first << ":" << e.second;
	}

	//由于key不能改，而value可以改：所以first不能改，而second可以改
	map<string, string>::iterator it1 = m1.begin();
	while (it1 != m1.end());
	{
		(*it1).second = "xxxx";
		++it1;
	}
}
void test_map3()
{
	//统计次数
	string arr[] = { "苹果", "西瓜", "苹果", "西瓜", "苹果", "苹果", "西瓜","苹果", "香蕉", "苹果", "香蕉" ,"草莓" };
	map<string, int> countmap;
	for (auto element : arr)
	{
		map<string,int>::iterator it = countmap.find(element);
		if (it == countmap.end())
		{
			countmap.insert(make_pair(element, 1));
		}
		else
		{
			it->second++;
		}
	}
	for (const auto& element : countmap)
	{
		cout << element.first << ":" << element.second << endl;
	}
}
void test_map4()
{
	//统计次数
	string arr[] = { "苹果", "西瓜", "苹果", "西瓜", "苹果", "苹果", "西瓜","苹果", "香蕉", "苹果", "香蕉" ,"草莓" };
	map<string, int> countmap;
	for (auto element : arr)
	{
		//[key]运算符中的方括号重载，方括号中给key，返回value的引用，所以可以直接++
		countmap[element]++;
	}
	for (const auto& element : countmap)
	{
		cout << element.first << ":" << element.second << endl;
	}
}
//注意：operator[ ]是使用insert实现的

void test_map5()
{
	//map中[ ]的使用
	map<string, string> m1;
	m1.insert(make_pair("hello", "你好"));
	m1.insert(make_pair("love", "爱"));
	m1.insert(make_pair("like", "喜欢"));
	m1.insert(make_pair("miss", "想念、错过"));

	m1["sort"];//插入
	m1["like"];//查找或读取
	m1["miss"] = "xxx";//修改
	m1["map"] = "地图";//插入+修改

	for (auto element : m1)
	{
		cout << element.first << "：" << element.second << endl;
	}
}

3.3.3map在题目中的应用

map通常使用场景是成对的一些东西的使用可以使用map的

题目：随机链表的复制

使用map可以帮助我们实现：

cpp 复制代码

class Node 
{
public:
	int val;
	Node* next;
	Node* random;
	Node(int _val) 
	{
		val = _val;
		next = NULL;
		random = NULL;
	}
};
class Solution 
{
public:
	Node* copyRandomList(Node* head) 
	{
		map<Node*, Node*> copymap;
		Node* copyhead = nullptr;
		Node* copytail = nullptr;
		Node* cur = head;
		//拷贝每个节点
		while (cur)
		{
			Node* newnode = new Node(cur->val);
			if (copytail == nullptr)
			{
				copyhead = copytail = newnode;
			}
			else
			{
				copytail->next = newnode;
				copytail = copytail->next;
			}
			//将每个节点与他的拷贝节点给映射起来
			copymap[cur] = newnode;
			cur = cur->next;
		}
		//控制random
		cur = head;
		Node* copy = copyhead;
		while (cur)
		{
			if (cur->random == nullptr)
			{
				copy->random = nullptr;
			}
			else
			{
				copy->random = copymap[cur->random];
			}
			cur = cur->next;
			copy = copy->next;
		}
		return copyhead;
	}
};

3.4multimap

3.4.1multimap的介绍：

Multimaps是关联式容器，它按照特定的顺序，存储由key和value映射成的键值对<key, value > ，其中多个键值对之间的key是可以重复的。
在multimap中，通常按照key排序和惟一地标识元素，而映射的value存储与key关联的内容。key和value的类型可能不同，通过multimap内部的成员类型value_type组合在一起，value_type是组合key和value的键值对 :

cpp 复制代码

typedef pair<const Key, T> value_type;

在内部，multimap中的元素总是通过其内部比较对象，按照指定的特定严格弱排序标准对key进行排序的。
multimap通过key访问单个元素的速度通常比unordered_multimap容器慢，但是使用迭代器直接遍历multimap中的元素可以得到关于key有序的序列。
multimap在底层用二叉搜索树(红黑树)来实现。

注意：multimap和map的唯一不同就是：map中的key是唯一的，而multimap中key是可以重复的。

3.4.2multimap的使用

multimap和multiset的操作是一样的：

注意：

multimap中的key是可以重复的。
multimap中的元素默认将key按照小于来比较
multimap中没有重载operator\[\]操作(同学们可思考下为什么 ? )。
使用时与map包含的头文件相同：

四、map和set相关OJ题目

题目一、两个数组的交集

给定两个数组nums1和nums2，返回它们的交集,输出结果中的每个元素一定是唯一的

我们可以不考虑输出结果的顺序

思路1：放进set中去重，然后遍历一个数组中的数据，判断在不在另一个，在就是交集

思路2：放进set中去重，并且中序出来有序的数组，然后求交集：从头开始依次比较

较小的值就进行++，相等就是交集值，同时++

注意：思路2的时间复杂度是O（N）

cpp 复制代码

class Solution 
{
public:
    vector<int> intersection(vector<int>& nums1, vector<int>& nums2) 
    {
        set<int> s1(nums1.begin(), nums1.end());
        set<int> s2(nums2.begin(), nums2.end());
        vector<int> v;
        set<int>::iterator it1 = s1.begin();
        set<int>::iterator it2 = s2.begin();

        while (it1 != s1.end() && it2 != s2.end())
        {
            //较小的值就进行++，相等就是交集值，同时++
            if ((*it1) < (*it2))
            {
                it1++;
            }
            else if ((*it2) < (*it1))
            {
                ++it2;
            }
            else
            {
                v.push_back(*it1);
                ++it1;
                ++it2;
            }
        }
        return v;
    }
};

总结：找交集和差集的方法：

题目二、前K个高频单词

给定一个单词列表words和一个整数k，返回前k个出现次数最多的单词，返回的答案应该按单词出现频率由高到低排序。如果不同的单词有相同出现频率，按字典顺序排序

思路：把在vector中的单词依次放进map中，并且统计次数，然后在将其单词和出现的次数按照

pair<string,int>放进vector中，然后在vector中使用stable_sort仅从排序，最后把前k个放进vector中

cpp 复制代码

class Solution 
{
public:
    //定义一个比较value的比较仿函数
    struct compare
    {
    public:
        bool operator()(const pair<string, int>& p1, const pair<string, int>& p2)
        {
            return p1.second > p2.second;
        }
    };
    vector<string> topKFrequent(vector<string>& words, int k) 
    {
        map<string, int> countmap;
        for (const auto& element : words)
        {
            countmap[element]++;
        }

        //将mapcount中的元素依次放进vector中
        vector<pair<string, int>> kvv(countmap.begin(), countmap.end());

        //将kvv中的元素按照value的类型进行排序，使用stable_sort更稳定
        stable_sort(kvv.begin(), kvv.end(), compare());

        //把前k个对象放进另一个vector中
        vector<string> v;
        for (size_t i = 0; i < k; i++)
        {
            v.push_back(kvv[i].first);
       }
        return v;
    }
};