一、关联式容器
在初阶阶段,我们已经接触过STL中的部分容器,比如:vector、list、deque forward_list(C++11)等,这些容器统称为序列式容器,因为其底层为线性序列的数据结构,里面存储的是元素本身。那什么是关联式容器?它与序列式容器有什么区别?
关联式容器也是用来存储数据的,与序列式容器不同的是,其里面存储的是<key, value>结构的
键值对,在数据检索时比序列式容器效率更高。
二、键值对
用来表示具有一一对应关系的一种结构,该结构中一般只包含两个成员变量key和value,key代
表键值,value表示与key对应的信息。比如:现在要建立一个英汉互译的字典,那该字典中必然
有英文单词与其对应的中文含义,而且,英文单词与其中文含义是一一对应的关系,即通过该应
该单词,在词典中就可以找到与其对应的中文含义SGI-STL中关于键值对的定义:
cpp
template <class T1, class T2>
struct pair
{
typedef T1 first_type;
typedef T2 second_type;
T1 first;
T2 second;
pair()
:first(T1())//key
,second(T2())//value
{
}
pair(const T1& a, const T2& b) : first(a), second(b)
{
}
};
三、树形结构的关联式容器
根据应用场景的不桶,STL总共实现了两种不同结构的管理式容器:树型结构与哈希结构。树型结
构的关联式容器主要有四种:map、set、multimap、multiset。这四种容器的共同点是:使
用平衡搜索树(即红黑树)作为其底层结果,容器中的元素是一个有序的序列。下面一依次介绍每一个容器。
3.1 set
3.1.1 set的介绍
set介绍
-
set是按照一定次序存储元素的容器
-
在set中,元素的value也标识它(value就是key,类型为T),并且每个value必须是唯一的。set中的元素不能在容器中修改(元素总是const),但是可以从容器中插入或删除它们。
-
在内部,set中的元素总是按照其内部比较对象(类型比较)所指示的特定严格弱排序准则进行序。
-
set容器通过key访问单个元素的速度通常比unordered_set容器慢,但它们允许根据顺序对子集进行直接迭代。
-
set在底层是用二叉搜索树(红黑树)实现的。
5.set也就是二叉搜索树key的搜索模型

注意:
1.与map / multimap不同,map / multimap中存储的是真正的键值对<key, value>,set中只放value,但在底层实际存放的是由<value, value>构成的键值对。
2.set中插入元素时,只需要插入value即可,不需要构造键值对。
3.set中的元素不可以重复(因此可以使用set进行去重)。
4.使用set的迭代器遍历set中的元素,可以得到有序序列
5.set中的元素默认按照小于来比较
6.set中查找某个元素,时间复杂度为:log_2 n
7.set中的元素不允许修改(为什么?)
8.set中的底层使用二叉搜索树(红黑树)来实现。
3.1.2set的使用:
set模板参数列表:

T: set中存放元素的类型,实际在底层存储的键值对
Compare:set中元素默认按照小于来比较
Alloc:set中元素空间的管理方式,使用STL提供的空间配置器管理
set相关成员函数:

set使用:
cpp
void test_set1()
{
//set排序
set<int> s;
s.insert(2);
s.insert(1);
s.insert(5);
s.insert(3);
s.insert(4);
//set去重
s.insert(2);
s.insert(1);
s.insert(5);
s.insert(3);
s.insert(4);
set<int>::iterator it = s.begin();
while (it != s.end())
{
cout << *it << " ";
++it;
}
cout << endl;
//删除3
auto pos = s.find(3);
if (pos != s.end())
{
s.erase(pos);
}
//要删除也可以直接八值给s删除
s.erase(1);
}
void test_set2()
{
// 用数组array中的元素构造set
int array[] = { 1, 3, 5, 7, 9, 2, 4, 6, 8, 0, 1, 3, 5, 7, 9, 2, 4, 6, 8, 0 };
set<int> s(array, array + sizeof(array) / sizeof(array));
cout << s.size() << endl;
// 正向打印set中的元素,从打印结果中可以看出:set可去重
for (auto& e : s)
{
cout << e << " ";
}
cout << endl;
// 使用迭代器逆向打印set中的元素
for (auto it = s.rbegin(); it != s.rend(); ++it)
{
cout << *it << " ";
}
cout << endl;
// set中值为3的元素出现了几次
cout << s.count(3) << endl;
}
void test_set3()
{
set<int> myset;
set<int>::iterator itlow, itup;
for (int i = 1; i < 10; i++) // 10 20 30 40 50 60 70 80 90
{
myset.insert(i * 10);
}
//[itlow , itup)
itlow = myset.lower_bound(30); //lower_bound返回的是>=这个值的节点
itup = myset.upper_bound(60); //upper_bound返回的是>这个值的节点
myset.erase(itlow, itup); // 10 20 70 80 90
for (auto e : myset)
{
cout << e << " ";
}
cout << endl;
}
3.2 multiset
3.2.1multiset的介绍
-
multiset是按照特定顺序存储元素的容器,其中元素是可以重复的。
-
在multiset中,元素的value也会识别它(因为multiset中本身存储的就是<value, value>组成的键值对,因此value本身就是key,key就是value,类型为T).multiset元素的值不能在容器中进行修改(因为元素总是const的),但可以从容器中插入或删除。
-
在内部,multiset中的元素总是按照其内部比较规则(类型比较)所指示的特定严格弱排序准则进行排序。
-
multiset容器通过key访问单个元素的速度通常比unordered_multiset容器慢,但当使用迭代器遍历时会得到一个有序序列。
-
multiset底层结构为二叉搜索树(红黑树)。

3.2.2multiset的使用
cpp
void test_multiset()
{
multiset<int> s;
//multiset排序但是不去重
s.insert(2);
s.insert(3);
s.insert(2);
s.insert(3);
s.insert(2);
s.insert(3);
s.insert(4);
for (auto e : s)
{
cout << e << " ";
}
//输出3出现的次数
cout << s.count(3) << endl;
//使用find查找3会返回中序的3
multiset<int>::iterator pos = s.find(3);
while (pos != s.end())
{
cout << *pos << " ";
++pos;
}
cout << endl;
//删除出现的3
auto ret = s.equal_range(3);
auto itlow = ret.first;
auto itup = ret.second;
//删除[itlow, itup)
s.erase(itlow, itup);
for (auto e: s)
{
cout << e << " ";
}
cout << endl;
}
注意:
-
multiset中再底层中存储的是<value, value>的键值对
-
mtltiset的插入接口中只需要插入即可
-
与set的区别是,multiset中的元素可以重复,set是中value是唯一的
-
使用迭代器对multiset中的元素进行遍历,可以得到有序的序列
-
multiset中的元素不能修改
-
在multiset中找某个元素,时间复杂度为O(log_2 N)
-
multiset的作用:可以对元素进行排序
3.3 map
3.3.1 map的介绍
-
map是关联容器,它按照特定的次序(按照key来比较)存储由键值key和值value组合而成的元素。
-
在map中,键值key通常用于排序和惟一地标识元素,而值value中存储与此键值key关联的内容。键值key和值value的类型可能不同,并且在map的内部,key与value通过成员类型value_type绑定在一起,为其取别名称为pair :
cpp
typedef pair<const key, T> value_type;
-
在内部,map中的元素总是按照键值key进行比较排序的。
-
map中通过键值访问单个元素的速度通常比unordered_map容器慢,但map允许根据顺序对元素进行直接迭代(即对map中的元素进行迭代时,可以得到一个有序的序列)。
-
map支持下标访问符,即在[]中放入key,就可以找到与key对应的value。
-
map通常被实现为二叉搜索树(更准确的说:平衡二叉搜索树(红黑树))

注意:map是典型的key_value模型
3.3.2 map的使用
map的模板参数说明

key: 键值对中key的类型。
T: 键值对中value的类型。
Compare : 比较器的类型,map中的元素是按照key来比较的,缺省情况下按照小于来比较,一般情况下(内置类型元素)该参数不需要传递,如果无法比较时(自定义类型),需要用户自己显式传递比较规则(一般情况下按照函数指针或者仿函数来传递)。
Alloc:通过空间配置器来申请底层空间,不需要用户传递,除非用户不想使用标准库提供的空间配置器。
map的成员函数:

map的使用:
cpp
void test_map1()
{
map<string, string> m1;
//第一种写法:
pair<string, string> p1("hello", "你好");
m1.insert(p1);
//第二种写法:
m1.insert(pair<string, string>("miss", "想念"));
//第三种写法:
m1.insert(make_pair("love", "爱"));//C++98
//第四种写法:
m1.insert({ "person","人" });//C++11支持的多参数的构造函数隐式类型的转换
//隐式类型的转换+优化
string str1 = "name";
pair<string, string> p = { "name","名字" };
}
注意:
关于insert,它不仅可以实现插入,也可以实现查找的功能:
insert的返回类型:pair<iterator,bool>
1.如果插入的值在树中不存在,那么返回类型就是pair<iterator,true>,这里的迭代器是插入的节点位置。
2.如果插入的值在树种已经存在,那么返回类型就是pair<iterator,false>,这里的迭代器就是找到的与插入节点相等的节点位置。
cpp
void test_map2()
{
//构造一个字典
map<string, string> m1;
m1.insert(make_pair("hello", "你好"));
m1.insert(make_pair("love", "爱"));
m1.insert(make_pair("like", "喜欢"));
m1.insert(make_pair("miss", "想念、错过"));
//key相同,value不相同,不插入不覆盖
m1.insert(make_pair("miss", "xxxx"));
//遍历m1(迭代器)
map<string, string>::iterator it = m1.begin();
while (it != m1.end())
{
cout << (*it).first << ":" << (*it).second << endl;
//也可以使用箭头进行访问
cout << it->first << ":" << it->second << endl;
++it;
}
cout << endl;
//范围for的遍历
for (const auto& e : m1)//此处的e相当于前面的*it
{
cout << e.first << ":" << e.second;
}
//由于key不能改,而value可以改:所以first不能改,而second可以改
map<string, string>::iterator it1 = m1.begin();
while (it1 != m1.end());
{
(*it1).second = "xxxx";
++it1;
}
}
void test_map3()
{
//统计次数
string arr[] = { "苹果", "西瓜", "苹果", "西瓜", "苹果", "苹果", "西瓜","苹果", "香蕉", "苹果", "香蕉" ,"草莓" };
map<string, int> countmap;
for (auto element : arr)
{
map<string,int>::iterator it = countmap.find(element);
if (it == countmap.end())
{
countmap.insert(make_pair(element, 1));
}
else
{
it->second++;
}
}
for (const auto& element : countmap)
{
cout << element.first << ":" << element.second << endl;
}
}
void test_map4()
{
//统计次数
string arr[] = { "苹果", "西瓜", "苹果", "西瓜", "苹果", "苹果", "西瓜","苹果", "香蕉", "苹果", "香蕉" ,"草莓" };
map<string, int> countmap;
for (auto element : arr)
{
//[key]运算符中的方括号重载,方括号中给key,返回value的引用,所以可以直接++
countmap[element]++;
}
for (const auto& element : countmap)
{
cout << element.first << ":" << element.second << endl;
}
}
//注意:operator[ ]是使用insert实现的
void test_map5()
{
//map中[ ]的使用
map<string, string> m1;
m1.insert(make_pair("hello", "你好"));
m1.insert(make_pair("love", "爱"));
m1.insert(make_pair("like", "喜欢"));
m1.insert(make_pair("miss", "想念、错过"));
m1["sort"];//插入
m1["like"];//查找或读取
m1["miss"] = "xxx";//修改
m1["map"] = "地图";//插入+修改
for (auto element : m1)
{
cout << element.first << ":" << element.second << endl;
}
}
3.3.3map在题目中的应用
map通常使用场景是成对的一些东西的使用可以使用map的[ ]
题目:随机链表的复制

使用map可以帮助我们实现:
cpp
class Node
{
public:
int val;
Node* next;
Node* random;
Node(int _val)
{
val = _val;
next = NULL;
random = NULL;
}
};
class Solution
{
public:
Node* copyRandomList(Node* head)
{
map<Node*, Node*> copymap;
Node* copyhead = nullptr;
Node* copytail = nullptr;
Node* cur = head;
//拷贝每个节点
while (cur)
{
Node* newnode = new Node(cur->val);
if (copytail == nullptr)
{
copyhead = copytail = newnode;
}
else
{
copytail->next = newnode;
copytail = copytail->next;
}
//将每个节点与他的拷贝节点给映射起来
copymap[cur] = newnode;
cur = cur->next;
}
//控制random
cur = head;
Node* copy = copyhead;
while (cur)
{
if (cur->random == nullptr)
{
copy->random = nullptr;
}
else
{
copy->random = copymap[cur->random];
}
cur = cur->next;
copy = copy->next;
}
return copyhead;
}
};
3.4multimap
3.4.1multimap的介绍:
-
Multimaps是关联式容器,它按照特定的顺序,存储由key和value映射成的键值对<key, value > ,其中多个键值对之间的key是可以重复的。
-
在multimap中,通常按照key排序和惟一地标识元素,而映射的value存储与key关联的内容。key和value的类型可能不同,通过multimap内部的成员类型value_type组合在一起,value_type是组合key和value的键值对 :
cpp
typedef pair<const Key, T> value_type;
-
在内部,multimap中的元素总是通过其内部比较对象,按照指定的特定严格弱排序标准对key进行排序的。
-
multimap通过key访问单个元素的速度通常比unordered_multimap容器慢,但是使用迭代器直接遍历multimap中的元素可以得到关于key有序的序列。
-
multimap在底层用二叉搜索树(红黑树)来实现。
注意:multimap和map的唯一不同就是:map中的key是唯一的,而multimap中key是可以重复的。

3.4.2multimap的使用
multimap和multiset的操作是一样的:

注意:
-
multimap中的key是可以重复的。
-
multimap中的元素默认将key按照小于来比较
-
multimap中没有重载operator[]操作(同学们可思考下为什么 ? )。
-
使用时与map包含的头文件相同:
四、map和set相关OJ题目
题目一、两个数组的交集
给定两个数组nums1和nums2,返回它们的交集,输出结果中的每个元素一定是唯一的
我们可以不考虑输出结果的顺序

思路1:放进set中去重,然后遍历一个数组中的数据,判断在不在另一个,在就是交集
思路2:放进set中去重,并且中序出来有序的数组,然后求交集:从头开始依次比较
较小的值就进行++,相等就是交集值,同时++
注意:思路2的时间复杂度是O(N)
cpp
class Solution
{
public:
vector<int> intersection(vector<int>& nums1, vector<int>& nums2)
{
set<int> s1(nums1.begin(), nums1.end());
set<int> s2(nums2.begin(), nums2.end());
vector<int> v;
set<int>::iterator it1 = s1.begin();
set<int>::iterator it2 = s2.begin();
while (it1 != s1.end() && it2 != s2.end())
{
//较小的值就进行++,相等就是交集值,同时++
if ((*it1) < (*it2))
{
it1++;
}
else if ((*it2) < (*it1))
{
++it2;
}
else
{
v.push_back(*it1);
++it1;
++it2;
}
}
return v;
}
};
总结:找交集和差集的方法:

题目二、前K个高频单词
给定一个单词列表words和一个整数k,返回前k个出现次数最多的单词,返回的答案应该按单词出现频率由高到低排序。如果不同的单词有相同出现频率,按字典顺序排序

思路:把在vector中的单词依次放进map中,并且统计次数,然后在将其单词和出现的次数按照
pair<string,int>放进vector中,然后在vector中使用stable_sort仅从排序,最后把前k个放进vector中
cpp
class Solution
{
public:
//定义一个比较value的比较仿函数
struct compare
{
public:
bool operator()(const pair<string, int>& p1, const pair<string, int>& p2)
{
return p1.second > p2.second;
}
};
vector<string> topKFrequent(vector<string>& words, int k)
{
map<string, int> countmap;
for (const auto& element : words)
{
countmap[element]++;
}
//将mapcount中的元素依次放进vector中
vector<pair<string, int>> kvv(countmap.begin(), countmap.end());
//将kvv中的元素按照value的类型进行排序,使用stable_sort更稳定
stable_sort(kvv.begin(), kvv.end(), compare());
//把前k个对象放进另一个vector中
vector<string> v;
for (size_t i = 0; i < k; i++)
{
v.push_back(kvv[i].first);
}
return v;
}
};