C++ map和set

一、关联式容器

在初阶阶段,我们已经接触过STL中的部分容器,比如:vector、list、deque forward_list(C++11)等,这些容器统称为序列式容器,因为其底层为线性序列的数据结构,里面存储的是元素本身。那什么是关联式容器?它与序列式容器有什么区别?

关联式容器也是用来存储数据的,与序列式容器不同的是,其里面存储的是<key, value>结构的

键值对,在数据检索时比序列式容器效率更高。

二、键值对

用来表示具有一一对应关系的一种结构,该结构中一般只包含两个成员变量key和value,key代

表键值,value表示与key对应的信息。比如:现在要建立一个英汉互译的字典,那该字典中必然

有英文单词与其对应的中文含义,而且,英文单词与其中文含义是一一对应的关系,即通过该应

该单词,在词典中就可以找到与其对应的中文含义SGI-STL中关于键值对的定义:

cpp 复制代码
template <class T1, class T2>
struct pair
{
    typedef T1 first_type;
    typedef T2 second_type;
    T1 first;
    T2 second;
    pair() 
        :first(T1())//key
        ,second(T2())//value
    {
    }

    pair(const T1& a, const T2& b) : first(a), second(b)
    {
    }
};

三、树形结构的关联式容器

根据应用场景的不桶,STL总共实现了两种不同结构的管理式容器:树型结构与哈希结构。树型结

构的关联式容器主要有四种:map、set、multimap、multiset。这四种容器的共同点是:使

用平衡搜索树(即红黑树)作为其底层结果,容器中的元素是一个有序的序列。下面一依次介绍每一个容器。

3.1 set

3.1.1 set的介绍

set介绍

  1. set是按照一定次序存储元素的容器

  2. 在set中,元素的value也标识它(value就是key,类型为T),并且每个value必须是唯一的。set中的元素不能在容器中修改(元素总是const),但是可以从容器中插入或删除它们。

  3. 在内部,set中的元素总是按照其内部比较对象(类型比较)所指示的特定严格弱排序准则进行序。

  4. set容器通过key访问单个元素的速度通常比unordered_set容器慢,但它们允许根据顺序对子集进行直接迭代。

  5. set在底层是用二叉搜索树(红黑树)实现的。

5.set也就是二叉搜索树key的搜索模型

注意:

1.与map / multimap不同,map / multimap中存储的是真正的键值对<key, value>,set中只放value,但在底层实际存放的是由<value, value>构成的键值对。

2.set中插入元素时,只需要插入value即可,不需要构造键值对。

3.set中的元素不可以重复(因此可以使用set进行去重)。

4.使用set的迭代器遍历set中的元素,可以得到有序序列

5.set中的元素默认按照小于来比较

6.set中查找某个元素,时间复杂度为:log_2 n

7.set中的元素不允许修改(为什么?)

8.set中的底层使用二叉搜索树(红黑树)来实现。

3.1.2set的使用:

set模板参数列表:

T: set中存放元素的类型,实际在底层存储的键值对

Compare:set中元素默认按照小于来比较

Alloc:set中元素空间的管理方式,使用STL提供的空间配置器管理

set相关成员函数:

set使用:

cpp 复制代码
void test_set1()
{
	//set排序
	set<int> s;
	s.insert(2);
	s.insert(1);
	s.insert(5);
	s.insert(3);
	s.insert(4);
	//set去重
	s.insert(2);
	s.insert(1);
	s.insert(5);
	s.insert(3);
	s.insert(4);

	set<int>::iterator it = s.begin();
	while (it != s.end())
	{
		cout << *it << " ";
		++it;
	}
	cout << endl;

	//删除3
	auto pos = s.find(3);
	if (pos != s.end())
	{
		s.erase(pos);
	}
	//要删除也可以直接八值给s删除
	s.erase(1);
}
void test_set2()
{
	// 用数组array中的元素构造set
	int array[] = { 1, 3, 5, 7, 9, 2, 4, 6, 8, 0, 1, 3, 5, 7, 9, 2, 4, 6, 8, 0 };
	set<int> s(array, array + sizeof(array) / sizeof(array));
	cout << s.size() << endl;

	// 正向打印set中的元素,从打印结果中可以看出:set可去重
	for (auto& e : s)
	{
		cout << e << " ";
	}
	cout << endl;

	// 使用迭代器逆向打印set中的元素
	for (auto it = s.rbegin(); it != s.rend(); ++it)
	{
		cout << *it << " ";
	}
	cout << endl;

	// set中值为3的元素出现了几次
	cout << s.count(3) << endl;
}
void test_set3()
{
	set<int> myset;
	set<int>::iterator itlow, itup;

	for (int i = 1; i < 10; i++) // 10 20 30 40 50 60 70 80 90
	{
		myset.insert(i * 10);
	}

	//[itlow , itup)
	itlow = myset.lower_bound(30);                //lower_bound返回的是>=这个值的节点    
	itup = myset.upper_bound(60);                 //upper_bound返回的是>这个值的节点

	myset.erase(itlow, itup);                     // 10 20 70 80 90
	for (auto e : myset)
	{
		cout << e << " ";
	}
	cout << endl;
}

3.2 multiset

3.2.1multiset的介绍

  1. multiset是按照特定顺序存储元素的容器,其中元素是可以重复的。

  2. 在multiset中,元素的value也会识别它(因为multiset中本身存储的就是<value, value>组成的键值对,因此value本身就是key,key就是value,类型为T).multiset元素的值不能在容器中进行修改(因为元素总是const的),但可以从容器中插入或删除。

  3. 在内部,multiset中的元素总是按照其内部比较规则(类型比较)所指示的特定严格弱排序准则进行排序。

  4. multiset容器通过key访问单个元素的速度通常比unordered_multiset容器慢,但当使用迭代器遍历时会得到一个有序序列。

  5. multiset底层结构为二叉搜索树(红黑树)。

3.2.2multiset的使用

cpp 复制代码
void test_multiset()
{
	multiset<int> s;
	//multiset排序但是不去重
	s.insert(2);
	s.insert(3);
	s.insert(2);
	s.insert(3); 
	s.insert(2);
	s.insert(3);
	s.insert(4);
	for (auto e : s)
	{
		cout << e << " ";
	}

	//输出3出现的次数
	cout << s.count(3) << endl;

	//使用find查找3会返回中序的3
	multiset<int>::iterator pos = s.find(3);
	while (pos != s.end())
	{
		cout << *pos << " ";
		++pos;
	}
	cout << endl;

	//删除出现的3
	auto ret = s.equal_range(3);
	auto itlow = ret.first;
	auto itup = ret.second;
	//删除[itlow, itup)
	s.erase(itlow, itup);
	for (auto e: s)
	{
		cout << e << " ";
	}
	cout << endl;
}

注意:

  1. multiset中再底层中存储的是<value, value>的键值对

  2. mtltiset的插入接口中只需要插入即可

  3. 与set的区别是,multiset中的元素可以重复,set是中value是唯一的

  4. 使用迭代器对multiset中的元素进行遍历,可以得到有序的序列

  5. multiset中的元素不能修改

  6. 在multiset中找某个元素,时间复杂度为O(log_2 N)

  7. multiset的作用:可以对元素进行排序

3.3 map

3.3.1 map的介绍

  1. map是关联容器,它按照特定的次序(按照key来比较)存储由键值key和值value组合而成的元素。

  2. 在map中,键值key通常用于排序和惟一地标识元素,而值value中存储与此键值key关联的内容。键值key和值value的类型可能不同,并且在map的内部,key与value通过成员类型value_type绑定在一起,为其取别名称为pair :

cpp 复制代码
typedef pair<const key, T> value_type;
  1. 在内部,map中的元素总是按照键值key进行比较排序的。

  2. map中通过键值访问单个元素的速度通常比unordered_map容器慢,但map允许根据顺序对元素进行直接迭代(即对map中的元素进行迭代时,可以得到一个有序的序列)。

  3. map支持下标访问符,即在[]中放入key,就可以找到与key对应的value。

  4. map通常被实现为二叉搜索树(更准确的说:平衡二叉搜索树(红黑树))

注意:map是典型的key_value模型

3.3.2 map的使用

map的模板参数说明

key: 键值对中key的类型。

T: 键值对中value的类型。

Compare : 比较器的类型,map中的元素是按照key来比较的,缺省情况下按照小于来比较,一般情况下(内置类型元素)该参数不需要传递,如果无法比较时(自定义类型),需要用户自己显式传递比较规则(一般情况下按照函数指针或者仿函数来传递)。

Alloc:通过空间配置器来申请底层空间,不需要用户传递,除非用户不想使用标准库提供的空间配置器。

map的成员函数:

map的使用:

cpp 复制代码
void test_map1()
{
	map<string, string> m1;
	//第一种写法:
	pair<string, string> p1("hello", "你好");
	m1.insert(p1);
	//第二种写法:
	m1.insert(pair<string, string>("miss", "想念"));
	//第三种写法:
	m1.insert(make_pair("love", "爱"));//C++98
	//第四种写法:
	m1.insert({ "person","人" });//C++11支持的多参数的构造函数隐式类型的转换

	//隐式类型的转换+优化
	string str1 = "name";
	pair<string, string> p = { "name","名字" };
}

注意:

关于insert,它不仅可以实现插入,也可以实现查找的功能:

insert的返回类型:pair<iterator,bool>

1.如果插入的值在树中不存在,那么返回类型就是pair<iterator,true>,这里的迭代器是插入的节点位置。

2.如果插入的值在树种已经存在,那么返回类型就是pair<iterator,false>,这里的迭代器就是找到的与插入节点相等的节点位置。

cpp 复制代码
void test_map2()
{
	//构造一个字典
	map<string, string> m1;
	m1.insert(make_pair("hello", "你好"));
	m1.insert(make_pair("love", "爱"));
	m1.insert(make_pair("like", "喜欢"));
	m1.insert(make_pair("miss", "想念、错过"));

	//key相同,value不相同,不插入不覆盖
	m1.insert(make_pair("miss", "xxxx"));

	//遍历m1(迭代器)
	map<string, string>::iterator it = m1.begin();
	while (it != m1.end())
	{
		cout << (*it).first << ":" << (*it).second << endl;
		//也可以使用箭头进行访问
		cout << it->first << ":" << it->second << endl;
		++it;
	}
	cout << endl;

	//范围for的遍历
	for (const auto& e : m1)//此处的e相当于前面的*it
	{
		cout << e.first << ":" << e.second;
	}

	//由于key不能改,而value可以改:所以first不能改,而second可以改
	map<string, string>::iterator it1 = m1.begin();
	while (it1 != m1.end());
	{
		(*it1).second = "xxxx";
		++it1;
	}
}
void test_map3()
{
	//统计次数
	string arr[] = { "苹果", "西瓜", "苹果", "西瓜", "苹果", "苹果", "西瓜","苹果", "香蕉", "苹果", "香蕉" ,"草莓" };
	map<string, int> countmap;
	for (auto element : arr)
	{
		map<string,int>::iterator it = countmap.find(element);
		if (it == countmap.end())
		{
			countmap.insert(make_pair(element, 1));
		}
		else
		{
			it->second++;
		}
	}
	for (const auto& element : countmap)
	{
		cout << element.first << ":" << element.second << endl;
	}
}
void test_map4()
{
	//统计次数
	string arr[] = { "苹果", "西瓜", "苹果", "西瓜", "苹果", "苹果", "西瓜","苹果", "香蕉", "苹果", "香蕉" ,"草莓" };
	map<string, int> countmap;
	for (auto element : arr)
	{
		//[key]运算符中的方括号重载,方括号中给key,返回value的引用,所以可以直接++
		countmap[element]++;
	}
	for (const auto& element : countmap)
	{
		cout << element.first << ":" << element.second << endl;
	}
}
//注意:operator[ ]是使用insert实现的

void test_map5()
{
	//map中[ ]的使用
	map<string, string> m1;
	m1.insert(make_pair("hello", "你好"));
	m1.insert(make_pair("love", "爱"));
	m1.insert(make_pair("like", "喜欢"));
	m1.insert(make_pair("miss", "想念、错过"));

	m1["sort"];//插入
	m1["like"];//查找或读取
	m1["miss"] = "xxx";//修改
	m1["map"] = "地图";//插入+修改

	for (auto element : m1)
	{
		cout << element.first << ":" << element.second << endl;
	}
}

3.3.3map在题目中的应用

map通常使用场景是成对的一些东西的使用可以使用map的[ ]

题目:随机链表的复制

使用map可以帮助我们实现:

cpp 复制代码
class Node 
{
public:
	int val;
	Node* next;
	Node* random;
	Node(int _val) 
	{
		val = _val;
		next = NULL;
		random = NULL;
	}
};
class Solution 
{
public:
	Node* copyRandomList(Node* head) 
	{
		map<Node*, Node*> copymap;
		Node* copyhead = nullptr;
		Node* copytail = nullptr;
		Node* cur = head;
		//拷贝每个节点
		while (cur)
		{
			Node* newnode = new Node(cur->val);
			if (copytail == nullptr)
			{
				copyhead = copytail = newnode;
			}
			else
			{
				copytail->next = newnode;
				copytail = copytail->next;
			}
			//将每个节点与他的拷贝节点给映射起来
			copymap[cur] = newnode;
			cur = cur->next;
		}
		//控制random
		cur = head;
		Node* copy = copyhead;
		while (cur)
		{
			if (cur->random == nullptr)
			{
				copy->random = nullptr;
			}
			else
			{
				copy->random = copymap[cur->random];
			}
			cur = cur->next;
			copy = copy->next;
		}
		return copyhead;
	}
};

3.4multimap

3.4.1multimap的介绍:

  1. Multimaps是关联式容器,它按照特定的顺序,存储由key和value映射成的键值对<key, value > ,其中多个键值对之间的key是可以重复的。

  2. 在multimap中,通常按照key排序和惟一地标识元素,而映射的value存储与key关联的内容。key和value的类型可能不同,通过multimap内部的成员类型value_type组合在一起,value_type是组合key和value的键值对 :

cpp 复制代码
typedef pair<const Key, T> value_type;
  1. 在内部,multimap中的元素总是通过其内部比较对象,按照指定的特定严格弱排序标准对key进行排序的。

  2. multimap通过key访问单个元素的速度通常比unordered_multimap容器慢,但是使用迭代器直接遍历multimap中的元素可以得到关于key有序的序列。

  3. multimap在底层用二叉搜索树(红黑树)来实现。

注意:multimap和map的唯一不同就是:map中的key是唯一的,而multimap中key是可以重复的。

3.4.2multimap的使用

multimap和multiset的操作是一样的:

注意:

  1. multimap中的key是可以重复的。

  2. multimap中的元素默认将key按照小于来比较

  3. multimap中没有重载operator[]操作(同学们可思考下为什么 ? )。

  4. 使用时与map包含的头文件相同:

四、map和set相关OJ题目

题目一、两个数组的交集

给定两个数组nums1和nums2,返回它们的交集,输出结果中的每个元素一定是唯一的

我们可以不考虑输出结果的顺序

思路1:放进set中去重,然后遍历一个数组中的数据,判断在不在另一个,在就是交集

思路2:放进set中去重,并且中序出来有序的数组,然后求交集:从头开始依次比较

较小的值就进行++,相等就是交集值,同时++

注意:思路2的时间复杂度是O(N)

cpp 复制代码
class Solution 
{
public:
    vector<int> intersection(vector<int>& nums1, vector<int>& nums2) 
    {
        set<int> s1(nums1.begin(), nums1.end());
        set<int> s2(nums2.begin(), nums2.end());
        vector<int> v;
        set<int>::iterator it1 = s1.begin();
        set<int>::iterator it2 = s2.begin();

        while (it1 != s1.end() && it2 != s2.end())
        {
            //较小的值就进行++,相等就是交集值,同时++
            if ((*it1) < (*it2))
            {
                it1++;
            }
            else if ((*it2) < (*it1))
            {
                ++it2;
            }
            else
            {
                v.push_back(*it1);
                ++it1;
                ++it2;
            }
        }
        return v;
    }
};

总结:找交集和差集的方法:

题目二、前K个高频单词

给定一个单词列表words和一个整数k,返回前k个出现次数最多的单词,返回的答案应该按单词出现频率由高到低排序。如果不同的单词有相同出现频率,按字典顺序排序

思路:把在vector中的单词依次放进map中,并且统计次数,然后在将其单词和出现的次数按照

pair<string,int>放进vector中,然后在vector中使用stable_sort仅从排序,最后把前k个放进vector中

cpp 复制代码
class Solution 
{
public:
    //定义一个比较value的比较仿函数
    struct compare
    {
    public:
        bool operator()(const pair<string, int>& p1, const pair<string, int>& p2)
        {
            return p1.second > p2.second;
        }
    };
    vector<string> topKFrequent(vector<string>& words, int k) 
    {
        map<string, int> countmap;
        for (const auto& element : words)
        {
            countmap[element]++;
        }

        //将mapcount中的元素依次放进vector中
        vector<pair<string, int>> kvv(countmap.begin(), countmap.end());

        //将kvv中的元素按照value的类型进行排序,使用stable_sort更稳定
        stable_sort(kvv.begin(), kvv.end(), compare());

        //把前k个对象放进另一个vector中
        vector<string> v;
        for (size_t i = 0; i < k; i++)
        {
            v.push_back(kvv[i].first);
       }
        return v;
    }
};
相关推荐
低客的黑调37 分钟前
了解JVM 结构和运行机制,从小白编程Java 大佬
java·linux·开发语言
FuckPatience41 分钟前
C# 实现元素索引由1开始的链表
开发语言·链表·c#
CodeByV1 小时前
【Linux】Ext 系列文件系统深度解析:从磁盘到软硬链接
linux·服务器
Halo_tjn1 小时前
Java 相关资料
java·开发语言·计算机
fruge1 小时前
前端文档自动化:用 VitePress 搭建团队技术文档(含自动部署)
运维·前端·自动化
丸码1 小时前
Java异常体系全解析
java·开发语言
q***72191 小时前
PHP使用Redis实战实录2:Redis扩展方法和PHP连接Redis的多种方案
开发语言·redis·php
k***82511 小时前
python爬虫——爬取全年天气数据并做可视化分析
开发语言·爬虫·python
IMPYLH1 小时前
Lua 的 require 函数
java·开发语言·笔记·后端·junit·lua