详解vector容器

1.vector的介绍

vector是表示可变大小数组的序列容器,可理解为顺序表。

特点:

1.动态分配 :可以在运行时增加或减少元素的数量。

2.随机访问 :支持通过索引直接访问元素,时间复杂度为 O(1)。一般使用尾插,尾删,不用挪动数据更高效。

3.连续存储 :元素在内存中是连续存储的,这使得它具有良好的缓存性能。

4.自动扩容 :当容器容量不足时,会自动分配更大的内存空间,并将原有元素复制到新的内存空间,以时间换空间。

5.内存管理:std::vector 由 C++ 标准库管理,自动处理内存分配和释放

vector在功能上与string有一定的相似处,能不能代替呢?---不行

1.string结构上与vector存在差别,string会自动添加'\0',更好兼容C语言,后者则没有

2.string专用接口更丰富,专门用来存储char类型数据;vector是类模板,针对所有数据类型vector不需要比较大小,没有意义

2.vector的使用

构造函数

1.默认构造函数:alloc 是可选的分配器对象,用于管理内存分配。默认情况下,使用默认分配器。

2.填充构造函数:创建n个元素,每个元素为val的引用对象

3.范围构造函数:使用迭代器初始化并构造

4.拷贝构造函数:

三种遍历方式

迭代器的使用

cpp 复制代码
vector<int> v1;
v1.push_back(1);
v1.push_back(2);
v1.push_back(3);
v1.push_back(4);
string str("you know m3");

vector<int>::iterator it = v1.begin();
//使用迭代器进行遍历打印
while (it != v1.end())
{
	cout << *it << " ";
	it++;
}
cout << endl;

//使用迭代器进行修改
it = v1.begin();
while (it != v1.end())
{
	(*it)++;
	cout << *it << " ";
	it++;
}
cout<<endl;

//使用反向迭代器进行遍历打印
//vector<int>::reverse_iterator it = v1.rbegin();
auto rit = v1.rbegin();
while (rit!=v1.rend())
{
	cout << *rit << " ";
	rit++;
}
cout << endl;

//使用其他类型的迭代器
//范围构造函数,以迭代器作为参数
vector<char>v2(str.begin(), str.end());
for (auto e : v2)
{
	cout << e << " ";
}
cout << endl;

//迭代数组
int a[] = { 1,2,34,5,6 };
vector<int>v3(a, a + 5);//注意左闭右开区间,这里数组指针作为天然迭代器
for (auto v : v3)
{
	cout << v << " ";
}
cout << endl;

容器是用来存储数据的,算法是用来处理数据的。学习一个std::sort函数来处理数据。

std::sort 是一个用于对序列进行排序的函数模板,定义在头文件 中,提供两种主要用法:

1.默认排序:使用元素的默认小于比较操作(operator<)进行升序排序。

std::less可以作为明确指定升序排序的比较方式,当然std::sort 已经使用 operator< 进行升序排序,所以通常不需要显式指定 std::less

降序排序需要使用模板类greater<>()
2.自定义排序

Compare comp:自定义的比较函数或比较对象,用于定义排序的规则。

空间增长问题

需特别注意:

1.reserve只负责开辟空间,不初始化。如果确定知道需要用多少空间,reserve可以缓解vector增容的代价缺陷问题。

2.resize在开空间的同时还会进行初始化,影响size。

扩容问题:

capacity的代码在vs和g++下分别运行会发现,vs下capacity是按1.5倍增长的g++是按2倍增长的。这个问题经常会考察,不要固化的认为,vector增容都是2倍,具体增长多少是根据具体的需求定义的。vs是PJ版本STL,g++是SGI版本STL。

一个reverse经典错误案例

首先了解[]索引运算符重载,会进行assert(i<_size)断言,若越界将报错。

该段代码问题在于reserve只会开空间,并不初始化空间,所以_size=0,用索引访问将报错。

正确方法如下:

1.使用resize,开辟空间同时初始化

2.使用reserve预留空间,使用尾插,避免索引访问造成越界

增删查改问题



第一个参数位置是插入位置的迭代器,分为插入单个元素,插入多个相同元素,插入范围内元素。

C++ 标准库中的一个通用算法,用于在范围 [first, last) 内查找值等于 val 的元素。如果找到这样的元素,它返回一个指向该元素的迭代器;如果未找到,则返回 last.

可以看到只删除了第一次出现的val,那么如何删除所有val,继续用find涉及迭代器失效的问题,后续会深入学习。

在OJ中的使用

杨辉三角

1.C语言用二维数组来存储杨辉三角,需要创建一个指针数组,其中每个元素又指向一块空间,形成行和列,返回该指针数组地址需要参数二级指针来接收,比较麻烦。

2.C++使用二维vector即vector<vector>来存储杨辉三角。二维vector,包含多个vector对象。每个vector对象内部包含:

1.指向数据的指针int*

2.数据个数size

3.容量capacity

步骤分解:

a.调用vector<vector>的operator[],返回第i个vector对象的引用,是一个vector对象。

b.调用返回的vector对象的operator[],访问其内部元素即二维数组中列元素。

c.最终返回int类型值

电话号码的字母组合

该题运用了vector的string来存储字母组合,相当于一个字符串数组,并且不用担心容量问题,空间不够自动扩容。

这是一道全排列算法 题目,可以按照一定顺序递归的将每一个元素组合起来

1.创建一个strr数组来存储每个数字表示的字母情况,记得要显示声明数组大小,C++不支持自动推导。创建一个vector的string来存储所有字母组合。

2.自定义一个函数完成组合功能,参数digits是输入字符串,level是当前处理的数字位置即层数,combinestr是当前生成的字母组合,v为存储结果的容器。num作用是将当前处理的数字字符转换为整数值,以便作数组strr的索引,获得对应字符串。for循环中i表示遍历到一个数字所表示的第几个字母。每个字母表示完后返回上一层,继续与上一层的下一个字母递归,返回条件为层数==输入字符串的大小,level从0开始,符合数组索引要求。

注意:combinestr参数不能传引用的原因是,每次递归传下去的是coombinestr+str[i],若传引用归的过程中上一层的combinestr会被改变,影响全排列。

vector迭代器失效问题

迭代器的主要作用就是让算法能够不用关心底层数据结构,其底层实际就是一个指针,或者是对指针进行了封装。比如:vector的迭代器就是原生态指针T* 。因此迭代器失效,实际就是迭代器底层对应指针所指向的空间被销毁了,非法访问造成的后果是程序崩溃

对于vector可能会导致其迭代器失效的操作有:

  1. 会引起其底层空间改变的操作 ,都有可能是迭代器失效,比如:resize、reserve、insert、assign、push_back等。
    其中insert认为通通失效,因为不同平台下扩容逻辑不同,不知道什么时候会扩容。
    2.删除当pos为最后一个元素时,后面元素整体前挪,pos位置为空。
    注意:

Linux下,g++编译器对迭代器失效的检测并不是非常严格,处理也没有vs下极端。

  1. 扩容之后,迭代器已经失效了,程序虽然可以运行,但是运行结果已经不对了
  2. erase删除任意位置代码后,linux下迭代器并没有失效因为空间还是原来的空间,后序元素往前搬移了,it的位置还是有效的

迭代器失效解决办法:在使用前,对迭代器重新赋值即可。erase会返回指向被擦除元素之后的第一个元素的迭代器,若最后一个元素被擦除会返回end迭代器,表示容器末尾,通过接收返回值再访问也可解决。


可以看出头插的两个元素为随机值,因为检查扩容时capacity*2,所以原空间被销毁,返回一个指向新大小空间的指针,_start被改变,若继续使用_start来计算pos会造成非法访问。

解决办法:

提前记录pos和_start的差值,扩容后再利用差值来重新计算pos

3.vector的模拟实现

类模板不能声明和定义分离,模板进阶会学习

insert时pos不用再担心无符号整型<0的问题,现在代表一个有效的地址,一定不为0

vector成员函数的源码剖析,与平常使用的T*a,size_t size,size_t capacity不同,定义的是iterator类型的start,finish,end_of_storage,但size=finish-start,capacity=end_of_storage-start;功能上相似。

重点情景分析

关于reserve的深浅拷贝问题


vector是深拷贝,但是vector空间上存的对象是string数组,使用memcpy导致string对象的浅拷贝。

memcpy 导致浅拷贝的原因

因为它只是复制内存字节,不考虑对象的类型和语义,导致指针等资源的值被复制,而不是它们所指向的内存内容。
问题

当T是自定义类型时,依次调用数组每个对象析构函数,再释放整个空间,当浅拷贝共用一块空间时会析构两次,第二次造成野指针问题。
这意味着源对象和目标对象共享同一块内存资源,修改一个对象会影响另一个对象。

解决方法:

当T是string这样深拷贝的类时,调用的就是赋值重载。若T是浅拷贝类,进行简单的复制操作。可以同时满足深浅拷贝的需求。

关于string类大小计算说明

在 C++ 中,sizeof(std::string) 计算的是 std::string 对象本身的大小 ,而不是它所管理的动态分配的内存的大小 。std::string 对象本身的大小是固定的,由其成员变量的大小决定,通常包括指向字符串数据的指针、字符串的长度和容量等。

实际的字符串数据存储在动态分配的内存中,这些内存的大小取决于字符串的长度。

sizeof(std::string) 返回的是对象本身的大小,不包括动态分配的内存。

同名函数模板存在

在C++中,同名的函数模板可以一起存在,只要它们的参数列表或模板参数列表不同,这样编译器可以根据函数调用时的参数来区分应该使用哪个模板。这类似于普通函数的重载。

以构造函数为例

范围构造函数:

template<>是一个模板函数,InputIterator 是模板参数,表示输入迭代器的类型。这个构造函数的功能是将 [first, last) 范围内的所有元素复制到 vector 中。它适用于任何符合输入迭代器要求的迭代器类型

以这三组测试用例为例:

第一组:10u是unsignedint类型,而构造函数参数类型分别是size_t和int类型,编译器无法确认调用哪一个构造函数,可以有多个选择所以报错。

第二组:和第二个填充构造函数参数类型完全匹配,有唯一选择。

第三组:两个参数都是int类型,vector<>在实例化一个模板,生成一个具体的类(如 vector<>),用于存储 int 类型的元素。符合范围构造函数类模板相同,可以都转化成int,有唯一选择

代码

  • vector.h
cpp 复制代码
#pragma once
#include<assert.h>
#include<string>
namespace ee
{
	template<class T>
	class vector
	{
	public:
		typedef T* iterator;
		typedef const T* const_iterator;

		iterator begin()
		{
			return _start;
		}

		iterator end()
		{
			return _finish;
		}

		const_iterator begin() const
		{
			return _start;
		}

		const_iterator end() const
		{
			return _finish;
		}

		//构造函数
		vector()
			:_start(nullptr)
			, _finish(nullptr)
			, _endofstorage(nullptr)
		{}

		//构造函数的另外形式(深拷贝)
		//填充构造函数
		vector(size_t n, const T& val=T())
		{
			resize(n,val);
		}
		vector(int n, const T& val = T())
		{
			resize(n, val);
		}
		//范围构造函数
		template<class InputIterator>
		vector(InputIterator first, InputIterator last)
		{
			while (first != last)
			{
				push_back(*first);
				first++;
			}
		}
		
		//拷贝构造函数,深拷贝
		vector(const vector<T>& v)
		{//注意参数要传引用,实参复制到形参需要调用拷贝构造函数,会引发无穷递归
			_start = new T[v.capacity()];
			for (size_t i = 0; i < v.size(); i++)
			{
				_start[i] = v._start[i];
			}

			_finish = _start + v.size();
			_endofstorage = _start + v.capacity();
		}

		//拷贝构造函数,深拷贝
		/*vector(const vactor<T>& v)
		{
			:_start(nullptr);
			, _finish(nullptr);
			, _endofstorage(nullptr);
			{
				reserve(v.capacity);
				for (auto e : v)
				{
					push_back(e);
				}
			}
		}*/

		~vector()
		{
			if (_start)
			{
				delete[] _start;
				_start = _finish = _endofstorage = nullptr;
			}
		}

		size_t capacity() const
		{
			return _endofstorage - _start;
		}

		size_t size() const
		{
			return _finish - _start;
		}

		void reserve(size_t n)
		{
			if (n > capacity())
			{
				//新开一个空间
				size_t sz = size();
				T* tmp = new T[n];
				//检查空指针,避免未定义行为(拷贝,释放)
				if (_start)
				{
					//memcpy(tmp, _start, sizeof(T) * sz);
					for (size_t i = 0; i < sz; i++)
					{
						tmp[i] = _start[i];
					}
					delete[] _start;
				}

				_start = tmp;
				_finish = _start + sz;
				_endofstorage = _start + n;
			}
		}

		void push_back(const T& x)
		{
			//检查容量
			if (_finish == _endofstorage)
			{
				size_t newcapacity = capacity() == 0 ? 4 : capacity() * 2;
				reserve(newcapacity);
			}
			//_start是一个指针没有尾插
			// _start.push_back(x);
			*_finish = x;
			_finish++;
		}

		T& operator[](size_t pos)
		{
			assert(pos < size());
			return _start[pos];
		}

		const T& operator[](size_t pos) const
		{
			assert(pos < size());
			return _start[pos];
		}

		iterator insert(iterator pos, const T& x)
		{
			if (pos >= _start && pos <= _finish)
			{
				if (_finish == _endofstorage)
				{
					size_t len = pos - _start;
					size_t newcapacity = capacity() == 0 ? 4 : capacity() * 2;
					reserve(newcapacity);
					//解决迭代器失效问题
					pos = _start + len;
				}
			}
			//挪动元素
			iterator end = _finish - 1;
			while (end >= pos)
			{
				*(end -1) = *end;
				end--;
			}
			//赋值,更新索引
			*pos = x;
			_finish++;
			return pos;
		}

		void resize(size_t n, const T& val = T())
		{//缺省参数使用匿名对象,可支持多种类型的初始化
			if (n < size())
			{//直接截断容器
				_finish = _start + n;
			}
			else
			{
				//需要扩容
				reserve(n);
				while (_finish < _start + n)
				{//注意为<,若等于会多循环一次造成越界问题
					*_finish = val;
					_finish++;
				}
			}
		}

		iterator erase(iterator pos)
		{//凡涉及数据挪动,都需要检查边界
			assert(pos >= _start && pos <= _finish);
			iterator it = pos + 1;
			while (it != _finish)
			{
				*(it - 1) = *it;
				it++;
			}
			_finish--;
			return pos;
		}

		void swap(vector<T>& v)
		{
			std::swap(_start, v._start);
			std::swap(_finish, v._finish);
			std::swap(_endofstorage, v._endofstorage);
		}

		//赋值运算符重载
		vector<T>& operator=(vector<T>v)
		{//复用交换函数
			swap(v);
			return *this;
		}
	private:
		iterator _start;
		iterator _finish;
		iterator _endofstorage;
	};

}
  • test.c
cpp 复制代码
#include"vector.h"
#include<iostream>
using namespace ee;
using namespace std;

void test_vector1()
{
	vector<int> v;
	v.push_back(1);
	v.push_back(2);
	v.push_back(3);
	v.push_back(4);
	
	ee::vector<int>::iterator p = v.begin();
	v.insert ( p, 9);
	v.insert(p, 10);
	for (auto e : v)
	{
		cout << e << " ";
	}
	cout << endl;
}

void test_vector2()
{
	ee::vector<int>v;
	v.insert(v.begin(), 1);
	v.insert(v.begin()+1, 2);
	v.insert(v.begin() + 2, 2);
	v.push_back(3);
	v.push_back(4);
	v.push_back(5);
	v.push_back(6);


	for (auto e : v)
	{
		cout << e << " ";
	}
	cout << endl;

	ee::vector<int>:: iterator it = v.begin();
	while (it != v.end())
	{
		if (*it % 2 == 0)
		{

			it = v.erase(it);
		}
		else
		{
			it++;
		}
	}
	for (auto e : v)
	{
		cout << e << " ";
	}
	cout << endl;

}

//测试resize和赋值运算符重载函数
void test_vector3()
{
	vector<int>v1;
	v1.push_back(1);
	v1.push_back(2);
	v1.push_back(3);
	v1.push_back(4);
	for (auto e : v1)
	{
		cout << e << " ";
	}
	cout << endl;
	vector<int>v;
	v.resize(10, 6);
	v1 = v;
	for (auto e : v1)
	{
		cout << e << " ";
	}
	cout << endl;
}

//拷贝构造的其他方式
void test_vector4()
{
	//10u是unsignedint类型,而构造函数参数类型分别是size_t和int类型
	// 编译器无法确认调用哪一个构造函数
	//vector<int> v(10u, 1);
	vector<string> v1(10, "1111");
	vector<int> v2(10, 6);

	for (auto e : v2)
	{
		cout << e << " ";
	}
	cout << endl;
}

void test_vector5()
{
	vector<string> v;
	v.push_back("111111111111111111");
	v.push_back("222222222222222222");
	v.push_back("333333333333333333");
	v.push_back("444444444444444444");
	v.push_back("555555555555555555");

	for (auto& e : v)
	{
		cout << e << " ";
	}
	cout << endl;

	vector<string> v1(v);
	for (auto& e : v1)
	{
		cout << e << " ";
	}
	cout << endl;
}
int main()
{
	test_vector5();
	return 0;
}
相关推荐
沐墨专攻技术15 分钟前
深入理解指针(1)(C语言版)
c语言·开发语言
sin258021 分钟前
蓝桥杯C++基础算法-0-1背包(优化为一维)
c++·算法·蓝桥杯
爱掉发的小李22 分钟前
使用python爬取网络资源
开发语言·后端·python·动态规划
霍珵璁26 分钟前
Elixir语言的测试开发
开发语言·后端·golang
多多*38 分钟前
Java 双端队列实战 实现滑动窗口 用LinkedList的基类双端队列Deque实现 洛谷[P1886]
java·开发语言·数据结构·算法·cocoa
程序员老冯头39 分钟前
第八节 MATLAB运算符
开发语言·算法·matlab
Bright Data1 小时前
Go 代理爬虫
开发语言·爬虫·golang
梅见十柒1 小时前
UNIX网络编程笔记:TCP、UDP、SCTP编程的区别
服务器·网络·c++·笔记·tcp/ip·udp·unix
爱吃鱼饼的猫2 小时前
【Spring篇】Spring的生命周期
java·开发语言
Johnny_Cheung2 小时前
第一次程序Hello Python
开发语言·python