详解vector容器

1.vector的介绍

vector是表示可变大小数组的序列容器，可理解为顺序表。

特点：

1.动态分配：可以在运行时增加或减少元素的数量。

2.随机访问：支持通过索引直接访问元素，时间复杂度为 O(1)。一般使用尾插，尾删，不用挪动数据更高效。

3.连续存储：元素在内存中是连续存储的，这使得它具有良好的缓存性能。

4.自动扩容：当容器容量不足时，会自动分配更大的内存空间，并将原有元素复制到新的内存空间，以时间换空间。

5.内存管理：std::vector 由 C++ 标准库管理，自动处理内存分配和释放

vector在功能上与string有一定的相似处，能不能代替呢?---不行

1.string结构上与vector存在差别，string会自动添加'\0',更好兼容C语言，后者则没有

2.string专用接口更丰富，专门用来存储char类型数据；vector是类模板，针对所有数据类型vector不需要比较大小，没有意义

2.vector的使用

构造函数

1.默认构造函数：alloc 是可选的分配器对象，用于管理内存分配。默认情况下，使用默认分配器。

2.填充构造函数：创建n个元素，每个元素为val的引用对象

3.范围构造函数：使用迭代器初始化并构造

4.拷贝构造函数：

三种遍历方式

迭代器的使用

cpp 复制代码

vector<int> v1;
v1.push_back(1);
v1.push_back(2);
v1.push_back(3);
v1.push_back(4);
string str("you know m3");

vector<int>::iterator it = v1.begin();
//使用迭代器进行遍历打印
while (it != v1.end())
{
	cout << *it << " ";
	it++;
}
cout << endl;

//使用迭代器进行修改
it = v1.begin();
while (it != v1.end())
{
	(*it)++;
	cout << *it << " ";
	it++;
}
cout<<endl;

//使用反向迭代器进行遍历打印
//vector<int>::reverse_iterator it = v1.rbegin();
auto rit = v1.rbegin();
while (rit!=v1.rend())
{
	cout << *rit << " ";
	rit++;
}
cout << endl;

//使用其他类型的迭代器
//范围构造函数，以迭代器作为参数
vector<char>v2(str.begin(), str.end());
for (auto e : v2)
{
	cout << e << " ";
}
cout << endl;

//迭代数组
int a[] = { 1,2,34,5,6 };
vector<int>v3(a, a + 5);//注意左闭右开区间，这里数组指针作为天然迭代器
for (auto v : v3)
{
	cout << v << " ";
}
cout << endl;

容器是用来存储数据的，算法是用来处理数据的。学习一个std::sort函数来处理数据。

std::sort 是一个用于对序列进行排序的函数模板，定义在头文件中，提供两种主要用法：

1.默认排序：使用元素的默认小于比较操作（operator<）进行升序排序。

std::less可以作为明确指定升序排序的比较方式，当然std::sort 已经使用 operator< 进行升序排序，所以通常不需要显式指定 std::less

降序排序需要使用模板类greater<>()
2.自定义排序

Compare comp：自定义的比较函数或比较对象，用于定义排序的规则。

空间增长问题

需特别注意：

1.reserve只负责开辟空间，不初始化。如果确定知道需要用多少空间，reserve可以缓解vector增容的代价缺陷问题。

2.resize在开空间的同时还会进行初始化，影响size。

扩容问题：

capacity的代码在vs和g++下分别运行会发现，vs下capacity是按1.5倍增长的 ，g++是按2倍增长的。这个问题经常会考察，不要固化的认为，vector增容都是2倍，具体增长多少是根据具体的需求定义的。vs是PJ版本STL，g++是SGI版本STL。

一个reverse经典错误案例

首先了解[]索引运算符重载，会进行assert(i<_size)断言，若越界将报错。

该段代码问题在于reserve只会开空间，并不初始化空间，所以_size=0,用索引访问将报错。

正确方法如下：

1.使用resize，开辟空间同时初始化

2.使用reserve预留空间，使用尾插，避免索引访问造成越界

增删查改问题

第一个参数位置是插入位置的迭代器，分为插入单个元素，插入多个相同元素，插入范围内元素。

C++ 标准库中的一个通用算法，用于在范围 [first, last) 内查找值等于 val 的元素。如果找到这样的元素，它返回一个指向该元素的迭代器；如果未找到，则返回 last.

可以看到只删除了第一次出现的val，那么如何删除所有val,继续用find涉及迭代器失效的问题，后续会深入学习。

在OJ中的使用

杨辉三角

1.C语言用二维数组来存储杨辉三角，需要创建一个指针数组，其中每个元素又指向一块空间，形成行和列，返回该指针数组地址需要参数二级指针来接收，比较麻烦。

2.C++使用二维vector即vector<vector>来存储杨辉三角。二维vector，包含多个vector对象。每个vector对象内部包含：

1.指向数据的指针int*

2.数据个数size

3.容量capacity

步骤分解：

a.调用vector<vector>的operator[]，返回第i个vector对象的引用，是一个vector对象。

b.调用返回的vector对象的operator[]，访问其内部元素即二维数组中列元素。

c.最终返回int类型值

电话号码的字母组合

该题运用了vector的string来存储字母组合，相当于一个字符串数组，并且不用担心容量问题，空间不够自动扩容。

这是一道全排列算法 题目，可以按照一定顺序递归的将每一个元素组合起来

1.创建一个strr数组来存储每个数字表示的字母情况，记得要显示声明数组大小，C++不支持自动推导。创建一个vector的string来存储所有字母组合。

2.自定义一个函数完成组合功能，参数digits是输入字符串，level是当前处理的数字位置即层数，combinestr是当前生成的字母组合，v为存储结果的容器。num作用是将当前处理的数字字符转换为整数值，以便作数组strr的索引，获得对应字符串。for循环中i表示遍历到一个数字所表示的第几个字母。每个字母表示完后返回上一层，继续与上一层的下一个字母递归，返回条件为层数==输入字符串的大小，level从0开始，符合数组索引要求。

注意：combinestr参数不能传引用的原因是，每次递归传下去的是coombinestr+str[i]，若传引用归的过程中上一层的combinestr会被改变，影响全排列。

vector迭代器失效问题

迭代器的主要作用就是让算法能够不用关心底层数据结构，其底层实际就是一个指针，或者是对指针进行了封装。比如：vector的迭代器就是原生态指针T* 。因此迭代器失效，实际就是迭代器底层对应指针所指向的空间被销毁了，非法访问造成的后果是程序崩溃

对于vector可能会导致其迭代器失效的操作有：

会引起其底层空间改变的操作 ，都有可能是迭代器失效，比如：resize、reserve、insert、assign、push_back等。
其中insert认为通通失效，因为不同平台下扩容逻辑不同，不知道什么时候会扩容。
2.删除当pos为最后一个元素时，后面元素整体前挪，pos位置为空。
注意：

Linux下，g++编译器对迭代器失效的检测并不是非常严格，处理也没有vs下极端。

扩容之后，迭代器已经失效了，程序虽然可以运行，但是运行结果已经不对了

erase删除任意位置代码后，linux下迭代器并没有失效因为空间还是原来的空间，后序元素往前搬移了，it的位置还是有效的

迭代器失效解决办法：在使用前，对迭代器重新赋值即可。erase会返回指向被擦除元素之后的第一个元素的迭代器，若最后一个元素被擦除会返回end迭代器，表示容器末尾，通过接收返回值再访问也可解决。

可以看出头插的两个元素为随机值，因为检查扩容时capacity*2，所以原空间被销毁，返回一个指向新大小空间的指针，_start被改变，若继续使用_start来计算pos会造成非法访问。

解决办法：

提前记录pos和_start的差值，扩容后再利用差值来重新计算pos

3.vector的模拟实现

类模板不能声明和定义分离，模板进阶会学习

insert时pos不用再担心无符号整型<0的问题，现在代表一个有效的地址，一定不为0

vector成员函数的源码剖析，与平常使用的T*a,size_t size,size_t capacity不同，定义的是iterator类型的start,finish,end_of_storage,但size=finish-start，capacity=end_of_storage-start;功能上相似。

重点情景分析

关于reserve的深浅拷贝问题

vector是深拷贝，但是vector空间上存的对象是string数组，使用memcpy导致string对象的浅拷贝。

memcpy 导致浅拷贝的原因：

因为它只是复制内存字节，不考虑对象的类型和语义，导致指针等资源的值被复制，而不是它们所指向的内存内容。
问题：

当T是自定义类型时，依次调用数组每个对象析构函数，再释放整个空间，当浅拷贝共用一块空间时会析构两次，第二次造成野指针问题。
这意味着源对象和目标对象共享同一块内存资源，修改一个对象会影响另一个对象。

解决方法：

当T是string这样深拷贝的类时，调用的就是赋值重载。若T是浅拷贝类，进行简单的复制操作。可以同时满足深浅拷贝的需求。

关于string类大小计算说明

在 C++ 中，sizeof(std::string) 计算的是 std::string 对象本身的大小 ，而不是它所管理的动态分配的内存的大小 。std::string 对象本身的大小是固定的，由其成员变量的大小决定，通常包括指向字符串数据的指针、字符串的长度和容量等。

实际的字符串数据存储在动态分配的内存中，这些内存的大小取决于字符串的长度。

sizeof(std::string) 返回的是对象本身的大小，不包括动态分配的内存。

同名函数模板存在

在C++中，同名的函数模板可以一起存在，只要它们的参数列表或模板参数列表不同，这样编译器可以根据函数调用时的参数来区分应该使用哪个模板。这类似于普通函数的重载。

以构造函数为例

范围构造函数：

template<>是一个模板函数，InputIterator 是模板参数，表示输入迭代器的类型。这个构造函数的功能是将 [first, last) 范围内的所有元素复制到 vector 中。它适用于任何符合输入迭代器要求的迭代器类型

以这三组测试用例为例：

第一组：10u是unsignedint类型，而构造函数参数类型分别是size_t和int类型，编译器无法确认调用哪一个构造函数，可以有多个选择所以报错。

第二组：和第二个填充构造函数参数类型完全匹配，有唯一选择。

第三组：两个参数都是int类型，vector<>在实例化一个模板，生成一个具体的类（如 vector<>），用于存储 int 类型的元素。符合范围构造函数类模板相同，可以都转化成int，有唯一选择

代码

vector.h

cpp 复制代码

#pragma once
#include<assert.h>
#include<string>
namespace ee
{
	template<class T>
	class vector
	{
	public:
		typedef T* iterator;
		typedef const T* const_iterator;

		iterator begin()
		{
			return _start;
		}

		iterator end()
		{
			return _finish;
		}

		const_iterator begin() const
		{
			return _start;
		}

		const_iterator end() const
		{
			return _finish;
		}

		//构造函数
		vector()
			:_start(nullptr)
			, _finish(nullptr)
			, _endofstorage(nullptr)
		{}

		//构造函数的另外形式(深拷贝)
		//填充构造函数
		vector(size_t n, const T& val=T())
		{
			resize(n,val);
		}
		vector(int n, const T& val = T())
		{
			resize(n, val);
		}
		//范围构造函数
		template<class InputIterator>
		vector(InputIterator first, InputIterator last)
		{
			while (first != last)
			{
				push_back(*first);
				first++;
			}
		}
		
		//拷贝构造函数，深拷贝
		vector(const vector<T>& v)
		{//注意参数要传引用，实参复制到形参需要调用拷贝构造函数，会引发无穷递归
			_start = new T[v.capacity()];
			for (size_t i = 0; i < v.size(); i++)
			{
				_start[i] = v._start[i];
			}

			_finish = _start + v.size();
			_endofstorage = _start + v.capacity();
		}

		//拷贝构造函数，深拷贝
		/*vector(const vactor<T>& v)
		{
			:_start(nullptr);
			, _finish(nullptr);
			, _endofstorage(nullptr);
			{
				reserve(v.capacity);
				for (auto e : v)
				{
					push_back(e);
				}
			}
		}*/

		~vector()
		{
			if (_start)
			{
				delete[] _start;
				_start = _finish = _endofstorage = nullptr;
			}
		}

		size_t capacity() const
		{
			return _endofstorage - _start;
		}

		size_t size() const
		{
			return _finish - _start;
		}

		void reserve(size_t n)
		{
			if (n > capacity())
			{
				//新开一个空间
				size_t sz = size();
				T* tmp = new T[n];
				//检查空指针,避免未定义行为(拷贝，释放)
				if (_start)
				{
					//memcpy(tmp, _start, sizeof(T) * sz);
					for (size_t i = 0; i < sz; i++)
					{
						tmp[i] = _start[i];
					}
					delete[] _start;
				}

				_start = tmp;
				_finish = _start + sz;
				_endofstorage = _start + n;
			}
		}

		void push_back(const T& x)
		{
			//检查容量
			if (_finish == _endofstorage)
			{
				size_t newcapacity = capacity() == 0 ? 4 : capacity() * 2;
				reserve(newcapacity);
			}
			//_start是一个指针没有尾插
			// _start.push_back(x);
			*_finish = x;
			_finish++;
		}

		T& operator[](size_t pos)
		{
			assert(pos < size());
			return _start[pos];
		}

		const T& operator[](size_t pos) const
		{
			assert(pos < size());
			return _start[pos];
		}

		iterator insert(iterator pos, const T& x)
		{
			if (pos >= _start && pos <= _finish)
			{
				if (_finish == _endofstorage)
				{
					size_t len = pos - _start;
					size_t newcapacity = capacity() == 0 ? 4 : capacity() * 2;
					reserve(newcapacity);
					//解决迭代器失效问题
					pos = _start + len;
				}
			}
			//挪动元素
			iterator end = _finish - 1;
			while (end >= pos)
			{
				*(end -1) = *end;
				end--;
			}
			//赋值，更新索引
			*pos = x;
			_finish++;
			return pos;
		}

		void resize(size_t n, const T& val = T())
		{//缺省参数使用匿名对象，可支持多种类型的初始化
			if (n < size())
			{//直接截断容器
				_finish = _start + n;
			}
			else
			{
				//需要扩容
				reserve(n);
				while (_finish < _start + n)
				{//注意为<，若等于会多循环一次造成越界问题
					*_finish = val;
					_finish++;
				}
			}
		}

		iterator erase(iterator pos)
		{//凡涉及数据挪动，都需要检查边界
			assert(pos >= _start && pos <= _finish);
			iterator it = pos + 1;
			while (it != _finish)
			{
				*(it - 1) = *it;
				it++;
			}
			_finish--;
			return pos;
		}

		void swap(vector<T>& v)
		{
			std::swap(_start, v._start);
			std::swap(_finish, v._finish);
			std::swap(_endofstorage, v._endofstorage);
		}

		//赋值运算符重载
		vector<T>& operator=(vector<T>v)
		{//复用交换函数
			swap(v);
			return *this;
		}
	private:
		iterator _start;
		iterator _finish;
		iterator _endofstorage;
	};

}

test.c

cpp 复制代码

#include"vector.h"
#include<iostream>
using namespace ee;
using namespace std;

void test_vector1()
{
	vector<int> v;
	v.push_back(1);
	v.push_back(2);
	v.push_back(3);
	v.push_back(4);
	
	ee::vector<int>::iterator p = v.begin();
	v.insert ( p, 9);
	v.insert(p, 10);
	for (auto e : v)
	{
		cout << e << " ";
	}
	cout << endl;
}

void test_vector2()
{
	ee::vector<int>v;
	v.insert(v.begin(), 1);
	v.insert(v.begin()+1, 2);
	v.insert(v.begin() + 2, 2);
	v.push_back(3);
	v.push_back(4);
	v.push_back(5);
	v.push_back(6);


	for (auto e : v)
	{
		cout << e << " ";
	}
	cout << endl;

	ee::vector<int>:: iterator it = v.begin();
	while (it != v.end())
	{
		if (*it % 2 == 0)
		{

			it = v.erase(it);
		}
		else
		{
			it++;
		}
	}
	for (auto e : v)
	{
		cout << e << " ";
	}
	cout << endl;

}

//测试resize和赋值运算符重载函数
void test_vector3()
{
	vector<int>v1;
	v1.push_back(1);
	v1.push_back(2);
	v1.push_back(3);
	v1.push_back(4);
	for (auto e : v1)
	{
		cout << e << " ";
	}
	cout << endl;
	vector<int>v;
	v.resize(10, 6);
	v1 = v;
	for (auto e : v1)
	{
		cout << e << " ";
	}
	cout << endl;
}

//拷贝构造的其他方式
void test_vector4()
{
	//10u是unsignedint类型，而构造函数参数类型分别是size_t和int类型
	// 编译器无法确认调用哪一个构造函数
	//vector<int> v(10u, 1);
	vector<string> v1(10, "1111");
	vector<int> v2(10, 6);

	for (auto e : v2)
	{
		cout << e << " ";
	}
	cout << endl;
}

void test_vector5()
{
	vector<string> v;
	v.push_back("111111111111111111");
	v.push_back("222222222222222222");
	v.push_back("333333333333333333");
	v.push_back("444444444444444444");
	v.push_back("555555555555555555");

	for (auto& e : v)
	{
		cout << e << " ";
	}
	cout << endl;

	vector<string> v1(v);
	for (auto& e : v1)
	{
		cout << e << " ";
	}
	cout << endl;
}
int main()
{
	test_vector5();
	return 0;
}