【c++丨STL】vector模拟实现

🌟🌟作者主页：ephemerals__****

🌟🌟所属专栏：C++、STL

前言

之前我们学习了vector的常用接口及其使用方法：

【c++丨STL】vector的使用-CSDN博客

本篇文章，我们将深入探讨vector的底层实现原理，并尝试模拟实现其结构以及一些常用接口。

一、vector底层刨析

之前已经提到，vector的底层是动态顺序表，我们使用c语言实现顺序表的结构时赋予了它三个成员变量：

cpp 复制代码

typedef int SLDataType;
 
//动态顺序表
typedef struct SeqList
{
	SLDataType* arr;//定义起始指针，后续动态开辟内存空间
	int size;//有效数据的个数
	int capacity;//数组的空间大小
}SL;

可以看到，我们定义了一个起始指针指向分配的内存，然后用size和capacity两个变量分别记录元素个数和空间容量。接下来，我们再看看SGI版本的STL源码：

为了提高程序的兼容性和灵活性，源码并没有使用size和capacity等属性，而是使用了**三个迭代器（指针）**来维护数组。这三个迭代器分别指向数组的不同位置：

start：指向首元素

finish：指向末尾元素的"后一位"

end_of_storage：指向可用空间的末尾

图示：

那么，接下来我们在模拟实现vector时，将仿照SGI版本的做法，通过定义相应的成员变量（即三个迭代器）来构建其内部结构。

另外，由于vector本质上是一个类模板 ，允许我们存储任意类型的数据元素，因此在接下来模拟实现vector的过程中，我们也将采用类模板来进行定义 。由于类模板成员函数的定义和声明分离到两个文件会造成链接错误，我们选择在头文件中同时完成这些成员函数的声明与定义。

二、模拟实现

1. 属性、迭代器以及函数声明

首先是属性、迭代器的声明以及我们需要实现的接口：

cpp 复制代码

#include <iostream>
#include <algorithm>
#include <cassert>
using namespace std;

template<class T>
class Vector
{
public:
	//vector的迭代器是一个原生指针
	typedef T* iterator;
	typedef const T* const_iterator;

	//迭代器接口
	iterator begin();
	iterator end();
	const_iterator begin() const;
	const_iterator end() const;

	//无参构造
	Vector();
	//初始化器构造
	Vector(initializer_list<T> l);
	//迭代器区间构造
	template<class InputIterator>
	Vector(InputIterator first, InputIterator last);
	//n个val值构造
	Vector(size_t n, const T& val = T());
	//拷贝构造
	Vector(const Vector<T>& v);
	//赋值重载
	Vector<T>& operator=(Vector<T> v);
	//析构
	~Vector();

	//下标引用
	T& operator[](size_t i);
	const T& operator[](size_t i) const;

	//容量接口
	size_t size() const;
	size_t capacity() const;

	//判空
	bool empty() const;

	//交换
	void swap(Vector<T>& tmp);

	//调整大小
	void resize(size_t n, const T& val = T());

	//增容
	void reserve(size_t n);

	//插入和删除
	void push_back(const T& x);
	void pop_back();
	iterator insert(iterator pos, const T& x);
	iterator erase(iterator pos);
private:
	iterator _start = nullptr;
	iterator _finish = nullptr;
	iterator _end_of_storage = nullptr;
};

由于vector和string的数据元素都是采用顺序存储的方式，它们在功能实现上存在相似之处。因此，建议先阅读string模拟实现之后，再来阅读本文，否则其中的一些实现过程可能会较难理解。

2. 功能实现

接下来，我们将正式开始实现上述接口的功能。

交换两个容器的内容

与之前实现string时相同，直接交换它们的成员变量就可以完成数据的交换，无需重新开辟空间。

代码实现：

cpp 复制代码

//交换
void swap(Vector<T>& tmp)
{
	std::swap(_start, tmp._start);
	std::swap(_finish, tmp._finish);
	std::swap(_end_of_storage, tmp._end_of_storage);
}

构造函数

这里我们实现了四个构造函数的重载：分别是：无参构造、初始化器构造、迭代器区间构造和n个val值构造：

cpp 复制代码

//无参构造
Vector()
{}

cpp 复制代码

//初始化器构造
Vector(initializer_list<T> l)
{
	reserve(l.size());
	for (auto& e : l)
	{
		push_back(e);
	}
}

cpp 复制代码

//迭代器区间构造
template<class InputIterator>
Vector(InputIterator first, InputIterator last)
{
	while (first != last)
	{
		push_back(*first);
		first++;
	}
}

cpp 复制代码

//n个val值构造
Vector(size_t n, const T& val = T())
{
	reverse(n);
	for (size_t i = 0; i < n; i++)
	{
		push_back(val);
	}
}

不难发现，由于我们在成员变量声明时已经赋初值，所以无参构造中什么都不用做。这样无参构造也可以写成如下形式：

cpp 复制代码

Vector() = default;//强制生成无参构造

我们显示写了构造函数后，编译器就不会默认生成无参构造函数。我们用这条语句就可以强制让编译器生成一个无参的构造函数。

其余的构造函数都是通过遍历来访问每个元素，并将它们依次尾插到数组中的。push_back、reverse等函数我们之后实现。这里特别注意一下n个val值构造函数，如果我们不传val参数，则会调用T类型的默认构造函数，生成一个匿名对象并赋值给val。

拷贝构造

与初始化器构造的原理相似，我们遍历被拷贝数组的每个元素，并将它们逐一尾插到当前数组中。

cpp 复制代码

//拷贝构造
Vector(const Vector<T>& v)
{
	reverse(v.capacity());
	for (auto& e : v)
	{
		push_back(e);
	}
}

赋值重载

这里我们使用新式写法（string使用过），构造新对象然后交换，完成赋值操作。

cpp 复制代码

//赋值重载
Vector<T>& operator=(Vector<T> v)
{
	swap(v);
	return *this;
}

析构函数

cpp 复制代码

//析构
~Vector()
{
	if (_start)//避免多次释放
	{
		delete[] _start;
		_start = _finish = _end_of_storage = nullptr;
	}
}

下标引用operator[ ]

下标引用重载可以让我们像访问数组元素一样访问容器内容。

cpp 复制代码

//下标引用
T& operator[](size_t i)
{
	assert(i < size());//防止越界
	return _start[i];
}
const T& operator[](size_t i) const
{
	assert(i < size());
	return _start[i];
}

容量接口

使用指针减指针的方式来实现容量接口size和capacity功能。

cpp 复制代码

//容量接口
size_t size() const
{
	return _finish - _start;
}
size_t capacity() const
{
	return _end_of_storage - _start;
}

迭代器接口

由于string和vector底层都是顺序存储，所以它们的迭代器相对简单，都是直接使用指针实现。之后我们学习list（链表）时，就会接触到更加复杂的迭代器实现。

cpp 复制代码

//迭代器接口
iterator begin()
{
	return _start;
}
iterator end()
{
	return _finish;
}
const_iterator begin() const
{
	return _start;
}
const_iterator end() const
{
	return _finish;
}

判空

当start与finish指向同一处时，容器即为空。

cpp 复制代码

//判空
bool empty() const
{
	return _start == _finish;
}

resize

如果参数n的值小于当前size，则该函数会将size调整为n值，并且删除超出的元素。

如果参数n的值大于当前size，则会在末尾插入元素至size等于n值。

cpp 复制代码

//调整大小
void resize(size_t n, const T& val = T())
{
	if (n <= size())
	{
		_finish = _start + n;
	}
	else
	{
		reserve(n);
		while (_finish < _start + n)
		{
			*_finish = val;
			_finish++;
		}
	}
}

reserve

reserve的实现原理与string相似，当参数n值大于当前容量时，我们才会进行增容操作。这里需要注意：由于容量大小由三个迭代器控制，所以我们重新开辟空间之前需要记录原来的size，便于确定增容之后三个迭代器指向的位置。

cpp 复制代码

//增容
void reserve(size_t n)
{
	if (n > capacity())
	{
		size_t old_size = size();//记录原来的size
		T* tmp = new T[n];
		if (_start)//如果start是空，说明数组为空，不拷贝数据
		{
			for (size_t i = 0; i < old_size; i++)
			{
				tmp[i] = _start[i];
			}
			delete[] _start;
		}
		_start = tmp;
		_finish = tmp + old_size;
		_end_of_storage = tmp + n;
	}
}

插入和删除

insert和push_back

insert和push_back负责插入操作。这里需要注意：insert实现时的迭代器失效问题。

什么是迭代器失效呢？简单的讲，由于vector是使用三个迭代器来维护的，那么如果它们指向的空间被释放 ，那么就会出现野指针 的情况，这三个迭代器的相关操作就是无效的，这就是迭代器失效。迭代器失效的本质就是你管理的内存已经不属于你了。

insert出现迭代器失效的原因：很简单，我们在插入数据时，如果空间已满就会增容，此时分配新的空间，然后把内容拷贝过去并释放旧空间。原本我们传入的参数pos（指定的插入位置）是一个指向旧空间的迭代器 ，旧空间被释放后，该迭代器就会失效，从而无法插入数据。

解决办法：记录迭代器pos与start的相对距离，当增容完成之后，根据相对距离更新pos即可。

为什么string在进行插入的时候不会发生迭代器失效呢？因为参数pos本身是一个整形，代表要插入的下标，只要该下标不越界，就不会出现失效的情况。当然，这只是插入时不会，并不是一定不会。如果你在外部定义了一个迭代器，当字符串空间被释放后，该迭代器也会失效 。此时我们对迭代器重新赋值即可。

接下来我们实现insert和push_back的代码：

cpp 复制代码

iterator insert(iterator pos, const T& x)
{
	assert(pos >= _start && pos <= finish);//确保插入位置合法
	if (_finish == _end_of_storage)//空间已满，增容
	{
		size_t len = pos - _start;//记录相对位置
		reserve(capcaity() == 0 ? 4 : 2 * capacity());//增容
		pos = _start + len;//更新pos
	}
	iterator i = _finish - 1;
	while (i >= pos)//pos之后元素全体向后移动一位
	{
		*(i + 1) = *i;
		i--;
	}
	*pos = x;
	_finish++;
	return pos;//返回指向新元素的迭代器
}

cpp 复制代码

void push_back(const T& x)
{
	insert(_finish, x);//直接调用insert
}

erase和pop_back

erase和pop_back负责删除操作。与insert相同，erase也会发生迭代器失效 的问题。但是erase不会造成空间容量的改变，理论上是不会使迭代器失效的。不过，如果有一个迭代器指向末尾元素，删除数据之后，finish前移，该迭代器指向的数据就是非法的，就会造成迭代器失效 。所以删除vector的任意元素后，vs编译器就会认为指向该元素的迭代器失效，无法继续使用。

对于这种问题的解决方法也很简单：如果我们只是删除一次数据，迭代器失效也没关系；如果要连续删除，则需要更新迭代器。对此，我们在erase函数中删除元素后，将指向该元素位置的迭代器作为返回值，函数外部需要使用该返回值更新迭代器。

erase和pop_back代码实现：

cpp 复制代码

iterator erase(iterator pos)
{
	assert(pos >= _start && pos < _finish);//确保删除位置合法
	auto i = pos + 1;
	while (i < _finish)//pos之后元素全体前移一位
	{
		*(i - 1) = *i;
		i--;
	}
	_finish--;
	return pos;//返回删除位置迭代器
}

cpp 复制代码

void pop_back()
{
	assert(!empty());//防止空删
	_finish--;
}

3. 程序全部代码

模拟实现vector的全部代码如下：

cpp 复制代码

#include <iostream>
#include <algorithm>
#include <cassert>
using namespace std;

template<class T>
class Vector
{
public:
	//vector的迭代器是一个原生指针
	typedef T* iterator;
	typedef const T* const_iterator;

	//迭代器接口
	iterator begin()
	{
		return _start;
	}
	iterator end()
	{
		return _finish;
	}
	const_iterator begin() const
	{
		return _start;
	}
	const_iterator end() const
	{
		return _finish;
	}

	//无参构造
	Vector()
	{}
	//初始化器构造
	Vector(initializer_list<T> l)
	{
		reserve(l.size());
		for (auto& e : l)
		{
			push_back(e);
		}
	}
	//迭代器区间构造
	template<class InputIterator>
	Vector(InputIterator first, InputIterator last)
	{
		while (first != last)
		{
			push_back(*first);
			first++;
		}
	}
	//n个val值构造
	Vector(size_t n, const T& val = T())
	{
		reverse(n);
		for (size_t i = 0; i < n; i++)
		{
			push_back(val);
		}
	}
	//拷贝构造
	Vector(const Vector<T>& v)
	{
		reverse(v.capacity());
		for (auto& e : v)
		{
			push_back(e);
		}
	}
	//赋值重载
	Vector<T>& operator=(Vector<T> v)
	{
		swap(v);
		return *this;
	}
	//析构
	~Vector()
	{
		if (_start)//避免多次释放
		{
			delete[] _start;
			_start = _finish = _end_of_storage = nullptr;
		}
	}

	//下标引用
	T& operator[](size_t i)
	{
		assert(i < size());//防止越界
		return _start[i];
	}
	const T& operator[](size_t i) const
	{
		assert(i < size());
		return _start[i];
	}

	//容量接口
	size_t size() const
	{
		return _finish - _start;
	}
	size_t capacity() const
	{
		return _end_of_storage - _start;
	}

	//判空
	bool empty() const
	{
		return _start == _finish;
	}

	//交换
	void swap(Vector<T>& tmp)
	{
		std::swap(_start, tmp._start);
		std::swap(_finish, tmp._finish);
		std::swap(_end_of_storage, tmp._end_of_storage);
	}

	//调整大小
	void resize(size_t n, const T& val = T())
	{
		if (n <= size())
		{
			_finish = _start + n;
		}
		else
		{
			reserve(n);
			while (_finish < _start + n)
			{
				*_finish = val;
				_finish++;
			}
		}
	}

	//增容
	void reserve(size_t n)
	{
		if (n > capacity())
		{
			size_t old_size = size();//记录原来的size
			T* tmp = new T[n];
			if (_start)//如果start是空，说明数组为空，不拷贝数据
			{
				for (size_t i = 0; i < old_size; i++)
				{
					tmp[i] = _start[i];
				}
				delete[] _start;
			}
			_start = tmp;
			_finish = tmp + old_size;
			_end_of_storage = tmp + n;
		}
	}

	//插入和删除
	void push_back(const T& x)
	{
		insert(_finish, x);//直接调用insert
	}
	void pop_back()
	{
		assert(!empty());//防止空删
		_finish--;
	}
	iterator insert(iterator pos, const T& x)
	{
		assert(pos >= _start && pos <= finish);//确保插入位置合法
		if (_finish == _end_of_storage)//空间已满，增容
		{
			size_t len = pos - _start;//记录相对位置
			reserve(capcaity() == 0 ? 4 : 2 * capacity());//增容
			pos = _start + len;//更新pos
		}
		iterator i = _finish - 1;
		while (i >= pos)//pos之后元素全体向后移动一位
		{
			*(i + 1) = *i;
			i--;
		}
		*pos = x;
		_finish++;
		return pos;//返回指向新元素的迭代器
	}
	iterator erase(iterator pos)
	{
		assert(pos >= _start && pos < _finish);//确保删除位置合法
		auto i = pos + 1;
		while (i < _finish)//pos之后元素全体前移一位
		{
			*(i - 1) = *i;
			i--;
		}
		_finish--;
		return pos;//返回删除位置迭代器
	}
private:
	iterator _start = nullptr;
	iterator _finish = nullptr;
	iterator _end_of_storage = nullptr;
};

总结

本篇文章，我们深入了解了vector的底层原理，并成功地模拟实现了它。与传统的动态顺序表不同，它采用了三个迭代器来维护数组，提高了程序灵活性。也正因如此，它的实现难度也有所增大，对于细节把控的要求也很高。之后博主会带领大家学习一个新容器--list。如果你觉得博主讲的还不错，就请留下一个小小的赞在走哦，感谢大家的支持❤❤❤

【c++丨STL】vector模拟实现

🌟🌟作者主页：ephemerals__****

🌟🌟所属专栏：C++、STL

目录

前言

一、vector底层刨析

二、模拟实现

1. 属性、迭代器以及函数声明

2. 功能实现

交换两个容器的内容

构造函数

拷贝构造

赋值重载

析构函数

下标引用operator[ ]

容量接口

迭代器接口

判空

resize

reserve

插入和删除

insert和push_back

erase和pop_back

3. 程序全部代码

总结