C++入门第七篇--STL模板--vector模拟实现

前言:

有了前面的string库的介绍,在这里我就不再介绍vector库了,而是直接模拟实现了。

vector库的概念和作用:

vector库是针对于数组的数据类型的容器,它有点类似我们曾经实现过的顺序表,你完全可以按照顺序表去理解vector,针对顺序表,我们自然少不了增删查改的功能,所以接下来让我们模拟实现一下vector库。

模拟实现过程:

1.私有成员变量的设置:

在这里,我们这样设置我们的私有成员变量,由于文档中C/C++库的函数大部分是用迭代器实现的,故我们模拟的时候也使用迭代器去操作,故成员如下:

cpp 复制代码
private:
	iterator _start;
	iterator _finish;
	iterator _endofstorage;

其中_start指向顺序表开头,_finish指向顺序表的数字的结尾,而_endofstorage则控制容量,指向容量的结尾

但是我们C++中是没有所谓的iterator的,但是我们知道iterator的本质是指针,故我们对类型重命名如下:

cpp 复制代码
typedef T* iterator;
typedef const T* const_iterator;

2.构造函数 析构函数 拷贝构造函数:

私有成员建立好后,我们下一个便是构建基本的三个函数:构造,析构,拷贝构造。
首先是构造函数:

cpp 复制代码
vector()
	:_start(nullptr)
	, _finish(nullptr)
	, _endofstorage(nullptr)
{}

这里就是常规的全让指针为空,因为我们会在调整容量的位置去为这三个成员变量赋值
析构函数:

cpp 复制代码
~vector()
{
	delete[] _start;
	_start = _finish = _endofstorage = nullptr;
}

这里需要注意的点就是:我们是需要在堆区上动态开辟空间的,故我们的析构函数是必须显式实例化的,要让析构函数释放掉我们的堆区空间。

拷贝构造函数:

cpp 复制代码
vector(const vector<T>& s)
	:_start(nullptr)
	, _finish(nullptr)
	, _endofstorage(nullptr)
{
	for (auto& ch : s)
	{
		push_back(ch);
	}
}

再拷贝构造这里,我使用了遍历尾插的方式,或许你会说,直接memcpy不是更好么,但是我们的顺序表不仅仅要存储内置类型,有时也要存储自定义类型,而memcpy对应的是一种浅拷贝,一旦涉及到指针的问题,就会有多次释放的危险,故我们在这里采取尾插的方式,即自定义类型会调用其赋值运算符重载,内置类型则直接赋值,这样就很好的避免了多次释放的问题。

3.赋值运算符重载:

cpp 复制代码
void swap( vector<T>& tmp)
{
	std::swap(_start, tmp._start);
	std::swap(_finish, tmp._finish);
	std::swap(_endofstorage, tmp._endofstorage);
}
vector<T>& operator=( vector<T> tmp)
{
	swap(tmp);
	return *this;
}

我在这里采取的现代写法,和string一样,采用一个变量tmp来打工的方式将值转给*this,大体的写法概念不变,我这里不过多赘述了。

4.size长度 capacity容量:

size用来返回顺序表的长度,而capacity用来返回顺序表的容量

cpp 复制代码
size_t size() const
{
	return _finish - _start;
}
size_t capacity() const
{
	return _endofstorage - _start;
}

5.首尾迭代器返回:

cpp 复制代码
iterator begin()
{
	return _start;
}
iterator end()
{
	return _finish;
}
const_iterator begin()const
{
	return _start;
}
const_iterator end()const
{
	return _finish;
}

在这里我们写了两个版本,一个是可读可写版本,一个是可读不可写版本,分别返回不同的迭代器

6.下标访问操作符[]重载:

其基本和我们字符串的写法区别不大:

cpp 复制代码
T& operator[](size_t pos)
{
	assert(pos < size());
	return _start[pos];
}
const T& operator[](size_t pos) const
{
	assert(pos < size());
	return _start[pos];
}

同样也是两个版本,可改与不可改

7.扩容!!!(本次实现的重点!)

扩容,是我们本次实现的重点,在这里牵扯到一个很关键的问题:迭代器失效。

何为迭代器失效呢?

先看下面的代码:

cpp 复制代码
void reserve(size_t n)
{
	if (n > capacity())
	{
		T* tmp = new T[n];
		if (_start)
		{
			int i = 0;
			for (i = 0; i < size(); i++)
			{
				tmp[i] = _start[i];
			}
			delete _start;
		}
		_start = tmp;
		_finish = _start + size();
		_endofstorage = _start + capacirty();
	}
}

这段代码就涉及到严重的迭代器失效的问题,问题出在我们的delete被销毁后,我们对应的size()和capacity()本质上指向的是之前的被销毁的数组的地址,这样我们使用函数是得不到正确的长度的,因为迭代器此时的地址是无效的,这便是我们所谓的迭代器失效,你可以看这张图理解:

所以,我们可以这样去修改程序:

cpp 复制代码
void reserve(size_t n)
{
	size_t sz = size();
	if (n > capacity())
	{
		T* tmp = new T[n];
		if (_start)
		{
			int i = 0;
			for (i = 0; i < size(); i++)
			{
				tmp[i] = _start[i];
			}
			delete _start;
		}
		_start = tmp;
		_finish = _start + sz;
		_endofstorage = _start + n;
	}
}

即先用一个变量将长度存储起来,而不是再用失效的迭代器返回长度和容量,在这里就是sz来存储,这样,我们就不会出现我们的长度是错误的问题了。

7.改变数组长度:

cpp 复制代码
	void resize(size_t n, const T& x = T())//改变数组长度
	{              //注意,内置类型是可以调用构造函数的,在模板这个章节是支持的,在这里别忘了加一个const,因为我们的缺省值是常量,不加const引用权限会放大
		if (n <= capacity())
		{
			_finish = _start + n;
		}
		else
		{
			reserve(n);
			//剩下来填数据:
			while (_finish < _start + n)
			{
				*_finish = x;
				_finish++;
			}
		}
	}

解决了扩容问题,我们其他的都很好解决了,这里也是一样,我们考虑两种情况即可,但是注意依旧用赋值不要用memcpy,因为涉及到浅拷贝的问题。

8.尾插 尾删:

尾插:

cpp 复制代码
void push_back(const T& x)  //尾插
{
	if (_finish == _endofstorage)
	{
		reserve(capacity() == 0 ? 4 : 2 * capacity());
	}
	*_finish = x;
	_finish++;
}

尾删:

cpp 复制代码
void push_pop()
{
	_finish--;
}

没什么好说的,顺手就应该写出来。

9.任意插 任意删:

任意删:

cpp 复制代码
	iterator& erase(iterator pos)
	{
		assert(pos >= _start);
		assert(pos <= _finish);

		iterator cur = pos + 1;
		while (cur < _finish)
		{
			*(cur - 1) = *cur;
			cur++;
		}
		_finish--;
		return pos;
	}

任意删的思路和我们顺序表的任意删差不多,直接覆盖即可,强调一下别忘了对我们传入的迭代器进行检验就好。
但是任意删有一个细节就是,我们会涉及到迭代器失效的问题,即这个位置被删除后再想针对这个位置删除就是出现问题,所以我们返回pos,即删除后的下一个位置的指针,这样就可以一直删,不会删除一次就失效了。
任意插:

cpp 复制代码
void insert(iterator pos, const T& x)//任意插
{
	assert(pos >= _start);
	assert(pos <= _finish);//这里可以等于,方便尾插
	if (_finish == _endofstorage)
	{
		size_t range = pos - _start;//在这里先存储一个长度变量方便后续迭代器失效时重新指定位置
		reserve(capacity() == 0 ? 4 : 2 * capacity());
		pos = _start + range;//由于扩容之后pos失效,那样的话pos不在新数组上,故我们要存储一个整型,方便扩容之后把pos重新带到新数组上来,别忘了任意插也存在扩容后迭代器失效的问题,我们的pos也会停留在之前的数组上被销毁之后就丢失了,要重新给到新的数组上
	}
	iterator end = _finish - 1;
	while (end >= pos)//这里要等于,保证其能在pos的位置之前插而不是正好插入pos位置
	{
		*(end + 1) = *end;
		end--;
	}
	*pos = x;
	_finish++;
}

在任意插这里,我们需要注意一个扩容的问题,凡是涉及到扩容和删除的问题,当我们使用迭代器去操作的时候,就要最好看一看是否涉及到迭代器失效的问题,在任意删这里就涉及到了,po针对的是被删除的数组的地址,但我们扩容后,pos的原位置直接失效了,故我们需要在扩容后调整pos到新数组的对应位置上,即:

cpp 复制代码
if (_finish == _endofstorage)
	{
		size_t range = pos - _start;//在这里先存储一个长度变量方便后续迭代器失效时重新指定位置
		reserve(capacity() == 0 ? 4 : 2 * capacity());
		pos = _start + range;//由于扩容之后pos失效,那样的话pos不在新数组上,故我们要存储一个整型,方便扩容之后把pos重新带到新数组上来,别忘了任意插也存在扩容后迭代器失效的问题,我们的pos也会停留在之前的数组上被销毁之后就丢失了,要重新给到新的数组上
	}

然后一个常规的插入pos即可,这里最关键的便是针对迭代器失效我们应该如何处理。

总结:

以上便是我们vector模拟实现的全部内容,和string一样,我们模拟实现vector最关键的目的是学会一些思路,以及熟练的去使用vector,这是最关键的。
补充一句,WBG加油!!!!

相关推荐
星星火柴9361 小时前
关于“双指针法“的总结
数据结构·c++·笔记·学习·算法
艾莉丝努力练剑2 小时前
【洛谷刷题】用C语言和C++做一些入门题,练习洛谷IDE模式:分支机构(一)
c语言·开发语言·数据结构·c++·学习·算法
阿巴~阿巴~4 小时前
深入解析C++ STL链表(List)模拟实现
开发语言·c++·链表·stl·list
旺小仔.5 小时前
双指针和codetop复习
数据结构·c++·算法
jingfeng5145 小时前
C++ STL-string类底层实现
前端·c++·算法
郝学胜-神的一滴5 小时前
基于C++的词法分析器:使用正则表达式的实现
开发语言·c++·程序人生·正则表达式·stl
努力努力再努力wz7 小时前
【c++深入系列】:万字详解模版(下)
java·c++·redis
瓦特what?8 小时前
关于C++的#include的超超超详细讲解
java·开发语言·数据结构·c++·算法·信息可视化·数据挖掘
祁同伟.8 小时前
【C++】动态内存管理
开发语言·c++
一只鲲8 小时前
40 C++ STL模板库9-容器2-vector
开发语言·c++