C/C++ vector模拟实现

模拟实现：

框架

cpp 复制代码

namespace yx
{
	template<class T>
	class vector
	{
	public:
		typedef T* iterator;


	private:
		iterator _start;
		iterator _finish;
		iterator _end_of_storage;
	};
}

这里我们声明定义不分离

reverse()

新开一个空间，拷贝数据，然后释放旧空间

代码：

cpp 复制代码

void reserve(size_t n)//满了要扩容
{
	if (n > capacity())
	{
		T* tmp = new T[n];//new 开空间 + 初始化
		memcpy(tmp,_start,sizeof(T) * size());//一个一个字节的拷贝下来
		delete[] _start;
		_start = tmp;
	}
	_finish = _start + size();
	_end_of_storage = _start + n;
}

capacity()

cpp 复制代码

size_t capcaity() const
{
	return _end_of_storage - _start;
}

size()

cpp 复制代码

size_t size() const
{
	return _finsh - _start;
}

operator[]

俩版本，一个可读可写，一个只读

cpp 复制代码

T& operator[](size_t i)
{
	assert(i < size());


	return _start[i];
}

cpp 复制代码

const T& operator[](size_t i) const 
{
	assert(i < size());


	return _start[i];
}

push_back()

分析

cpp 复制代码

void push_back(const T& x)
{
	if (_finish == _end_of_storage)//扩容
	{
		size_t newcapacity = capacity() == 0 ? 4 : capcaity * 2;
		reverse(newcapacity);
	}
	*_finish = x;
	++_finish;
	
}

这时我们来运行一下

意外的出错了，为什么呢？

我们来调试一下

我们发现_finish竟然等于0，

其实问题出现在size(),size = _finish - _start , 但这不是正好吗？

我们来看一个图，start还是不是原来的start，当然不是了，这是start已经被更新了，start = tmp，相当于旧的finish 减新的start,size已经不是我们要的哪个size了。

修改方法

第一种

我们先修改一下start的位置

在reserve中

cpp 复制代码

void reserve(size_t n)//满了要扩容
{
	if (n > capacity())
	{
		T* tmp = new T[n];//new 开空间 + 初始化

		if (_start)
		{
			memcpy(tmp, _start, sizeof(T) * size());//一个一个字节的拷贝下来
			delete[] _start;
		}
		_finish = tmp + size();

		_start = tmp;
		_end_of_storage = _start + n;
	}
	
}

测试成功，但这强依赖顺序了，不太好。

第二种

oldsize方法提前存储

cpp 复制代码

void reserve(size_t n)//满了要扩容
{
	if (n > capacity())
	{
		size_t oldsize = size();//oldsize提前存储
		T* tmp = new T[n];//new 开空间 + 初始化

		if (_start)
		{
			memcpy(tmp, _start, sizeof(T) * size());//一个一个字节的拷贝下来
			delete[] _start;
		}
		
		_start = tmp;
		_finish = tmp + oldsize;
		_end_of_storage = _start + n;
	}
	
}

~vector()

cpp 复制代码

~vector()
{
	if (_start)
	{
		delete[] _start;
		_start = _finish = _end_of_storage;
	}
}

迭代器iterator

下面写的只是一种方式

cpp 复制代码

typedef T* iterator;

iterator begin()
{
	return _start;
}

iterator end()
{
	return _finish;
}

我们来用范围for遍历测试一下

测试通过

三种遍历方式

cpp 复制代码

for (size_t i = 0; i < v1.size(); i++)
{
	cout << v1[i] << " ";
}cout << endl;

for (auto e : v1)
{
	cout << e << " ";
}cout << endl;

vector<int>::iterator it = v1.begin();
while (it != v1.end())
{
	cout << *it << " ";
	++it;
}cout << endl;

const迭代器

cpp 复制代码

typedef const T* const_iterator;

const_iterator begin() const
{
	return _start;
}

const_iterator end() const
{
	return _finish;
}

pop_back()

cpp 复制代码

pop_back()
{
	assert(size() > 0);

	--_finish;
}

insert()

头插

代码：

cpp 复制代码

//头插，在x前插入
void insert(iterator pos, const T& x)
{
	//检查是否需要扩容
	if (_finish == _end_of_storage)
	{
		size_t newcapacity = capacity() == 0 ? 4 : capacity() * 2;
		reserve(newcapacity);
	}

	iterator end = _finish - 1;
	while (end >= pos)
	{
		*(end + 1) = *end;
		--end;
	}
	*pos = x;
	++_finish;
}

我们测试一下

为什么是个随机值呢？

insert迭代器失效

此时_finish = _end_of_storage ，出现了扩容，

导致出现了迭代器失效，pos变为野指针

扩容后，start，finish _end_of_storage都去了新空间，旧空间释放了，而pos还在旧空间里，pos为野指针，所以导致了随机值。

修改方法，算出pos与start的距离

修改后代码：

cpp 复制代码

void insert(iterator pos, const T& x)
{
	//检查是否需要扩容
	if (_finish == _end_of_storage)
	{
		size_t len = pos - _start;

		size_t newcapacity = capacity() == 0 ? 4 : capacity() * 2;
		reserve(newcapacity);//扩容完后pos为野指针

		pos = _start + len;//pos找到新空间位置
	}

	iterator end = _finish - 1;
	while (end >= pos)
	{
		*(end + 1) = *end;
		--end;
	}
	*pos = x;
	++_finish;
}

测试通过

it会不会失效呢？失效后的迭代器还能访问吗？

实参传给形参，形参的改变不会影响实参。但如果出现了扩容呢？insert函数内的pos可以解决野指针问题，但it解决不了。我们就不敢访问这个迭代器了。因为出现了野指针。

我们访问一下迭代器，出现野指针了吧。

迭代器失效后的建议是不要访问。

如果我们给pos加个引用呢？

测试一下

我们发现begin传不过去了，为什么？

v1.begin()，begin() 返回一个迭代器，而且是传值返回，c++规定，传值返回返回的不是_start，返回的是其拷贝，生成临时对象，临时对象具有常性，所以非不要不访问。

erase()

头删

cpp 复制代码

void erase(iterator pos)
{
	assert(pos >= _start);
	assert(pos < _finish);

	iterator it = pos + 1;
	while (it != _finish)
	{
		*(it - 1) = *it;
		++it;
	}
	--_finish;
}

测试

erase的迭代器失效

报错了，为什么？

erase迭代器失效

我们界定erase以后，这个it失效了。为什么？

第一种情况：缩容

如果删除后的数据小于容量capacity的一半，就开始缩容

旧的空间释放掉，导致it变为野指针

第二种情况：越界

如果我们删除5呢。

这里出现了越界（非法访问）。迭代器it也失效了

所以erase it 以后，it就失效。

在vs中不会缩容，那它如何判断的呢？vs下的iterator是一个很复杂的类型，不是一个原生指针实现的

我们可以这样理解，erase it以后，就把it的类型改了，我们再访问的时候就会报错。

如何修改呢？

给其一个返回值

我们来删除所有偶数

cpp 复制代码

void test6()
{
	std::vector<int> v1;
	v1.push_back(1);
	v1.push_back(2);
	v1.push_back(3);
	v1.push_back(4);
	v1.push_back(5);


	//删除所有偶数
	std::vector<int>::iterator it = v1.begin();
	while (it != v1.end())
	{
		if (*it % 2 == 0)
		{
			v1.erase(it);
		}
		else
		{
			++it;
		}
	}
	
	for (auto e : v1)
	{
		cout << e << " ";
	}cout << endl;

}

程序对不对呢？

当然不对，erase it 一次以后，it就失效了，程序报错。调试一下

删除完2后，it失效，程序报错，如何修改呢？

拷贝构造

我们没有写拷贝构造，编译器会默认生成一个拷贝构造。是浅拷贝，完成的是值的拷贝

cpp 复制代码

void test7()
{
	vector<int> v1;
	v1.push_back(1);
	v1.push_back(2);
	v1.push_back(3);
	v1.push_back(4);
	v1.push_back(5);

	vector<int> v2(v1);
	for (auto e : v2)
	{
		cout << e << " ";
	}cout << endl;
}

我们测试一下

会导致析构两次，报错。

我们没有写默认构造，拷贝构造也是构造，构造函数的定义是，只要你写了任意构造，编译器默认就不生成

这里我们强制编译器生成默认构造

cpp 复制代码

//强制编译器生成默认的构造
vector() = default;

//拷贝构造v2(v1)，拷贝构造也是构造
vector(const vector<T>& v)
{
	for (auto e : v)
	{
		push_back(e);
	}
}

测试通过

swap()

cpp 复制代码

void swap(vector<T>& v)
{
	std::swap(_start, v._start);
	std::swap(_finish, v._finish);
	std::swap(_end_of_storage, v._end_of_storage);
}

operator=

v1 = v3，直接传值传参v就是v3的拷贝构造，v1就是this，tihs和v交换，this不要的数据给v，v出了作用域会析构，写法对于所有深拷贝都适合

cpp 复制代码

//赋值 v1 = v3，v1之前的空间要释放，v1要和v3有一样大的空间一样的值
vector<T> operator=(vector<T> v)//直接传值传参v就是v3的拷贝，
{
	this->swap(v);
	return *this;
}

测试通过

迭代器区间初始化

类模板的成员函数

函数模板，支持任意容器的迭代器初始化

cpp 复制代码

template <class InputIterator>
vector(InputIterator first, InputIterator last)
{
	while (first != last)
	{
		push_back(*first);
		++first;
	}
}

迭代器区间初始化可以更好的控制初始化范围。

那么再这里写函数模板到底是为了什么？

任意类型的迭代器都能用。

char和转化为int，类型提升，用的ascii码

n个value值构造函数

cpp 复制代码

vector(size_t n, const T& val = T())
{
	reserve(n);
	for (size_t i = 0; i < n; i++)
	{
		push_back(val);
	}
}

我们看到val的值为T()，这里是匿名对象，

那val能不能给0呢？答案是不可以的，为什么？

当T的为int时，当然可以；但当T为string呢？T为vector呢？是不是就不行了。

当然，当T()匿名对象的T为int的时候是不是就不对了呢？

这个在C语言中是不对的，但在C++中是正确的。

cpp 复制代码

void test9()
{
	int i = 0;
	int j(1);
	int k = int();
	int x = int(2);

}

C++对内置类型进行了升级。C++的内置类型也有了构造，为了兼容模板。

测试

v2初始化为了xxx

当我们再写一个v3初始化为1时，出现编译错误，为什么？

由于此时有两个构造，它会选择更适合自己的模板，所以选择了第一个，*first出现了错误。

如何修改呢？

第一种

在10后面加个u，表示无符号整型

第二种

重载了一个构造函数，size_t修改为int

对于初始化{}

单参数和多参数对象隐式类型转换

cpp 复制代码

	class A
	{
	public:
		A(int a1)
			:_a1(a1)
			, _a2(0)
		{

		}

		A(int a1,int a2)
			:_a1(a1)
			, _a2(a2)
		{

		}

	private:
		int _a1;
		int _a2;
	};

单参数和多参数对象隐式类型转换

*****************

单参数用括号，多参数必须用花括号{ }

cpp 复制代码

A aa1(1, 1);
A aa2 = { 2,2 };
A aa2{ 2,2 };
const A& aa8 = { 1, 2};

A aa3(1);
A aa4 = 1;

cpp 复制代码

const A& aa8 = { 1, 2};

aa8引用的是{1，2}中间产生的临时对象，具有常性

c++11规定单参数也可以用花括号{}来初始化

cpp 复制代码

A aa5(1);
A aa6 = { 1 };
A aa7{ 1 };

结果是一样的，但单参数不建议这样写。

我们来看一下下面代码是不是隐式类型转换

cpp 复制代码

	vector<int> v1 = { 1,2,3,4,5,6 };
	for (auto e : v1)
	{
		cout << e << " ";
	}cout << endl;

这里当然不是，上面描述的有单参数的和两个参数，本质上都去调自己的构造去了。

这里不是隐式类型转换，上面参数固定，这里参数不固定，可以是3个可以是5个等。

为什么会这样呢？

因为c++11里支持initializer_list，新增的一个类型，方便初始化，

cpp 复制代码

	vector<int> v1 = { 1,2,3,4,5,6 };

这里的1 ，2 ，3 ，4 ，5 ，6 的类型为initializer_list

它的底层其实是俩指针，一个指向开始，一个指向最后一个数据的下一位，所以这里我们可以用范围for遍历。

vector<int> v2 = {1,2,3,4,5,6} 这里的{1，2，3，4，5，6}类型为initializer_list，生成临时对象，拷贝构造给v2，优化为构造。

我们在这里还需要写一个initializer_list的构造

cpp 复制代码

vector(initializer_list<T> il)
{
	reserve(il.size());
	for (auto e : il)
	{
		push_back(e);
	}

}

测试

我们看一下下面这个怎某构造

cpp 复制代码

vector<A> v3 = {  };

知识点

我先把结论告诉你：vector<>里面的数据类型是一个自定义类型时，要考虑深拷贝。

我们看一下代码

cpp 复制代码

	void test11()
	{
		vector<string> v1;
		v1.push_back("11111111111111");
		v1.push_back("11111111111111");
		v1.push_back("11111111111111");
		v1.push_back("11111111111111");

		for (auto e : v1)
		{
			cout << e << " ";
		}cout << endl;

	}

测试一下

没问题

如果我们再push一次呢

代码出错了，为什么？？？

我们调试一下

空间不够，需要扩容，然后把数据给给tmp，_start释放。而数据拷贝给新空间的时候是浅拷贝，string没有深拷贝

memcpy是一个字节一个字节的拷贝，对任意类型拷贝都是浅拷贝。

tmp指向的还是原来的哪个地址，而_start空间释放了，它的深拷贝没有发生再vector这一层，而是发生在自定义类型存的数据。

如何解决呢？

对_str进行深拷贝，但我们不能访问_str里的数据

我们直接使用赋值来完成工作

cpp 复制代码

void reserve(size_t n)//满了要扩容
{
	if (n > capacity())
	{
		size_t oldsize = size();//oldsize提前存储
		T* tmp = new T[n];//new 开空间 + 初始化

		//if (_start)
		//{
		//	memcpy(tmp, _start, sizeof(T) * size());//一个一个字节的拷贝下来
		//	delete[] _start;
		//}
		
		if (_start)
		{
			for (size_t i = 0; i < oldsize; i++)
			{
				tmp[i] = _start[i];
			}
			delete[] _start;
		}

		_start = tmp;
		_finish = tmp + oldsize;
		_end_of_storage = _start + n;
	}
	
}

本集完