C/C++ vector模拟实现

模拟实现:

框架

cpp 复制代码
namespace yx
{
	template<class T>
	class vector
	{
	public:
		typedef T* iterator;


	private:
		iterator _start;
		iterator _finish;
		iterator _end_of_storage;
	};
}

这里我们声明定义不分离

reverse()

新开一个空间,拷贝数据,然后释放旧空间

代码:

cpp 复制代码
void reserve(size_t n)//满了要扩容
{
	if (n > capacity())
	{
		T* tmp = new T[n];//new 开空间 + 初始化
		memcpy(tmp,_start,sizeof(T) * size());//一个一个字节的拷贝下来
		delete[] _start;
		_start = tmp;
	}
	_finish = _start + size();
	_end_of_storage = _start + n;
}

capacity()

cpp 复制代码
size_t capcaity() const
{
	return _end_of_storage - _start;
}

size()

cpp 复制代码
size_t size() const
{
	return _finsh - _start;
}

operator[]

俩版本,一个可读可写,一个只读

cpp 复制代码
T& operator[](size_t i)
{
	assert(i < size());


	return _start[i];
}
cpp 复制代码
const T& operator[](size_t i) const 
{
	assert(i < size());


	return _start[i];
}

push_back()

分析

cpp 复制代码
void push_back(const T& x)
{
	if (_finish == _end_of_storage)//扩容
	{
		size_t newcapacity = capacity() == 0 ? 4 : capcaity * 2;
		reverse(newcapacity);
	}
	*_finish = x;
	++_finish;
	
}

这时我们来运行一下

意外的出错了,为什么呢?

我们来调试一下

我们发现_finish竟然等于0,

其实问题出现在size(),size = _finish - _start , 但这不是正好吗?

我们来看一个图,start还是不是原来的start,当然不是了,这是start已经被更新了 ,start = tmp,相当于旧的finish 减新的start,size已经不是我们要的哪个size了。

修改方法

第一种

我们先修改一下start的位置

在reserve中

cpp 复制代码
void reserve(size_t n)//满了要扩容
{
	if (n > capacity())
	{
		T* tmp = new T[n];//new 开空间 + 初始化

		if (_start)
		{
			memcpy(tmp, _start, sizeof(T) * size());//一个一个字节的拷贝下来
			delete[] _start;
		}
		_finish = tmp + size();

		_start = tmp;
		_end_of_storage = _start + n;
	}
	
}

测试成功,但这强依赖顺序了,不太好。

第二种

oldsize方法提前存储

cpp 复制代码
void reserve(size_t n)//满了要扩容
{
	if (n > capacity())
	{
		size_t oldsize = size();//oldsize提前存储
		T* tmp = new T[n];//new 开空间 + 初始化

		if (_start)
		{
			memcpy(tmp, _start, sizeof(T) * size());//一个一个字节的拷贝下来
			delete[] _start;
		}
		
		_start = tmp;
		_finish = tmp + oldsize;
		_end_of_storage = _start + n;
	}
	
}

~vector()

cpp 复制代码
~vector()
{
	if (_start)
	{
		delete[] _start;
		_start = _finish = _end_of_storage;
	}
}

迭代器iterator

下面写的只是一种方式

cpp 复制代码
typedef T* iterator;

iterator begin()
{
	return _start;
}

iterator end()
{
	return _finish;
}

我们来用范围for遍历测试一下

测试通过

三种遍历方式

cpp 复制代码
for (size_t i = 0; i < v1.size(); i++)
{
	cout << v1[i] << " ";
}cout << endl;

for (auto e : v1)
{
	cout << e << " ";
}cout << endl;

vector<int>::iterator it = v1.begin();
while (it != v1.end())
{
	cout << *it << " ";
	++it;
}cout << endl;

const迭代器

cpp 复制代码
typedef const T* const_iterator;

const_iterator begin() const
{
	return _start;
}

const_iterator end() const
{
	return _finish;
}

pop_back()

cpp 复制代码
pop_back()
{
	assert(size() > 0);

	--_finish;
}

insert()

头插

代码:

cpp 复制代码
//头插,在x前插入
void insert(iterator pos, const T& x)
{
	//检查是否需要扩容
	if (_finish == _end_of_storage)
	{
		size_t newcapacity = capacity() == 0 ? 4 : capacity() * 2;
		reserve(newcapacity);
	}

	iterator end = _finish - 1;
	while (end >= pos)
	{
		*(end + 1) = *end;
		--end;
	}
	*pos = x;
	++_finish;
}

我们测试一下

为什么是个随机值呢?

insert迭代器失效

此时_finish = _end_of_storage ,出现了扩容,

导致出现了迭代器失效,pos变为野指针

扩容后,start,finish _end_of_storage都去了新空间,旧空间释放了,而pos还在旧空间里,pos为野指针,所以导致了随机值。

修改方法,算出pos与start的距离

修改后代码:

cpp 复制代码
void insert(iterator pos, const T& x)
{
	//检查是否需要扩容
	if (_finish == _end_of_storage)
	{
		size_t len = pos - _start;

		size_t newcapacity = capacity() == 0 ? 4 : capacity() * 2;
		reserve(newcapacity);//扩容完后pos为野指针

		pos = _start + len;//pos找到新空间位置
	}

	iterator end = _finish - 1;
	while (end >= pos)
	{
		*(end + 1) = *end;
		--end;
	}
	*pos = x;
	++_finish;
}

测试通过

it会不会失效呢?失效后的迭代器还能访问吗?

实参传给形参,形参的改变不会影响实参。但如果出现了扩容呢?insert函数内的pos可以解决野指针问题,但it解决不了。我们就不敢访问这个迭代器了。因为出现了野指针。

我们访问一下迭代器,出现野指针了吧。

迭代器失效后的建议是不要访问。

如果我们给pos加个引用呢?

测试一下

我们发现begin传不过去了,为什么?

v1.begin(),begin() 返回一个迭代器,而且是传值返回,c++规定,传值返回返回的不是_start,返回的是其拷贝,生成临时对象,临时对象具有常性,所以非不要不访问。

erase()

头删

cpp 复制代码
void erase(iterator pos)
{
	assert(pos >= _start);
	assert(pos < _finish);

	iterator it = pos + 1;
	while (it != _finish)
	{
		*(it - 1) = *it;
		++it;
	}
	--_finish;
}

测试

erase的迭代器失效

报错了,为什么?

erase迭代器失效

我们界定erase以后,这个it失效了。为什么?

第一种情况:缩容

如果删除后的数据小于容量capacity的一半,就开始缩容

旧的空间释放掉,导致it变为野指针

第二种情况:越界

如果我们删除5呢。

这里出现了越界(非法访问)。迭代器it也失效了

所以erase it 以后,it就失效。

在vs中不会缩容,那它如何判断的呢?vs下的iterator是一个很复杂的类型,不是一个原生指针实现的

我们可以这样理解,erase it以后,就把it的类型改了,我们再访问的时候就会报错。

如何修改呢?

给其一个返回值

我们来删除所有偶数

cpp 复制代码
void test6()
{
	std::vector<int> v1;
	v1.push_back(1);
	v1.push_back(2);
	v1.push_back(3);
	v1.push_back(4);
	v1.push_back(5);


	//删除所有偶数
	std::vector<int>::iterator it = v1.begin();
	while (it != v1.end())
	{
		if (*it % 2 == 0)
		{
			v1.erase(it);
		}
		else
		{
			++it;
		}
	}
	
	for (auto e : v1)
	{
		cout << e << " ";
	}cout << endl;

}

程序对不对呢?

当然不对,erase it 一次以后,it就失效了,程序报错。调试一下

删除完2后,it失效,程序报错,如何修改呢?

拷贝构造

我们没有写拷贝构造,编译器会默认生成一个拷贝构造。是浅拷贝,完成的是值的拷贝

cpp 复制代码
void test7()
{
	vector<int> v1;
	v1.push_back(1);
	v1.push_back(2);
	v1.push_back(3);
	v1.push_back(4);
	v1.push_back(5);

	vector<int> v2(v1);
	for (auto e : v2)
	{
		cout << e << " ";
	}cout << endl;
}

我们测试一下

会导致析构两次,报错。

我们没有写默认构造,拷贝构造也是构造,构造函数的定义是,只要你写了任意构造,编译器默认就不生成

这里我们强制编译器生成默认构造

cpp 复制代码
//强制编译器生成默认的构造
vector() = default;

//拷贝构造v2(v1),拷贝构造也是构造
vector(const vector<T>& v)
{
	for (auto e : v)
	{
		push_back(e);
	}
}

测试通过

swap()

cpp 复制代码
void swap(vector<T>& v)
{
	std::swap(_start, v._start);
	std::swap(_finish, v._finish);
	std::swap(_end_of_storage, v._end_of_storage);
}

operator=

v1 = v3,直接传值传参v就是v3的拷贝构造,v1就是this,tihs和v交换,this不要的数据给v,v出了作用域会析构,写法对于所有深拷贝都适合

cpp 复制代码
//赋值 v1 = v3,v1之前的空间要释放,v1要和v3有一样大的空间一样的值
vector<T> operator=(vector<T> v)//直接传值传参v就是v3的拷贝,
{
	this->swap(v);
	return *this;
}

测试通过

迭代器区间初始化

迭代器区间初始化

类模板的成员函数

函数模板,支持任意容器的迭代器初始化

cpp 复制代码
template <class InputIterator>
vector(InputIterator first, InputIterator last)
{
	while (first != last)
	{
		push_back(*first);
		++first;
	}
}

迭代器区间初始化可以更好的控制初始化范围。

那么再这里写函数模板到底是为了什么?

任意类型的迭代器都能用。

char和转化为int,类型提升,用的ascii码

n个value值构造函数

cpp 复制代码
vector(size_t n, const T& val = T())
{
	reserve(n);
	for (size_t i = 0; i < n; i++)
	{
		push_back(val);
	}
}

我们看到val的值为T(),这里是匿名对象,

那val能不能给0呢?答案是不可以的,为什么?

当T的为int时,当然可以;但当T为string呢?T为vector呢?是不是就不行了。

当然,当T()匿名对象的T为int的时候是不是就不对了呢?

这个在C语言中是不对的,但在C++中是正确的。

cpp 复制代码
void test9()
{
	int i = 0;
	int j(1);
	int k = int();
	int x = int(2);

}

C++对内置类型进行了升级。C++的内置类型也有了构造,为了兼容模板。

测试

v2初始化为了xxx

当我们再写一个v3初始化为1时,出现编译错误,为什么?

由于此时有两个构造,它会选择更适合自己的模板,所以选择了第一个,*first出现了错误。

如何修改呢?

第一种

在10后面加个u,表示无符号整型

第二种

重载了一个构造函数,size_t修改为int

对于初始化{}

单参数和多参数对象隐式类型转换

cpp 复制代码
	class A
	{
	public:
		A(int a1)
			:_a1(a1)
			, _a2(0)
		{

		}

		A(int a1,int a2)
			:_a1(a1)
			, _a2(a2)
		{

		}

	private:
		int _a1;
		int _a2;
	};

单参数和多参数对象隐式类型转换

*****************

单参数用括号,多参数必须用花括号{ }

cpp 复制代码
A aa1(1, 1);
A aa2 = { 2,2 };
A aa2{ 2,2 };
const A& aa8 = { 1, 2};

A aa3(1);
A aa4 = 1;
cpp 复制代码
const A& aa8 = { 1, 2};

aa8引用的是{1,2}中间产生的临时对象,具有常性

c++11规定单参数也可以用花括号{}来初始化

cpp 复制代码
A aa5(1);
A aa6 = { 1 };
A aa7{ 1 };

结果是一样的,但单参数不建议这样写。

我们来看一下下面代码是不是隐式类型转换

cpp 复制代码
	vector<int> v1 = { 1,2,3,4,5,6 };
	for (auto e : v1)
	{
		cout << e << " ";
	}cout << endl;

这里当然不是,上面描述的有单参数的和两个参数,本质上都去调自己的构造去了。

这里不是隐式类型转换,上面参数固定,这里参数不固定,可以是3个可以是5个等。

为什么会这样呢?

因为c++11里支持initializer_list,新增的一个类型,方便初始化 ,

cpp 复制代码
	vector<int> v1 = { 1,2,3,4,5,6 };

这里的1 ,2 ,3 ,4 ,5 ,6 的类型为initializer_list

它的底层其实是俩指针,一个指向开始,一个指向最后一个数据的下一位,所以这里我们可以用范围for遍历。

vector<int> v2 = {1,2,3,4,5,6} 这里的{1,2,3,4,5,6}类型为initializer_list,生成临时对象,拷贝构造给v2,优化为构造。

我们在这里还需要写一个initializer_list的构造

cpp 复制代码
vector(initializer_list<T> il)
{
	reserve(il.size());
	for (auto e : il)
	{
		push_back(e);
	}

}

测试

我们看一下下面这个怎某构造

cpp 复制代码
vector<A> v3 = {  };

知识点

我先把结论告诉你:vector<>里面的数据类型是一个自定义类型时,要考虑深拷贝。

我们看一下代码

cpp 复制代码
	void test11()
	{
		vector<string> v1;
		v1.push_back("11111111111111");
		v1.push_back("11111111111111");
		v1.push_back("11111111111111");
		v1.push_back("11111111111111");

		for (auto e : v1)
		{
			cout << e << " ";
		}cout << endl;

	}

测试一下

没问题

如果我们再push一次呢

代码出错了,为什么???

我们调试一下

空间不够,需要扩容,然后把数据给给tmp,_start释放。而数据拷贝给新空间的时候是浅拷贝,string没有深拷贝

memcpy是一个字节一个字节的拷贝,对任意类型拷贝都是浅拷贝。

tmp指向的还是原来的哪个地址,而_start空间释放了,它的深拷贝没有发生再vector这一层,而是发生在自定义类型存的数据。

如何解决呢?

对_str进行深拷贝,但我们不能访问_str里的数据

我们直接使用赋值来完成工作

cpp 复制代码
void reserve(size_t n)//满了要扩容
{
	if (n > capacity())
	{
		size_t oldsize = size();//oldsize提前存储
		T* tmp = new T[n];//new 开空间 + 初始化

		//if (_start)
		//{
		//	memcpy(tmp, _start, sizeof(T) * size());//一个一个字节的拷贝下来
		//	delete[] _start;
		//}
		
		if (_start)
		{
			for (size_t i = 0; i < oldsize; i++)
			{
				tmp[i] = _start[i];
			}
			delete[] _start;
		}

		_start = tmp;
		_finish = tmp + oldsize;
		_end_of_storage = _start + n;
	}
	
}

本集完

相关推荐
似霰2 分钟前
安卓智能指针sp、wp、RefBase浅析
android·c++·binder
芊寻(嵌入式)13 分钟前
C转C++学习笔记--基础知识摘录总结
开发语言·c++·笔记·学习
獨枭14 分钟前
C++ 项目中使用 .dll 和 .def 文件的操作指南
c++
霁月风17 分钟前
设计模式——观察者模式
c++·观察者模式·设计模式
橘色的喵18 分钟前
C++编程:避免因编译优化引发的多线程死锁问题
c++·多线程·memory·死锁·内存屏障·内存栅栏·memory barrier
何曾参静谧1 小时前
「C/C++」C/C++ 之 变量作用域详解
c语言·开发语言·c++
AI街潜水的八角1 小时前
基于C++的决策树C4.5机器学习算法(不调包)
c++·算法·决策树·机器学习
JSU_曾是此间年少2 小时前
数据结构——线性表与链表
数据结构·c++·算法
此生只爱蛋2 小时前
【手撕排序2】快速排序
c语言·c++·算法·排序算法
何曾参静谧3 小时前
「C/C++」C/C++ 指针篇 之 指针运算
c语言·开发语言·c++