揭开 C++ vector 底层面纱:从三指针模型到手写完整实现

🔥草莓熊Lotso: 个人主页

❄️个人专栏:《C++知识分享》《Linux 入门到实践:零基础也能懂》

生活是默默的坚持,毅力是永久的享受


🎬 博主简介:


目录

前言:

[一. vector 底层核心:三指针控制内存](#一. vector 底层核心:三指针控制内存)

[二. 迭代器设计:连续内存的 "天然优势"](#二. 迭代器设计:连续内存的 “天然优势”)

迭代器类型定义:

[三. 核心接口实现:从构造到析构的内存管理](#三. 核心接口实现:从构造到析构的内存管理)

[3.1 构造与析构:vector的基础框架](#3.1 构造与析构:vector的基础框架)

[3.2 容量管理:reserve 与 resize 的区别](#3.2 容量管理:reserve 与 resize 的区别)

[3.2.1 reserve:仅扩容,不初始化元素](#3.2.1 reserve:仅扩容,不初始化元素)

[3.2.2 resize 改变size:可能初始化或销毁元素](#3.2.2 resize 改变size:可能初始化或销毁元素)

[3.3 元素操作:增删查改的实现细节](#3.3 元素操作:增删查改的实现细节)

[3.3.1 尾插(push_back)与尾删(pop_back):](#3.3.1 尾插(push_back)与尾删(pop_back):)

[3.3.2 插入(insert):中间插入的性能代价](#3.3.2 插入(insert):中间插入的性能代价)

[3.3.3 访问元素:operator []](#3.3.3 访问元素:operator [])

[四. 避坑指南:vector 使用的 3 个核心陷阱](#四. 避坑指南:vector 使用的 3 个核心陷阱)

[4.1 迭代器失效:扩容与删除的 "隐形炸弹"](#4.1 迭代器失效:扩容与删除的 “隐形炸弹”)

[4.2 浅拷贝风险:自定义类型必须深拷贝](#4.2 浅拷贝风险:自定义类型必须深拷贝)

结尾:


前言:

C++ 标准库中的 vector 堪称 "最常用容器",它兼具数组的随机访问效率与动态扩容的灵活性,是开发和刷题的 "利器"。但很多开发者只停留在 "会用" 层面,对其底层实现原理一知半解。本文将从内存管理核心机制讲起,手把手带你实现一个功能完整的简化版 vector,涵盖构造 / 析构、扩容策略、迭代器设计等核心模块,让你彻底吃透这个 "动态数组" 的工作逻辑。


一. vector 底层核心:三指针控制内存

vector 的本质是动态管理连续内存的容器,其核心通过三个指针(迭代器)控制内存块:

  • _start :指向内存块的起始位置(第一个元素的地址);
  • _finish:指向有效元素的末尾(最后一个元素的下一位);
  • _end_of_storage:指向内存块的末尾(容量的边界)。
cpp 复制代码
namespace Lotso
{
	template<class T>
	class vector
	{
public:
	    //typedef T* iterator;
	    using iterator = T*;
	    using const_iterator = const T*;
private:
		iterator _start;//数据起始位置
		iterator _finish;//有效数据
		iterator _end_of_storage;//空间
	};
}

通过这三个指针,可直接计算:

  • 有效元素个数(size):_finish - _start
  • 容量(capacity):_end_of_storage - _start
cpp 复制代码
public:
size_t capacity() const
{
	return _end_of_storage - _start;
}

size_t size() const
{
	return _finish - _start;
}

二. 迭代器设计:连续内存的 "天然优势"

  • vector的迭代器是对原生指针的封装,支持随机访问等操作,是很好用的

迭代器类型定义:

cpp 复制代码
public:
	//typedef T* iterator;
	using iterator = T*;
	using const_iterator = const T*;

	iterator begin()
	{
		return _start;
	}

	iterator end()
	{
		return _finish;
	}

	const_iterator begin() const
	{
		return _start;
	}

	const_iterator end() const
	{
		return _finish;
	}

--我们这里迭代器的使用可以测试一下,实现的打印函数我就直接放上去了,之前讲过

  • test.c:
cpp 复制代码
namespace Lotso
{
	void Print(const vector<int>& v)
	{
		for (auto e : v)
		{
			cout << e << " ";
		}
		cout << endl;

		for (size_t i = 0; i < v.size(); i++)
		{
			//v[0]++;
			cout << v[i] << " ";
		}
		cout << endl;
	}

	void test_vector1()
	{
		Lotso::vector<int> v;
		v.push_back(1);
		v.push_back(2);
		v.push_back(3);
		v.push_back(4);
		v.push_back(5);
		v.push_back(5);
		v.push_back(5);
		v.push_back(5);
		v.push_back(5);
		v.push_back(5);

		v[0]++;

		Print(v);
		for (auto e : v)
		{
			cout << e << " ";
		}
		cout << endl;
	}
}

int main()
{
	Lotso::test_vector1();

	return 0;
}

三. 核心接口实现:从构造到析构的内存管理

3.1 构造与析构:vector的基础框架

--我们这里主要介绍一下无参构造,其它的就不多讲了

cpp 复制代码
public:
vector()
	:_start(nullptr)
	,_finish(nullptr)
	,_end_of_storage(nullptr)
{ }

~vector()
{
	if (_start)
	{
		delete[] _start;
		_start = _finish = _end_of_storage = nullptr;
	}
}

3.2 容量管理:reserve 与 resize 的区别

3.2.1 reserve:仅扩容,不初始化元素

  • reserve(n) 保证容量至少为 n,仅当 n>capacity 时才分配新内存,不改变 size。
cpp 复制代码
public:
void reserve(size_t n)
{
	if (n > capacity())
	{
		//先记录一下,不然后面start会变
		size_t sz = size();
		T* tmp = new T[n];
		if (_start)
		{
			memcpy(tmp, _start, sizeof(T) * sz);
			delete[] _start;
		}
		_start = tmp;
		_finish = _start + sz;
		_end_of_storage = _start + n;
	}
}

核心: reserve只管理内存,不创建或销毁元素,适合提前扩容以优化性能。

3.2.2 resize 改变size:可能初始化或销毁元素

  • resize(n,val) 会将 size 调整为 n ,多余元素销毁,不足则用 val 填充。
cpp 复制代码
void resize(size_t n, const T& val = T()) {
    if (n > size()) {
        // 1. 若容量不足,先扩容
        if (n > capacity()) {
            reserve(n);
        }
        // 2. 初始化新增元素
        while (_finish < _start + n) {
            new (_finish) T(val); // 定位 new 构造元素
            ++_finish;
        }
    } else {
        // 3. 销毁多余元素
        while (_finish > _start + n) {
            --_finish;
            _finish->~T();
        }
    }
}

3.3 元素操作:增删查改的实现细节

3.3.1 尾插(push_back)与尾删(pop_back):

尾插和尾删是 vector 最高效的操作(O (1)),只需检查容量并构造元素,销毁元素:

cpp 复制代码
void push_back(const T& x)
{
	if (_finish == _end_of_storage)
	{
		reserve(capacity() == 0 ? 4 : capacity() * 2);
	}

	*_finish = x;
	++_finish;
}

void pop_back()
{
	assert(!empty());
	--_finish;
}

3.3.2 插入(insert):中间插入的性能代价

在指定位置插入元素需挪动后续元素,时间复杂度 O (n):

cpp 复制代码
public:
iterator insert(iterator pos, const T& x)
{
	assert(pos >= _start);
	assert(pos <= _finish);

	// 扩容可能导致 pos 失效,需记录偏移量
	if (_finish == _end_of_storage)
	{
		//提前记录一下
		size_t len = pos - _start;
		reserve(capacity() == 0 ? 4 : capacity() * 2);
		pos = _start + len;
	}

	iterator end = _finish - 1;
	while (end >= pos)
	{
		*(end + 1) = *end;
		--end;
	}
	*pos = x;
	++_finish;

	return pos;
}

iterator erase(iterator pos)
{
	assert(pos >= _start);
	assert(pos < _finish);

	iterator it = pos + 1;
	while (it != _finish)
	{
		*(it - 1) = *it;
		++it;
	}

	--_finish;
	return pos;
}

为什么从后往前挪?

  • 若从前往后挪,会覆盖未移动的元素

3.3.3 访问元素:operator []

提供数组式访问,不做越界检查(高效)

cpp 复制代码
T& operator[](size_t i)
{
	assert(i < size());
	return _start[i];
}

const T& operator[](size_t i) const
{
	assert(i < size());
	return _start[i];
}

四. 避坑指南:vector 使用的 3 个核心陷阱

4.1 迭代器失效:扩容与删除的 "隐形炸弹"

  • 扩容导致失效: reserve,push_back,insert 等可能触发扩容,旧内存被释放,迭代器变为野指针。解决:扩容后重新获取迭代器(如 insert 中通过偏移量修正 pos)。

  • 删除导致失效: erase 或pop_back 后,指向被删元素的迭代器失效,后续元素迭代器可能偏移。解决erase 返回下一个有效迭代器(见下方示例):

cpp 复制代码
// 正确删除偶数元素
auto it = v.begin();
while (it != v.end()) {
    if (*it % 2 == 0) {
        it = v.erase(it); // 用返回值更新迭代器
    } else {
        ++it;
    }
}

--下面这些也可以参考一下

cpp 复制代码
	void test_vector2()
	{
		Lotso::vector<int> v;
		v.push_back(1);
		v.push_back(2);
		v.push_back(3);
		v.push_back(4);
		//v.push_back(5);
		Print(v);

		v.insert(v.begin(), 0);
		Print(v);

		auto it = v.begin() + 3;
		// insert以后,it是否失效?
		// it失效了,也就意味着,insert以后,it失效了,it就不能使用了
		v.insert(it, 30);
		Print(v);
	}

	void test_vector3()
	{
		Lotso::vector<int> v;
		v.push_back(1);
		v.push_back(2);
		v.push_back(3);
		v.push_back(4);
		v.push_back(5);
		Print(v);

		v.erase(v.begin());
		Print(v);

		auto it = v.begin() + 2;
		// it是否失效呢?失效,不能访问,访问结果未定义
		v.erase(it);
		Print(v);
	}

	void test_vector4()
	{
		Lotso::vector<int> v;
		v.push_back(1);
		v.push_back(2);
		v.push_back(2);
		v.push_back(3);
		v.push_back(4);
		v.push_back(5);
		v.push_back(6);
		// Print(v);

		for (auto e : v)
		{
			cout << e << " ";
		}
		cout << endl;

		// 删除所有的偶数
		/*auto it = v.begin();
		while (it != v.end())
		{
			if (*it % 2 == 0)
			{
				v.erase(it);
			}

			++it;
		}*/

		auto it = v.begin();
		while (it != v.end())
		{
			if (*it % 2 == 0)
			{
				it = v.erase(it);
			}
			else
			{
				++it;
			}
		}

		for (auto e : v)
		{
			cout << e << " ";
		}
		cout << endl;
	}
}

4.2 浅拷贝风险:自定义类型必须深拷贝

若 vector 存储的是含指针的自定义类型(如 string),直接用 memcpy 拷贝会导致多个对象共享内存,析构时双重释放。本文实现的 reserve 和拷贝构造均用移动 / 拷贝构造函数迁移元素,避免了这一问题。


结尾:

往期回顾:

《吃透 C++ vector:从基础使用到核心接口实战指南》

结语:通过手写 vector,我们不仅理解了其底层的三指针模型、扩容策略和迭代器设计,更能在实际开发中规避迭代器失效、浅拷贝等陷阱。掌握这些原理,无论是使用标准库 vector 还是设计自定义容器,都会更加得心应手。

✨把这些内容吃透超牛的!放松下吧✨
ʕ˘ᴥ˘ʔ
づきらど

相关推荐
小秋学嵌入式-不读研版2 小时前
C56-字符串拷贝函数strcpy与strnpy
c语言·开发语言·笔记
hui函数2 小时前
python全栈(基础篇)——day04:后端内容(字符编码+list与tuple+条件判断+实战演示+每日一题)
开发语言·数据结构·python·全栈
Never_Satisfied2 小时前
在JavaScript / HTML中,转移字符导致js生成的html出错
开发语言·javascript·html
羚羊角uou2 小时前
【Linux】POSIX信号量、环形队列、基于环形队列实现生产者消费者模型
java·开发语言
数据知道3 小时前
Go语言:用Go操作SQLite详解
开发语言·后端·golang·sqlite·go语言
晨非辰5 小时前
《剑指Offer:单链表操作入门——从“头删”开始破解面试》
c语言·开发语言·数据结构·c++·笔记·算法·面试
sheji34168 小时前
【开题答辩全过程】以 python杭州亚运会数据分析与可视化开题为例,包含答辩的问题和答案
开发语言·python·数据分析
渡我白衣9 小时前
list 与 forward_list:一场 STL 中的“链表哲学”之争
数据结构·c++·list
weixin_4462608511 小时前
快速构建网站的利器——Symfony PHP框架
开发语言·php·symfony