【C++篇】深入剖析C++ Vector底层源码及实现机制

文章目录

须知

💬 欢迎讨论:如果你在学习过程中有任何问题或想法,欢迎在评论区留言,我们一起交流学习。你的支持是我继续创作的动力!

👍 点赞、收藏与分享:觉得这篇文章对你有帮助吗?别忘了点赞、收藏并分享给更多的小伙伴哦!你们的支持是我不断进步的动力!

🚀 分享给更多人:如果你觉得这篇文章对你有帮助,欢迎分享给更多对C++感兴趣的朋友,让我们一起进步!

全面剖析vector底层及实现机制

接上篇:【C++篇】探索STL之美:vector容器讲解_c++vector容器-CSDN博客

前言

Vector是C++标准模板库(STL)中提供的一种动态数组容器,能够高效管理元素的存储与操作。它具有自动扩容的特性,即在存储空间不足时会自动分配更大的内存,保证连续存储的同时提高了灵活性。Vector支持随机访问,拥有接近数组的访问速度,同时也提供了丰富的成员函数用于插入、删除、排序等操作,兼顾了灵活性与性能。

总之,Vector是C++开发中最常用的容器之一,因其高效、灵活、易用的特性,在处理动态数据时显得尤为重要。

1. 基本结构与初始化(具有不同种方式)

1.1 基本结构

Vector底层实现类似于动态数组,其内部通过一块连续的内存空间存储元素。主要成员包括:

  • 指针数据(_start, _end, _end_of_storage):分别指向当前元素的起始地址、末尾地址和存储空间的尾地址,用于跟踪已存储的元素和剩余空间。
  • 动态扩容:当插入新元素超出当前容量时,Vector会申请更大的连续内存空间,并将现有元素复制到新空间中。扩容一般是以一定倍数增长(通常为2倍)。

1.2 带大小和默认值初始化构造函数

  • 初始化一个给定大小的vector,并使用默认值填充。
  • 测试构造后大小、容量是否符合要求。
cpp 复制代码
namespace W {
    template<class T>
    class vector {
    public:
        typedef T* iterator;

        vector(size_t n, const T& value = T()) {
            _start = new T[n];
            _finish = _start + n;
            _endOfStorage = _finish;
            for (size_t i = 0; i < n; ++i) {
                _start[i] = value;  // 填充默认值
            }
        }

        size_t size() const { return _finish - _start; }
        size_t capacity() const { return _endOfStorage - _start; }
        bool empty() const { return _start == _finish; }

        T& operator[](size_t pos) { return _start[pos]; }

        ~vector()
		{
			if (_start)
			{
				delete[] _start;
				_start = _finish = _endOfStorage = nullptr;
			}
		}

    private:
        iterator _start;
        iterator _finish;
        iterator _endOfStorage;
    };
}

测试用例:

cpp 复制代码
void TestInitVector() {
    W::vector<int> v(5, 10);
    assert(v.size() == 5);  // 验证大小
    assert(v.capacity() == 5);  // 验证容量
    assert(!v.empty());  // 验证非空
    for (size_t i = 0; i < 5; ++i) {
        assert(v[i] == 10);  // 验证默认值
    }
    std::cout << "TestInitVector passed" << std::endl;
}

1.3 拷贝构造函数

  • 实现vector的拷贝构造函数。
  • 测试拷贝后的vector是否完全复制原来的内容和容量。

实现代码:

cpp 复制代码
namespace W {
    template<class T>
    class vector {
    public:
        typedef T* iterator;

        vector(const vector<T>& v) {
            size_t n = v.size();
            _start = new T[n];
            _finish = _start + n;
            _endOfStorage = _finish;
            for (size_t i = 0; i < n; ++i) {
                _start[i] = v._start[i];  // 复制数据
            }
        }

        size_t size() const { return _finish - _start; }
        size_t capacity() const { return _endOfStorage - _start; }
        bool empty() const { return _start == _finish; }

        T& operator[](size_t pos) { return _start[pos]; }

        ~vector()
		{
			if (_start)
			{
				delete[] _start;
				_start = _finish = _endOfStorage = nullptr;
			}
		}

    private:
        iterator _start;
        iterator _finish;
        iterator _endOfStorage;
    };
}

测试用例:

cpp 复制代码
void TestCopyVector() {
    W::vector<int> v1(10, 20);
    W::vector<int> v2(v1);
    assert(v2.size() == 10);  // 验证大小
    assert(v2.capacity() == 10);  // 验证容量
    for (size_t i = 0; i < 10; ++i) {
        assert(v2[i] == 20);  // 验证数据拷贝
    }
    std::cout << "TestCopyVector passed" << std::endl;
}

1.4 赋值操作符重载

  • 实现赋值操作符重载。
  • 测试两个vector赋值后,是否正确拷贝了内容和容量。
cpp 复制代码
namespace W {
    template<class T>
    class vector {
    public:
        typedef T* iterator;

        vector<T>& operator=(const vector<T>& v) {
            if (this != &v) {
                delete[] _start;  // 释放旧的空间
                size_t n = v.size();
                _start = new T[n];
                _finish = _start + n;
                _endOfStorage = _finish;
                for (size_t i = 0; i < n; ++i) {
                    _start[i] = v._start[i];  // 复制数据
                }
            }
            return *this;
        }

        size_t size() const { return _finish - _start; }
        size_t capacity() const { return _endOfStorage - _start; }
        bool empty() const { return _start == _finish; }

        T& operator[](size_t pos) { return _start[pos]; }

       ~vector()
		{
			if (_start)
			{
				delete[] _start;
				_start = _finish = _endOfStorage = nullptr;
			}
		}

    private:
        iterator _start;
        iterator _finish;
        iterator _endOfStorage;
    };
}

测试用例:

cpp 复制代码
void TestAssignVector() {
    W::vector<int> v1(15, 30);
    W::vector<int> v2 = v1;  // 赋值操作
    assert(v2.size() == 15);  // 验证大小
    assert(v2.capacity() == 15);  // 验证容量
    for (size_t i = 0; i < 15; ++i) {
        assert(v2[i] == 30);  // 验证数据拷贝
    }
    std::cout << "TestAssignVector passed" << std::endl;
}

2. 容器管理内存的实现与测试

2.1 reserve函数:动态扩容

实现代码:

cpp 复制代码
namespace W {
    template<class T>
    class vector {
    public:
        void reserve(size_t n) {
            if (n > capacity()) {
                size_t oldSize = size();
                T* tmp = new T[n];
                for (size_t i = 0; i < oldSize; ++i) {
                    tmp[i] = _start[i];
                }
                delete[] _start;
                _start = tmp;
                _finish = _start + oldSize;
                _endOfStorage = _start + n;
            }
        }
    };
}

测试用例:

cpp 复制代码
void TestReserveVector() {
    W::vector<int> v(5, 10);
    v.reserve(10);  // 预留容量
    assert(v.capacity() == 10);  // 验证容量扩展
    for (size_t i = 0; i < 5; ++i) {
        assert(v[i] == 10);  // 验证数据保持不变
    }
    std::cout << "TestReserveVector passed" << std::endl;
}

输出

TestReserveVector passed

2.2 resize函数:改变大小

用途

  1. 增加容器大小

当新的大小大于当前大小时,resize会在容器末尾添加新元素,新添加的元素会被默认值初始化(对于内置类型,默认值通常为0或空值)。

std::vector<int> vec = {1, 2, 3};

vec.resize(5); // vec变为 {1, 2, 3, 0, 0}

  1. 减少容器大小

当新的大小小于当前大小时,resize会移除多余的元素,只保留从起始位置算起的新大小的元素。

std::vector<int> vec = {1, 2, 3, 4, 5};

vec.resize(3); // vec变为 {1, 2, 3}

3.指定新元素的初始值

在扩容时,可以通过第二个参数指定新添加元素的初始值,而不是使用默认值。

std::vector<int> vec = {1, 2, 3};

vec.resize(5, 10); // vec变为 {1, 2, 3, 10, 10}

特点

  • 不会影响容量(capacity)resize只调整size(实际元素数量),不会改变容器的容量(底层分配的内存大小)。扩容时容量可能会增长,但缩小时容量不会减少。
  • 元素保留特性:缩小时多余的元素会被移除,但未移除的元素保持不变;扩容时已存在的元素同样不受影响。
  • 性能resize可能引起新元素的构造或旧元素的析构,因此需要注意其性能开销。
cpp 复制代码
namespace W {
    template<class T>
    class vector {
    public:
        void resize(size_t n, const T& value = T()) {
            if (n < size()) {
                _finish = _start + n;  // 缩小大小
            } else {
                reserve(n);
                for (iterator it = _finish; it != _start + n; ++it)
			    {
                    *it = value;  // 填充新值
                }
                _finish = _start + n;
            }
        }
    };
}

测试用例:

cpp 复制代码
void TestResizeVector() {
    W::vector<int> v(5, 10);
    v.resize(8, 20);  // 扩展大小并填充新值
    assert(v.size() == 8);  // 验证扩展后大小
    for (size_t i = 0; i < 5; ++i) {
        assert(v[i] == 10);  // 验证原值不变
    }
    for (size_t i = 5; i < 8; ++i) {
        assert(v[i] == 20);  // 验证新值
    }
    std::cout << "TestResizeVector passed" << std::endl;
}

3. 增加与删除元素

3.1 push_back 函数:向vector末尾插入元素

3.1.1 实现思路

  1. 检查容量是否足够,若不足则扩容(通常容量加倍)。
  2. 将新元素插入到当前末尾。
  3. 更新_finish指针,指向新的末尾。

示例代码:

cpp 复制代码
namespace W {
    template<class T>
    class vector {
    public:
        void push_back(const T& x) {
            // 如果空间不足,扩展容量为当前容量的两倍
            if (_finish == _endOfStorage) {
                size_t newCapacity = capacity() == 0 ? 1 : capacity() * 2;
                reserve(newCapacity);
            }

            // 在末尾插入新元素
            *_finish = x;
            ++_finish;
        }

    private:
        T* _start;
        T* _finish;
        T* _endOfStorage;
    };
}

测试用例:

cpp 复制代码
void TestPushBackVector() {
    W::vector<int> v;
    v.push_back(1);
    v.push_back(2);
    v.push_back(3);

    assert(v.size() == 3);  // 验证插入后的大小
    assert(v.capacity() >= 3);  // 验证容量是否自动扩容
    assert(v[0] == 1 && v[1] == 2 && v[2] == 3);  // 验证插入的元素是否正确

    std::cout << "TestPushBackVector passed" << std::endl;
}

输出:

TestPushBackVector passed

3.2 **pop_back**函数:删除末尾元素

将_finish指针向后移动移动一位,即该指针指向的就是最后一个元素

示例代码:

cpp 复制代码
namespace W {
    template<class T>
    class vector {
    public:
        void pop_back() {
            assert(_finish != _start);  // 确保vector非空
            --_finish;  // 逻辑删除最后一个元素
        }

    private:
        T* _start;
        T* _finish;
        T* _endOfStorage;
    };
}

3.3 insert:在指定位置插入数据

实现思路

1 检查容量,不足扩容

2 将指定的数据从后往前挪动,空出该位置

3 将该位置插入指定数据

4 更新finish指针

实现代码:

cpp 复制代码
namespace W {
    template<class T>
    class vector {
    public:
        T* insert(T* pos, const T& value) {
            assert(pos >= _start && pos <= _finish);  // 确保pos是有效指针

            // 检查空间是否足够
            if (_finish == _endOfStorage) {
                size_t newCapacity = capacity() == 0 ? 1 : capacity() * 2;
                size_t offset = pos - _start;  // 记录插入位置
                reserve(newCapacity);  // 扩容
                pos = _start + offset;  // 更新插入位置
            }

            // 将插入位置之后的元素整体向后移动
            for (T* it = _finish; it > pos; --it) {
                *it = *(it - 1);
            }

            // 插入新元素
            *pos = value;
            ++_finish;
            return pos;
        }

    private:
        T* _start;
        T* _finish;
        T* _endOfStorage;
    };
}

4 erase 函数:删除指定位置的元素

实现思路

1 循环将指定位置数据的后面每一位向前挪动

2 更新finish指针

实现代码:

cpp 复制代码
namespace W {
    template<class T>
    class vector {
    public:
        T* erase(T* pos) {
            assert(pos >= _start && pos < _finish);  // 确保pos是有效指针

            // 将pos之后的元素向前移动
            for (T* it = pos; it < _finish - 1; ++it) {
                *it = *(it + 1);
            }

            --_finish;  // 更新_finish指针
            return pos;
        }

    private:
        T* _start;
        T* _finish;
        T* _endOfStorage;
    };
}

4. 查找元素

4.1 front函数:返回vector的第一个元素

实现代码:

cpp 复制代码
namespace W {
    template<class T>
    class vector {
    public:
        T& front() {
            assert(!empty());  // 确保vector非空
            return *_start;  // 返回第一个元素
        }

    private:
        T* _start;
        T* _finish;
        T* _endOfStorage;
    };
}

测试用例:

cpp 复制代码
void TestFrontVector() {
    W::vector<int> v;
    v.push_back(10);
    assert(v.front() == 10);  // 验证front

    v.push_back(20);
    assert(v.front() == 10);  // 验证front不变

    std::cout << "TestFrontVector passed" << std::endl;


}

输出:

TestFrontVector passed

4.2 **back**函数:获取最后一个元素

实现代码:

namespace W {

template<class T>

class vector {

public:

T& back() {

assert(!empty()); // 确保vector非空

return *(_finish - 1); // 返回最后一个元素

}

private:

T* _start;

T* _finish;

T* _endOfStorage;

};

}

测试用例:

cpp 复制代码
void TestBackVector() {
    W::vector<int> v;
    v.push_back(10);
    assert(v.back() == 10);  // 验证back

    v.push_back(20);
    assert(v.back() == 20);  // 验证back变化

    std::cout << "TestBackVector passed" << std::endl;
}

5. 迭代器的实现

  • begin 函数返回指向 vector 起始位置的迭代器(即指向第一个元素)。
  • end 函数返回指向 vector 末尾的迭代器(即指向最后一个元素的下一个位置)。
  • 两者结合可以用于遍历 vector 中的元素。

实现代码:

cpp 复制代码
namespace W {
    template<class T>
    class vector {
    public:
        typedef T* iterator;  

        iterator begin() {
            return _start;
        }

        iterator end() {
            return _finish;
        }

    private:
        T* _start;
        T* _finish;
        T* _endOfStorage;
    };
}

测试用例:

cpp 复制代码
void TestIteratorVector() {
    W::vector<int> v;
    v.push_back(10);
    v.push_back(20);
    v.push_back(30);

    // 使用迭代器遍历 vector
    for (W::vector<int>::iterator it = v.begin(); it != v.end(); ++it) {
        std::cout << *it << " ";
    }
    std::cout << std::endl;
}

输出:

10 20 30

6. swap函数:交换两个vector

用途:

  • swap 函数用于交换两个 vector 的内容,包括它们的起始指针、结束指针和容量指针。
  • swap 函数是常用的优化操作,特别是在实现移动语义时能大大提高效率。

实现代码:

cpp 复制代码
namespace W {
    template<class T>
    class vector {
    public:
        void swap(vector<T>& v) {
            std::swap(_start, v._start);
            std::swap(_finish, v._finish);
            std::swap(_endOfStorage, v._endOfStorage);
        }

    private:
        T* _start;
        T* _finish;
        T* _endOfStorage;
    };
}

测试用例:

cpp 复制代码
void TestSwapVector() {
    W::vector<int> v1;
    W::vector<int> v2;

    v1.push_back(1);
    v1.push_back(2);
    v2.push_back(3);
    v2.push_back(4);
    
    v1.swap(v2);

    // 验证 v1 和 v2 交换后内容是否正确
    for (auto e : v1) {
        std::cout << e << " ";
    }
    std::cout << std::endl;

    for (auto e : v2) {
        std::cout << e << " ";
    }
    std::cout << std::endl;
}

输出:

3 4

1 2

7. 赋值运算符重载:深拷贝vector

现代技术:拷贝并交换(Copy and Swap) 技术,这种技术可以减少重复代码并提高异常安全性。

实现代码:

cpp 复制代码
namespace W {
    template<class T>
    class vector {
    public:
        //这里可以服用reserve和push_back函数了
        vector(const vector<T>& v)
            : _start(nullptr), _finish(nullptr), _endOfStorage(nullptr)
        {
            reserve(v.size());  // 分配所需空间
            for (const T& elem : v) {
                push_back(elem);  // 拷贝每个元素
            }
        }

        // 赋值操作符,使用拷贝并交换技术
        vector<T>& operator=(vector<T> v) {
            swap(v);  // 调用 swap 函数交换内容
            return *this;
        }

        // swap 函数
        void swap(vector<T>& v) {
            std::swap(_start, v._start);
            std::swap(_finish, v._finish);
            std::swap(_endOfStorage, v._endOfStorage);
        }

        // 其他成员函数同之前实现...

    private:
        T* _start;
        T* _finish;
        T* _endOfStorage;
    };
}

测试用例:

cpp 复制代码
void TestCopyAndAssignVector() {
    // 测试拷贝构造函数
    W::vector<int> v1;
    v1.push_back(1);
    v1.push_back(2);
    v1.push_back(3);

    W::vector<int> v2(v1);  // 使用拷贝构造函数
    for (size_t i = 0; i < v2.size(); ++i) {
        assert(v2[i] == v1[i]);  // 验证每个元素是否相同
    }

    // 测试赋值操作符
    W::vector<int> v3;
    v3 = v1;  // 使用赋值操作符
    for (size_t i = 0; i < v3.size(); ++i) {
        assert(v3[i] == v1[i]);  // 验证每个元素是否相同
    }

    std::cout << "TestCopyAndAssignVector passed" << std::endl;
}

现代写法解释 :

传值参数:通过传递 vector<T> 的值作为参数,创建一个临时对象 v。调用拷贝构造函数时自动执行拷贝,然后在赋值操作中与现有对象交换内容。传值是安全的,避免了手动内存管理问题。
swap:通过交换数据成员 _start、_finish 和 _endOfStorage,避免手动内存释放,简化代码逻辑。交换后的临时对象 v 离开作用域时自动销毁,保证资源释放。

8. vector容器特性总结

  1. 动态大小
  • 可以根据需要动态调整大小,而无需预定义固定容量,避免内存浪费。

  • 自动处理底层内存分配和扩展。

  1. 随机访问性能优秀
  • 支持常数时间的随机访问,类似于数组,便于快速读取和修改元素。
  1. 便捷的插入和删除操作
  • 支持尾部插入/删除操作,时间复杂度为O(1)。

  • 通过eraseinsert等方法,支持中间位置的元素操作,虽然复杂度为O(n),但提供了便利。

  1. 内存管理
  • 自动管理底层内存,不需要开发者手动分配或释放内存,减少内存泄漏的风险。
  1. 支持迭代器
  • 提供灵活的迭代器支持,可以轻松遍历、修改元素,并与其他STL算法结合使用。
  1. 多功能性
  • 可以存储不同类型的对象,包括用户定义类型。

  • 提供了丰富的操作函数,例如排序、搜索等。

  1. 与C++标准库兼容性高
  • 与标准库中的其他容器(如mapset)和算法无缝集成,形成强大的工具组合。
  1. 性能优化
  • 在扩容时,底层内存分配采用指数增长策略(通常为两倍),减少了频繁的重新分配操作

这些特点使vector在需要灵活、动态数组的场景中非常实用,例如处理未知大小的输入数据或需要高效随机访问的场景。

相信通过这篇文章你对C++STL->vector的使用高级部分的有了初步的了解。如果此篇文章对你学习C++有帮助,期待你的三连,你的支持就是我创作的动力!!!

下一篇文章再会.

相关推荐
Code侠客行5 分钟前
Scala语言的编程范式
开发语言·后端·golang
lozhyf24 分钟前
Go语言-学习一
开发语言·学习·golang
dujunqiu34 分钟前
bash: ./xxx: No such file or directory
开发语言·bash
爱偷懒的程序源37 分钟前
解决go.mod文件中replace不生效的问题
开发语言·golang
日月星宿~37 分钟前
【JVM】调优
java·开发语言·jvm
捕鲸叉1 小时前
Linux/C/C++下怎样进行软件性能分析(CPU/GPU/Memory)
c++·软件调试·软件验证
2401_843785231 小时前
C语言 指针_野指针 指针运算
c语言·开发语言
Jacob程序员1 小时前
leaflet绘制室内平面图
android·开发语言·javascript
AitTech1 小时前
C#编程:List.ForEach与foreach循环的深度对比
开发语言·c#·list
阿俊仔(摸鱼版)2 小时前
Python 常用运维模块之OS模块篇
运维·开发语言·python·云服务器