【C++】vector模拟实现过程中值得注意的点

👀樊梓慕：个人主页****

🎥个人专栏：《C语言》** 《数据结构》 《蓝桥杯试题》 《LeetCode刷题笔记》 《实训项目》 《C++》 《Linux》《算法》**

🌝每一个不曾起舞的日子，都是对生命的辜负

前言

本篇文章旨在记录博主在模拟实现vector容器中遇到的一些问题，都是一些需要注意的细节问题，希望与大家共勉。

欢迎大家📂收藏📂以便未来做题时可以快速找到思路，巧妙的方法可以事半功倍。

=========================================================================

**GITEE相关代码：**🌟fanfei_c的仓库🌟

=========================================================================

1.迭代器失效问题

迭代器失效可以大致总结为：

之前我们说迭代器的底层可以理解为指针，那么迭代器失效其实就是『底层指针的指向发生了改变，而迭代器没有』，这就会导致使用迭代器时报错或者出现错误数据。

并且迭代器失效一般具有下面的特点：

一般发生在需要扩容时，比如resize、reserve、insert、assign、push_back；
解决方案一般为将迭代器重新赋值，所以我们查看STL-vector的底层源码会发现insert等函数实现时会有返回值，这个返回值就是让我们在使用时，将迭代器重新赋值用的（博主也模拟实现了下供大家参考）；

问题剖析（以reserve和insert举例说明）

cpp 复制代码

void reserve(size_t n)
{
    if (n > capacity())
    {
        size_t old = size();
        T* tmp = new T[n];
        if (_start)
        {
            //memcpy(tmp, _start, old * sizeof(T));
            //delete[] _start;

            for (size_t i = 0; i < old; i++)//解决方案
            {
                tmp[i] = _start[i];
            }
            delete[] _start;
        }
        _start = tmp;
        _finish = _start + old;
        _endOfStorage = _start + n;
    }
}

可以看到我注释掉的代码，在最开始可能你会利用memcpy来简化代码，一步到位非常方便，但这就引发了一些意想不到的后果：『迭代器失效』。

假设vector中存储的为string类：

用memcpy会导致：如果调用了reserve函数，执行到memcpy，memcpy实际为一种『浅拷贝行为』

『 delete[]会调用析构然后释放空间』

执行过memcpy后，如果执行delete[] start就会调用析构函数，然后string的析构导致 str成为野指针，进而导致vector的迭代器_start失效。

同样这个问题到insert的模拟实现处也存在，因为利用了memmove，比如：

cpp 复制代码

iterator insert(iterator pos, const T& x)
{
    assert(pos >= _start && pos <= _finish);

    if (_finish == _endOfStorage)
    {
        size_t len = pos - _start;//保存长度
        size_t newCapacity = capacity() == 0 ? 4 : 2 * capacity();
        reserve(newCapacity);
        pos = _start + len;//扩容后更新pos的位置，否则pos依旧指向被释放的旧空间
    }
    //memmove(pos + 1, pos, (_finish - pos) * sizeof(T));

    iterator end = _finish - 1;//解决方案
    while (end > pos)
    {
        *(end + 1) = *end;
        --end;
    }
    *pos = x;
    ++_finish;
    return pos;
}

解决memcpy、memmove浅拷贝行为导致迭代器失效的问题：

如代码所示，利用重载的赋值操作符就可以避免这一问题，因为赋值是一种『深拷贝行为』。

以上是模拟实现过程中解决的迭代器时效问题。

那么在应用中，我们可以利用erase、insert的返回值将迭代器重新赋值，防止迭代器失效。

cpp 复制代码

it = s.begin();
while (it != s.end())
{
    it = s.erase(it);
    // 按照下面方式写，运行时程序会崩溃，因为erase(it)之后
    // it位置的迭代器就失效了
    // s.erase(it);
    ++it;
}

另一种解决方案是可以利用『引用计数』的方式，这里我就不多赘述了，不了解的小伙伴可以自行百度。

2.构造函数重载导致歧义（迭代器区间构造）

迭代器区间构造是一种十分精妙的构造方式，它可以将任意类型（只要支持迭代器）初始化给vector，参数只需要传递两个迭代器即可，比如：

cpp 复制代码

template <class InputIterator>//泛型迭代器
vector(InputIterator first, InputIterator last)
{
    while (first != last)
    {
        push_back(*first);
        ++first;
    }
}
void test_vector()
{
    vector<int> v1;
    v1.push_back(1);
    v1.push_back(2);
    v1.push_back(3);
    v1.push_back(4);
    v1.push_back(5);
    //同类型构造
    vector<int> v2(v1.begin(), v1.end());
    for (auto e : v2)
    {
        cout << e << " ";
    }
    cout << endl;

    list<int> lt;
    lt.push_back(10);
    lt.push_back(20);
    lt.push_back(30);
    lt.push_back(40);
    //不同类型构造
    vector<int> v3(lt.begin(), lt.end());
    for (auto e : v3)
    {
        cout << e << " ";
    }
    cout << endl;
    //甚至是数组
    int a[] = { 100, 200, 300 };//底层物理空间连续，天然的迭代器-指针
    vector<int> v4(a, a+3);     //指向连续物理地址空间的指针就是天然的迭代器，符合迭代器要求
    for (auto e : v4)
    {
        cout << e << " ";
    }
    cout << endl;
}

但vector中有某类构造函数是这样的：

cpp 复制代码

vector(size_t n, const T& val = T())//将容器初始化为n个val
{
    resize(n, val);
}

如果你写了这样的代码：

cpp 复制代码

void test_vector()
{
    vector<string> v1(5, "1111");//ok
    for (auto e : v1)
    {
        cout << e << " ";
    }
    cout << endl;

    vector<int> v2(5, 1);//err
    for (auto e : v2)
    {
        cout << e << " ";
    }
    cout << endl;
}

这就会引发报错：

问题剖析

原因就是你的程序可能没有按你的本意走，你的本意是想『将v2初始化为5个1』。

可是编译器会将5和1识别为迭代器，因为5和1的类型相同，不需要发生类型转换。

为什么不会识别为(size_t n,const T& val = T())呢，很明显编译器也不想发生类型转换，size_t为unsigned char，另一个参数为const T&（这里为int），需要发生类型转转换才可以匹配。

所以为了解决这一问题，我们需要再额外重载一个：

cpp 复制代码

vector(size_t n, const T& val = T())//将容器初始化为n个val
{
    resize(n, val);
}
vector(int n, const T& val = T())//为了解决两个参数都为int，会自动匹配迭代器区间初始化函数导致报错
{
    resize(n, val);
}

虽然看起来好像不太高级，但是实际上STL也是这么做的。

3.vector模拟实现源码

cpp 复制代码

template<class T>
class vector
{
public:
    //Vector的迭代器是一个原生指针
    typedef T* iterator;
    typedef const T* const_iterator;
    iterator begin()
    {
        return _start;
    }
    iterator end()
    {
        return _finish;
    }
    const_iterator begin() const
    {
        return _start;
    }
    const_iterator end() const
    {
        return _finish;
    }

    // construct and destroy
    vector()
    {}

    vector(const vector<T>& v)
    {
        //传统写法
        /*_start = new T(v.capacity());
        memcpy(_start, v._start, v.size() * sizeof(T));
        _finish = _start + v.size();
        _endOfStorage = _start + v.capacity();*/

        //现代写法
        reserve(v.capacity());
        for (const auto& e : v)
        {
            push_back(e);
        }
    }

    //迭代器区间初始化    "泛型"
    //可以穿任意类型的迭代器初始化
    template <class InputIterator>
    vector(InputIterator first, InputIterator last)
    {
        while (first != last)
        {
            push_back(*first);
            ++first;
        }
    }

    vector(size_t n, const T& val = T())//如果传参两个int，会导致不匹配该函数而匹配迭代器区间初始化函数
    {
        resize(n, val);
    }

    vector(int n, const T& val = T())//为了解决两个参数都为int，会自动匹配迭代器区间初始化函数导致报错
    {
        resize(n, val);
    }

    vector<T>& operator= (vector<T> v)
    {
        swap(v);
        return *this;
    }
    ~vector()
    {
        if (_start)
        {
            delete[] _start;
            _start = _finish = _endOfStorage = nullptr;
        }
    }

    // capacity
    size_t size() const
    {
        return _finish - _start;
    }
    size_t capacity() const
    {
        return _endOfStorage - _start;
    }
    void reserve(size_t n)
    {
        if (n > capacity())
        {
            size_t old = size();
            T* tmp = new T[n];
            if (_start)
            {
                //memcpy(tmp, _start, old * sizeof(T));//用memcpy会导致模板为string类时，如果vector需要扩容，此时memcpy实际为一种"浅拷贝行为"，string成员_str会因为delete[] _start成为野指针
                //delete[] _start;//delete[]会调用析构然后释放空间
                //同样这个问题到insert的模拟实现处也存在，因为利用了memmove
                for (size_t i = 0; i < old; i++)//解决方案   另一种解决方案是可以利用"引用计数"
                {
                    tmp[i] = _start[i];
                }
                delete[] _start;
            }
            _start = tmp;
            _finish = _start + old;
            _endOfStorage = _start + n;
        }
    }
    void resize(size_t n, const T& val = T())
    {
        if (n > size())
        {
            if (n > capacity())
            {
                reserve(n);
                while (_finish < _start + n)
                {
                    *_finish = val;
                    ++_finish;
                }
            }
        }
        else
            _finish = _start + n;
    }

    ///access///
    T& operator[](size_t pos)
    {
        return _start + pos;
    }
    const T& operator[](size_t pos)const
    {
        return _start + pos;
    }

    ///modify/
    void push_back(const T& x)
    {
        //1.判断容量
        if (_finish == _endOfStorage)
        {
            reserve(capacity() == 0 ? 4 : 2 * capacity());
        }
        //2.尾插
        *_finish = x;
        ++_finish;
    }
    void pop_back()
    {
        assert(size() > 0);
        --_finish;
    }
    void swap(vector<T>& v)
    {
        std::swap(_start, v._start);
        std::swap(_finish, v._finish);
        std::swap(_endOfStorage, v._endOfStorage);
    }
    iterator insert(iterator pos, const T& x)
    {
        assert(pos >= _start && pos <= _finish);

        if (_finish == _endOfStorage)
        {
            size_t len = pos - _start;//保存长度
            size_t newCapacity = capacity() == 0 ? 4 : 2 * capacity();
            reserve(newCapacity);
            pos = _start + len;//扩容后更新pos的位置，否则pos依旧指向被释放的旧空间
        }
        //memmove(pos + 1, pos, (_finish - pos) * sizeof(T));//memmove是一种浅拷贝行为，可能会造成模板为string类时，野指针的问题

        iterator end = _finish - 1;
        while (end > pos)
        {
            *(end + 1) = *end;
            --end;
        }
        *pos = x;
        ++_finish;
        return pos;
    }

    iterator erase(iterator pos)//未测试
    {
        assert(size() > 0);
        assert(pos >= _start && pos < _finish);
        //memmove(pos , pos+1, (_finish - pos) * sizeof(T));//memmove是一种浅拷贝行为，可能会造成模板为string类时，野指针的问题

        iterator it = pos + 1;
        while (it < _finish)
        {
            *(it - 1) = *it;
            ++it;
        }
        --_finish;
        return pos;
    }
private:
    iterator _start = nullptr; // 指向数据块的开始
    iterator _finish = nullptr; // 指向有效数据的尾
    iterator _endOfStorage = nullptr; // 指向存储容量的尾
};

以上就是本篇文章的全部内容。

模拟实现的意义就是『让我们更好的使用』，像迭代器失效、构造函数重载-迭代器区间构造导致歧义等问题，只有我们模拟实现过，才能更深切得体会到为什么STL库的设计者要这么写，这么写的意义是什么。

=========================================================================

如果你对该系列文章有兴趣的话，欢迎持续关注博主动态，博主会持续输出优质内容

🍎博主很需要大家的支持，你的支持是我创作的不竭动力🍎

🌟**~ 点赞收藏＋关注 ~**🌟

=========================================================================