1.vector的介绍
vector是表示可变大小数组的序列容器,可理解为顺序表。
特点:
1.动态分配 :可以在运行时增加或减少元素的数量。
2.随机访问 :支持通过索引直接访问元素,时间复杂度为 O(1)。一般使用尾插,尾删,不用挪动数据更高效。
3.连续存储 :元素在内存中是连续存储的,这使得它具有良好的缓存性能。
4.自动扩容 :当容器容量不足时,会自动分配更大的内存空间,并将原有元素复制到新的内存空间,以时间换空间。
5.内存管理:std::vector 由 C++ 标准库管理,自动处理内存分配和释放
vector在功能上与string有一定的相似处,能不能代替呢?---不行
1.string结构上与vector存在差别,string会自动添加'\0',更好兼容C语言,后者则没有
2.string专用接口更丰富,专门用来存储char类型数据;vector是类模板,针对所有数据类型vector不需要比较大小,没有意义
2.vector的使用
构造函数
1.默认构造函数:alloc 是可选的分配器对象,用于管理内存分配。默认情况下,使用默认分配器。
2.填充构造函数:创建n个元素,每个元素为val的引用对象
3.范围构造函数:使用迭代器初始化并构造
4.拷贝构造函数:
三种遍历方式

迭代器的使用
cpp
vector<int> v1;
v1.push_back(1);
v1.push_back(2);
v1.push_back(3);
v1.push_back(4);
string str("you know m3");
vector<int>::iterator it = v1.begin();
//使用迭代器进行遍历打印
while (it != v1.end())
{
cout << *it << " ";
it++;
}
cout << endl;
//使用迭代器进行修改
it = v1.begin();
while (it != v1.end())
{
(*it)++;
cout << *it << " ";
it++;
}
cout<<endl;
//使用反向迭代器进行遍历打印
//vector<int>::reverse_iterator it = v1.rbegin();
auto rit = v1.rbegin();
while (rit!=v1.rend())
{
cout << *rit << " ";
rit++;
}
cout << endl;
//使用其他类型的迭代器
//范围构造函数,以迭代器作为参数
vector<char>v2(str.begin(), str.end());
for (auto e : v2)
{
cout << e << " ";
}
cout << endl;
//迭代数组
int a[] = { 1,2,34,5,6 };
vector<int>v3(a, a + 5);//注意左闭右开区间,这里数组指针作为天然迭代器
for (auto v : v3)
{
cout << v << " ";
}
cout << endl;
容器是用来存储数据的,算法是用来处理数据的。学习一个std::sort函数来处理数据。
std::sort 是一个用于对序列进行排序的函数模板,定义在头文件 中,提供两种主要用法:
1.默认排序:使用元素的默认小于比较操作(operator<)进行升序排序。
std::less可以作为明确指定升序排序的比较方式,当然std::sort 已经使用 operator< 进行升序排序,所以通常不需要显式指定 std::less
降序排序需要使用模板类greater<>()
2.自定义排序Compare comp:自定义的比较函数或比较对象,用于定义排序的规则。
空间增长问题

需特别注意:
1.reserve只负责开辟空间,不初始化。如果确定知道需要用多少空间,reserve可以缓解vector增容的代价缺陷问题。
2.resize在开空间的同时还会进行初始化,影响size。
扩容问题:
capacity的代码在vs和g++下分别运行会发现,vs下capacity是按1.5倍增长的 ,g++是按2倍增长的。这个问题经常会考察,不要固化的认为,vector增容都是2倍,具体增长多少是根据具体的需求定义的。vs是PJ版本STL,g++是SGI版本STL。
一个reverse经典错误案例
首先了解[]索引运算符重载,会进行assert(i<_size)断言,若越界将报错。
该段代码问题在于reserve只会开空间,并不初始化空间,所以_size=0,用索引访问将报错。
正确方法如下:
1.使用resize,开辟空间同时初始化
2.使用reserve预留空间,使用尾插,避免索引访问造成越界
增删查改问题

第一个参数位置是插入位置的迭代器,分为插入单个元素,插入多个相同元素,插入范围内元素。
C++ 标准库中的一个通用算法,用于在范围 [first, last) 内查找值等于 val 的元素。如果找到这样的元素,它返回一个指向该元素的迭代器;如果未找到,则返回 last.
可以看到只删除了第一次出现的val,那么如何删除所有val,继续用find涉及迭代器失效的问题,后续会深入学习。
在OJ中的使用
杨辉三角
1.C语言用二维数组来存储杨辉三角,需要创建一个指针数组,其中每个元素又指向一块空间,形成行和列,返回该指针数组地址需要参数二级指针来接收,比较麻烦。
2.C++使用二维vector即vector<vector>来存储杨辉三角。二维vector,包含多个vector对象。每个vector对象内部包含:
1.指向数据的指针int*
2.数据个数size
3.容量capacity
步骤分解:
a.调用vector<vector>的operator[],返回第i个vector对象的引用,是一个vector对象。
b.调用返回的vector对象的operator[],访问其内部元素即二维数组中列元素。
c.最终返回int类型值
电话号码的字母组合

该题运用了vector的string来存储字母组合,相当于一个字符串数组,并且不用担心容量问题,空间不够自动扩容。
这是一道全排列算法 题目,可以按照一定顺序递归的将每一个元素组合起来
1.创建一个strr数组来存储每个数字表示的字母情况,记得要显示声明数组大小,C++不支持自动推导。创建一个vector的string来存储所有字母组合。
2.自定义一个函数完成组合功能,参数digits是输入字符串,level是当前处理的数字位置即层数,combinestr是当前生成的字母组合,v为存储结果的容器。num作用是将当前处理的数字字符转换为整数值,以便作数组strr的索引,获得对应字符串。for循环中i表示遍历到一个数字所表示的第几个字母。每个字母表示完后返回上一层,继续与上一层的下一个字母递归,返回条件为层数==输入字符串的大小,level从0开始,符合数组索引要求。
注意:combinestr参数不能传引用的原因是,每次递归传下去的是coombinestr+str[i],若传引用归的过程中上一层的combinestr会被改变,影响全排列。
vector迭代器失效问题
迭代器的主要作用就是让算法能够不用关心底层数据结构,其底层实际就是一个指针,或者是对指针进行了封装。比如:vector的迭代器就是原生态指针T* 。因此迭代器失效,实际就是迭代器底层对应指针所指向的空间被销毁了,非法访问造成的后果是程序崩溃
对于vector可能会导致其迭代器失效的操作有:
- 会引起其底层空间改变的操作 ,都有可能是迭代器失效,比如:resize、reserve、insert、assign、push_back等。
其中insert认为通通失效,因为不同平台下扩容逻辑不同,不知道什么时候会扩容。
2.删除当pos为最后一个元素时,后面元素整体前挪,pos位置为空。
注意:Linux下,g++编译器对迭代器失效的检测并不是非常严格,处理也没有vs下极端。
- 扩容之后,迭代器已经失效了,程序虽然可以运行,但是运行结果已经不对了
- erase删除任意位置代码后,linux下迭代器并没有失效因为空间还是原来的空间,后序元素往前搬移了,it的位置还是有效的
迭代器失效解决办法:在使用前,对迭代器重新赋值即可。erase会返回指向被擦除元素之后的第一个元素的迭代器,若最后一个元素被擦除会返回end迭代器,表示容器末尾,通过接收返回值再访问也可解决。
可以看出头插的两个元素为随机值,因为检查扩容时capacity*2,所以原空间被销毁,返回一个指向新大小空间的指针,_start被改变,若继续使用_start来计算pos会造成非法访问。
解决办法:
提前记录pos和_start的差值,扩容后再利用差值来重新计算pos
3.vector的模拟实现
类模板不能声明和定义分离,模板进阶会学习
insert时pos不用再担心无符号整型<0的问题,现在代表一个有效的地址,一定不为0
vector成员函数的源码剖析,与平常使用的T*a,size_t size,size_t capacity不同,定义的是iterator类型的start,finish,end_of_storage,但size=finish-start,capacity=end_of_storage-start;功能上相似。
重点情景分析
关于reserve的深浅拷贝问题
vector是深拷贝,但是vector空间上存的对象是string数组,使用memcpy导致string对象的浅拷贝。
memcpy 导致浅拷贝的原因 :
因为它只是复制内存字节,不考虑对象的类型和语义,导致指针等资源的值被复制,而不是它们所指向的内存内容。
问题 :当T是自定义类型时,依次调用数组每个对象析构函数,再释放整个空间,当浅拷贝共用一块空间时会析构两次,第二次造成野指针问题。
这意味着源对象和目标对象共享同一块内存资源,修改一个对象会影响另一个对象。
解决方法:
当T是string这样深拷贝的类时,调用的就是赋值重载。若T是浅拷贝类,进行简单的复制操作。可以同时满足深浅拷贝的需求。
关于string类大小计算说明
在 C++ 中,sizeof(std::string) 计算的是 std::string 对象本身的大小 ,而不是它所管理的动态分配的内存的大小 。std::string 对象本身的大小是固定的,由其成员变量的大小决定,通常包括指向字符串数据的指针、字符串的长度和容量等。
实际的字符串数据存储在动态分配的内存中,这些内存的大小取决于字符串的长度。
sizeof(std::string) 返回的是对象本身的大小,不包括动态分配的内存。
同名函数模板存在
在C++中,同名的函数模板可以一起存在,只要它们的参数列表或模板参数列表不同,这样编译器可以根据函数调用时的参数来区分应该使用哪个模板。这类似于普通函数的重载。
以构造函数为例
范围构造函数:
template<>是一个模板函数,InputIterator 是模板参数,表示输入迭代器的类型。这个构造函数的功能是将 [first, last) 范围内的所有元素复制到 vector 中。它适用于任何符合输入迭代器要求的迭代器类型
以这三组测试用例为例:
第一组:10u是unsignedint类型,而构造函数参数类型分别是size_t和int类型,编译器无法确认调用哪一个构造函数,可以有多个选择所以报错。
第二组:和第二个填充构造函数参数类型完全匹配,有唯一选择。
第三组:两个参数都是int类型,vector<>在实例化一个模板,生成一个具体的类(如 vector<>),用于存储 int 类型的元素。符合范围构造函数类模板相同,可以都转化成int,有唯一选择
代码
- vector.h
cpp
#pragma once
#include<assert.h>
#include<string>
namespace ee
{
template<class T>
class vector
{
public:
typedef T* iterator;
typedef const T* const_iterator;
iterator begin()
{
return _start;
}
iterator end()
{
return _finish;
}
const_iterator begin() const
{
return _start;
}
const_iterator end() const
{
return _finish;
}
//构造函数
vector()
:_start(nullptr)
, _finish(nullptr)
, _endofstorage(nullptr)
{}
//构造函数的另外形式(深拷贝)
//填充构造函数
vector(size_t n, const T& val=T())
{
resize(n,val);
}
vector(int n, const T& val = T())
{
resize(n, val);
}
//范围构造函数
template<class InputIterator>
vector(InputIterator first, InputIterator last)
{
while (first != last)
{
push_back(*first);
first++;
}
}
//拷贝构造函数,深拷贝
vector(const vector<T>& v)
{//注意参数要传引用,实参复制到形参需要调用拷贝构造函数,会引发无穷递归
_start = new T[v.capacity()];
for (size_t i = 0; i < v.size(); i++)
{
_start[i] = v._start[i];
}
_finish = _start + v.size();
_endofstorage = _start + v.capacity();
}
//拷贝构造函数,深拷贝
/*vector(const vactor<T>& v)
{
:_start(nullptr);
, _finish(nullptr);
, _endofstorage(nullptr);
{
reserve(v.capacity);
for (auto e : v)
{
push_back(e);
}
}
}*/
~vector()
{
if (_start)
{
delete[] _start;
_start = _finish = _endofstorage = nullptr;
}
}
size_t capacity() const
{
return _endofstorage - _start;
}
size_t size() const
{
return _finish - _start;
}
void reserve(size_t n)
{
if (n > capacity())
{
//新开一个空间
size_t sz = size();
T* tmp = new T[n];
//检查空指针,避免未定义行为(拷贝,释放)
if (_start)
{
//memcpy(tmp, _start, sizeof(T) * sz);
for (size_t i = 0; i < sz; i++)
{
tmp[i] = _start[i];
}
delete[] _start;
}
_start = tmp;
_finish = _start + sz;
_endofstorage = _start + n;
}
}
void push_back(const T& x)
{
//检查容量
if (_finish == _endofstorage)
{
size_t newcapacity = capacity() == 0 ? 4 : capacity() * 2;
reserve(newcapacity);
}
//_start是一个指针没有尾插
// _start.push_back(x);
*_finish = x;
_finish++;
}
T& operator[](size_t pos)
{
assert(pos < size());
return _start[pos];
}
const T& operator[](size_t pos) const
{
assert(pos < size());
return _start[pos];
}
iterator insert(iterator pos, const T& x)
{
if (pos >= _start && pos <= _finish)
{
if (_finish == _endofstorage)
{
size_t len = pos - _start;
size_t newcapacity = capacity() == 0 ? 4 : capacity() * 2;
reserve(newcapacity);
//解决迭代器失效问题
pos = _start + len;
}
}
//挪动元素
iterator end = _finish - 1;
while (end >= pos)
{
*(end -1) = *end;
end--;
}
//赋值,更新索引
*pos = x;
_finish++;
return pos;
}
void resize(size_t n, const T& val = T())
{//缺省参数使用匿名对象,可支持多种类型的初始化
if (n < size())
{//直接截断容器
_finish = _start + n;
}
else
{
//需要扩容
reserve(n);
while (_finish < _start + n)
{//注意为<,若等于会多循环一次造成越界问题
*_finish = val;
_finish++;
}
}
}
iterator erase(iterator pos)
{//凡涉及数据挪动,都需要检查边界
assert(pos >= _start && pos <= _finish);
iterator it = pos + 1;
while (it != _finish)
{
*(it - 1) = *it;
it++;
}
_finish--;
return pos;
}
void swap(vector<T>& v)
{
std::swap(_start, v._start);
std::swap(_finish, v._finish);
std::swap(_endofstorage, v._endofstorage);
}
//赋值运算符重载
vector<T>& operator=(vector<T>v)
{//复用交换函数
swap(v);
return *this;
}
private:
iterator _start;
iterator _finish;
iterator _endofstorage;
};
}
- test.c
cpp
#include"vector.h"
#include<iostream>
using namespace ee;
using namespace std;
void test_vector1()
{
vector<int> v;
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
ee::vector<int>::iterator p = v.begin();
v.insert ( p, 9);
v.insert(p, 10);
for (auto e : v)
{
cout << e << " ";
}
cout << endl;
}
void test_vector2()
{
ee::vector<int>v;
v.insert(v.begin(), 1);
v.insert(v.begin()+1, 2);
v.insert(v.begin() + 2, 2);
v.push_back(3);
v.push_back(4);
v.push_back(5);
v.push_back(6);
for (auto e : v)
{
cout << e << " ";
}
cout << endl;
ee::vector<int>:: iterator it = v.begin();
while (it != v.end())
{
if (*it % 2 == 0)
{
it = v.erase(it);
}
else
{
it++;
}
}
for (auto e : v)
{
cout << e << " ";
}
cout << endl;
}
//测试resize和赋值运算符重载函数
void test_vector3()
{
vector<int>v1;
v1.push_back(1);
v1.push_back(2);
v1.push_back(3);
v1.push_back(4);
for (auto e : v1)
{
cout << e << " ";
}
cout << endl;
vector<int>v;
v.resize(10, 6);
v1 = v;
for (auto e : v1)
{
cout << e << " ";
}
cout << endl;
}
//拷贝构造的其他方式
void test_vector4()
{
//10u是unsignedint类型,而构造函数参数类型分别是size_t和int类型
// 编译器无法确认调用哪一个构造函数
//vector<int> v(10u, 1);
vector<string> v1(10, "1111");
vector<int> v2(10, 6);
for (auto e : v2)
{
cout << e << " ";
}
cout << endl;
}
void test_vector5()
{
vector<string> v;
v.push_back("111111111111111111");
v.push_back("222222222222222222");
v.push_back("333333333333333333");
v.push_back("444444444444444444");
v.push_back("555555555555555555");
for (auto& e : v)
{
cout << e << " ";
}
cout << endl;
vector<string> v1(v);
for (auto& e : v1)
{
cout << e << " ";
}
cout << endl;
}
int main()
{
test_vector5();
return 0;
}