【STL】深入理解 string 的底层思想

一、STL的定义

STL是C++标准库的一部分它不仅是一个可复用的组件库还是一个包含数据结构和算法的软件框架。

二、STL的历史和版本

原始版本：

Alexander Stepanov、Meng Lee在惠普实验室完成的原始版本，本着开源精神，他们声明允许任何人任意运用、拷贝、修改、传播、商业使用这些代码，无需付费。唯一的条件就是也需要向原始版本一样做开源使用。HP 版本--所有STL实现版本的始祖。

P.J.版本：

由P.J.Plauger开发，继承自HP版本，被Windows Visual C++采用，不能公开或修改，缺陷：可读性比较低，符号命名比较怪异。

RW版本：

由Rouge Wage公司开发，继承自HP版本，被C++Builder采用，不能公开或修改，可读性一般。

SGI版本：

由Silicon Graphics Computer Systems,Inc公司开发,继承自HP版本。被GCC(Linux)采用,可移植性好，可公开、修改甚至贩卖，从命名风格和编程风格上看，阅读性非常高。

三、STL的六大组件

STL的六大组件：仿函数、空间配置器、算法、容器、迭代器、配接器。

四、STL的重要性

1、笔试中不用自己写二叉树和栈、队列等等快速解答。

2、帮助我们应对面试中HR的提问

3、不懂STL不要说你会C++，STL在工作中可以帮助我们不要自己写数据结构和算法，让我们快速开发。

五、学习STL的方法

《The C++ Standard Library》一书中把学习STL比喻成三个境界：熟用STL，了解STL的底层、扩展STL

六、string类

string类文档链接：string - C++ Reference

string是char类型的顺序表的类同时也STL的一种容器，使用string类的时候需要包含头文件和using namespace std;

我们要想学习string类先了解它的构造函数和接口。

1、string类的构造函数（string::string - C++ Reference）

注意：由于析构函数程序结束之后就自动调用所以我们不需要太关注析构函数。

注意：我们只要掌握常见的几种构造就行：

1.1、string()

代码示例：

cpp 复制代码

#include<string>
#include<iostream>
using namespace std;

int main()
{
	string s1;//调用默认构造
	cout << s1 << endl;

	return 0;
}

注意：流插入和流提取已经在库里面重载了，我们直接用就行。

运行结果：

注意：从上面运行结果可以看出调用默认构造编译器啥也不干。

1.2、string(const char* s)

代码示例1：

cpp 复制代码

#include<string>
#include<iostream>
using namespace std;

int main()
{

	string s2("hello word");
	cout << s2 << endl;

	return 0;
}

运行结果：

代码示例2：

cpp 复制代码

#include<string>
#include<iostream>
using namespace std;

int main()
{

	//string s2("hello word");
	string s3 = "hello word";//隐式类型转换
	cout << s3 << endl;

	return 0;
}

运行结果：

1.3、string(const string& str)

代码示例：

cpp 复制代码

#include<string>
#include<iostream>
using namespace std;

int main()
{

	string s1("hello world");
	string s2(s1);//拷贝构造

	cout << s2 << endl;

	return 0;
}

运行结果：

1.4、string(size_t n,char c)

代码示例：

cpp 复制代码

#include<string>
#include<iostream>
using namespace std;

int main()
{

	string s1("hello world");
	string s2(10,'I');//用10I来构造s2

	cout << s2 << endl;

	return 0;
}

运行结果：

2、string的赋值重载（string::operator= - C++ Reference）

他们用法都差不多这里就不一一细讲。

代码示例：

cpp 复制代码

#include<string>
#include<iostream>
using namespace std;

int main()
{

	string s3 = "HooL";

	cout << s3 << endl;

	return 0;
}

运行结果：

3、string的遍历和修改（https://legacy.cplusplus.com/reference/string/string/operator[]/）

3.1下标+[ ]遍历

代码示例：

cpp 复制代码

#include<string>
#include<iostream>
using namespace std;

int main()
{
	string s1("hello world");
	cout << s1 << endl;
	s1[0] = 'x';
	cout << s1 << endl;
	s1[1]++;
	cout << s1 << endl;

	return 0;
}

运行结果：

cpp 复制代码

#include<string>
#include<iostream>
using namespace std;

int main()
{
	string s1("hello world");
	for (int i = 0; i < 11; i++)
	{
		cout << s1[i];
	}

	return 0;
}

运行结果：

小贴士：修改和遍历本质是运算符的重载。

注意：string的size是不包含\0，如：

cpp 复制代码

#include<string>
#include<iostream>
using namespace std;

int main()
{
	string s1("hello world");
	cout << s1.size();

	return 0;
}

运行结果：

注意：string会对[ ]进行检查看它是否越界，如果越界会断言报错。如：

代码示例：

cpp 复制代码

#include<string>
#include<iostream>
using namespace std;

int main()
{
	string s1("hello world");
	s1[12];
	return 0;
}

运行结果：

3.2、迭代器遍历和修改

迭代器跟指针差不多，那么我们来看看怎么用迭代器来遍历string。

代码示例：

cpp 复制代码

int main()
{
	string s1("hello world");
	string::iterator it = s1.begin();//begin指向第一个字符

	while (it != s1.end())//end指向\0字符
	{
		cout << *it ;
		it++;
	}


	return 0;
}

运行结果：

cpp 复制代码

int main()
{
	string s1("hello world");
	string::iterator it = s1.begin();//begin指向第一个字符

	while (it != s1.end())//end指向\0字符
	{
		*it = 'h';
		cout << *it ;
		it++;
	}


	return 0;
}

运行结果：

注意：下标+[ ] 和迭代器访问和修改的区别，下标+[ ] 是特定容器支持，二迭代器访问是容器的通用访问和修改方式。

3.3、范围for遍历

代码示例1：

cpp 复制代码

int main()
{
	int i = 10;
	auto k = i;//根据i的类型推出k的类型，相当于：int k=i;
	auto j = &i;//相当于：int* j=&i;
	auto* a = &i;//相当于int* a=&i
	auto* b = i;//相当于：int* b=i;//编译报错

	auto c = i;//相当于：int& c=i;

	return 0;
}

代码示例2：

cpp 复制代码

auto Add(auto x, auto y)
{
	return x + y;
}

int main()
{
	int x = 1, y = 2;
	cout << Add(x, y);
	return 0;
}

运行结果：

注意：只有C++20以上的版本才支持这样写，atuo尽量少用。

代码示例3

cpp 复制代码

int main()
{
	string s1("hello world");
	for (auto e : s1)//自动取容器的数据依次给对象，自动判断结束
	{
		cout << e;
	}
	return 0;
}

运行结果：

代码示例4：

cpp 复制代码

int main()
{
	string s1("hello world");
	for (auto e : s1)//把s1的元素一一给e,e就是s1的拷贝，e的修改和不影响s1
	{
		e--;
		cout << e;
	}
	cout << endl;
	cout << s1;

	
	return 0;
}

运行结果：

代码示例5：

cpp 复制代码

int main()
{
	string s1("hello world");
	for (auto& e : s1)//如果想修改s1的值可以用引用
	{
		e--;
		cout << e;
	}
	cout << endl;
	cout << s1;

	
	return 0;
}

运行结果：

3.4、string迭代器介绍

这里只介绍 begin 和 end 因为后面的迭代器跟这两个差不多。

begin()和end()是个迭代器，迭代器我们理解为是一个指针。

用法示例：

cpp 复制代码

int main()
{
	string s("hello world");
	string::iterator it = s.begin();
	while (it != s.end())
	{
		cout << *it;//可以像指针那样访问
		it++;
	}

	return 0;
}

注意：begin()指向起始位置，end()指向\0

那么 rbegin() 和 rend() 的用法是：

cpp 复制代码

int main()
{
	string s("hello world");
	string::reverse_iterator rit = s.rbegin();//rend（）指向第一个数据的前一个，rbegin()指向最后一个数据不包含\0
	while (rit != s.rend())
	{
		cout << *rit;//可以像指针那样访问
		rit++;//和正向迭代器不一样，反向迭代器++往左走
	}

	return 0;
}

cpp 复制代码

int main()
{
	string s("hello world");//反向迭代器和正向迭代器的类型不一样
	string::reverse_iterator rit = s.rend();//rend（）指向第一个数据的前一个，rbegin()指向最后一个数据不包含\0
	rit--;
	while (rit != s.rbegin())//不能用小于大于或者小等大等
	{
		cout << *rit;//可以像指针那样访问
		rit--;//和正向迭代器不一样，反向迭代器++往左走
	}
	cout << *rit;
	return 0;
}

注意：一个对象被const修饰那么这个对象迭代器的类型就要改变

代码示例：

cpp 复制代码

	const string s("abcd");
	string::const_iterator it = s.end();

那么反向迭代器也是一样，只要对象被const修饰。

3.5、string 的 capacity 介绍

根据二八原则我们只要学习一下常用的就行。

1）size 和 length是一样的，但是由于 size 在其他容器也有所以这里推荐使用size。

用法：计算字符串的数据个数（不包含\0）

代码示例：

cpp 复制代码

	const string s("abcd");
	cout << s.size();//打印结果是4

2）max_size介绍

这个准确来说没什么意义，他是计算默认的最大的长度，不管这个字符串是长的还是短的。

代码示例：

cpp 复制代码

	const string s("abcd");
	string s2("hello world");
	cout << s.max_size() << endl;
	cout << s2.max_size();

打印结果：

3）capacity介绍

capacity是计算能存储的数据大小，即：容量；但是实际上容量会多一个来存储\0。

代码示例：

cpp 复制代码

	const string s("abcd");
	string s2("hello world");
	cout << s.capacity() << endl;
	cout << s2.capacity();

打印结果：

capacity是个默认值：15

4） clear 介绍

clear就是把size置为0，容量不变。

代码示例：

cpp 复制代码

	string s("abcd");
	cout << s.capacity() << endl;
	cout << s.size() << endl;

	s.clear();//把size变成0.容量不变

	cout << s.capacity() << endl;
	cout << s.size();

打印结果：

注意：字符串也没有了。

5）reserve 介绍

在学习 reserve 之前我们先了解一下string的扩容机制。

代码示例：

cpp 复制代码

	string s;
	int cap = s.capacity();
	cout << cap << endl;
	for (int i = 0; i < 200; i++)
	{
		s.push_back('x');//尾插数据
		if (cap != s.capacity())//判断扩容机制
		{
			cout << s.capacity() << endl;
			cap = s.capacity();
		}
	}

打印结果：

结论：VS除了第一次是2倍扩容，后面都是1.5倍扩容。不同普通平台的扩容倍数是不一样的；Linux是2倍扩容。

string的扩容机制是异地扩容，比如：size 为4，容量为15，它先在别的地方申请容量为31的空间，再把那4个数据复制过去然后再把原来的空间释放掉。

reserve 如果扩容的大小比capacity小，会不会缩容是不确定的（不建议用reserve进行缩容），看平台，对size不影响。

代码示例：

cpp 复制代码

	string s;
	cout << s.capacity() << endl;

	s.reserve(100);
	cout << s.capacity() << endl;

	s.reserve(200);
	cout << s.capacity() << endl;

	s.reserve(100);
	cout << s.capacity() << endl;

打印结果：

注意：在VS下 reserve 扩容会比指定的值大，缩容有可能缩也可能不缩。

6）resize 介绍

resize有三种情况：size<n<capacity（插入数据）、n>capacity（扩容+插入数据）、n<size（删除数据）。

图片解疑：

注意：插入数据默认为\0

代码示例：

cpp 复制代码

int main()
{
	string s("hello world");
	s.resize(20);//扩容后面默认是\0
	cout << s << endl;

	s.resize(5);//删除数据
	cout << s << endl;

	s.resize(20, 'Y');//扩容指定插入数据Y
	cout << s << endl;

	return 0;
}

运行结果：

3.5、string的修改和访问介绍

1）[ ] 和 at 介绍