引言:
在简单学习完模版之后,我们就要开始学习C++中的另一个重要板块---STL ,并且STL 在C++中也是占据着一个重要地位,今天我们将学习STL 中的第一个容器string
。
一:STL简介
1.什么是STL
STL(standard template libaray-标准模板库):是C++标准库的重要组成部分,不仅是一个可复用的组件库,而且是一个包罗数据结构与算法的软件框架 。
2. STL的六大组件

3. STL的重要性
网上有句话说:"不懂STL,不要说你会C++ " 。STL是C++中的优秀作品,有了它的陪伴,许多底层的数据结构以及算法都不需要自己重新造轮子,正是能够站在前人的肩膀上,所以程序员们才能健步如飞地快速开发。
4.怎么学习STL?
第一阶段 : 熟用STL。
第二阶段 :了解泛型技术的内涵与STL的学理乃至实作。
第三阶段:扩充STL。
二:string类
1. 为什么要学习string?
在刚接触string
这个容器的时候,很多同学可能会有这样的问题:我们不是有字符数组吗?为什么还要学习string
呢?
下面给出几点理由:
1.1 C语言中的字符串
C语言中,字符串是以 '\0'
结尾的一些字符的集合,为了操作方便,C标准库中提供了一些str
系列的库函数,但是这些库函数与字符串是分离开的,不太符合OOP的思想,而且底层空间需要用户自己管理,稍不留神可能还会越界访问。
1.2 OJ题中的字符串
在OJ 中,有关字符串的题目基本以string
类的形式出现,而且在常规工作中,为了简单、方便、快捷,基本都使用string
类,很少有人去使用C库中的字符串操作函数。
2. 标准库中的string类
2.1 接口的概念:
接口是不同组件间交互的约定或规范,它明确了组件能提供的功能以及使用这些功能的方式。在STL 中,接口使得不同容器、算法等组件能协同工作,提高了代码的复用性与可维护性。
简单来理解就是:接口是我们用来调用不同容器功能的一个窗口。
2.2 前置知识:
(1)auto关键字
- 在早期C/C++中auto的含义是:使用
auto
修饰的变量,是具有自动存储器的局部变量,后来这个不重要了。C++11中,标准委员会变废为宝赋予了auto
全新的含义即:auto
不再是一个存储类型指示符,而是作为一个新的类型指示符来指示编译器,auto
声明的变量必须由编译器在编译时期推导而得。 - 用
auto
声明指针类型时,用auto
和auto*
没有任何区别,但用auto
声明引用类型时则必须加&
。 - 当在同一行声明多个变量时,这些变量必须是相同的类型,否则编译器将会报错,因为编译器实际只对第一个类型进行推导,然后用推导出来的类型定义其他变量。
auto
不能作为函数的参数,可以做返回值,但是建议谨慎使用。auto
不能直接用来声明数组。
场景一:auto不能作为参数

场景二:auto作返回值
注:auto
虽然可以作为返回值,但是不推荐这样写,因为如果多个函数之间紧密联系,会造成代码的可读性大大降低。
场景三:auto必须始终推导一个类型

场景四:auto不能直接用来声明数组

场景五:auto的简便之处
注:如果没有auto
的话,光是一个类型就这么长,但是有了auto
就可以让编译器自动推导类型,简便了很多。
(2)范围for
- 对于一个有范围的集合而言,由程序员来说明循环的范围是多余的,有时候还会容易犯错误。因此C++11 中引入了基于范围的
for
循环。for
循环后的括号由冒号" :"
分为两部分:第一部分是范围内用于迭代的变量,第二部分则表示被迭代的范围,自动迭代,自动取数据,自动判断结束。 - 范围
for
可以作用到数组和容器对象上进行遍历。 - 范围
for
的底层很简单,容器遍历实际就是替换为迭代器,这个从汇编层也可以看到。
场景一:范围for遍历数组

场景二:范围for遍历容器

2.3 string类常用接口
(1)string类对象的常见构造:
- string() (重点):构造空的
string
类对象,即空字符串。 - string(const char* s) (重点):用
C-string
来构造string
类对象 - string(size_t n, char c):
string
类对象中包含n
个字符c
。 - string(const string&s) (重点):拷贝构造函数。
注:这里的单参数隐式类型转换使得可以让字符串直接入栈。
(2)string
类对象的容量操作:
- size(重点): 返回字符串有效字符长度。
- length: 返回字符串有效字符长度。
- capacity:返回空间总大小。
- empty(重点):检查字符串是否为空,若为空返回
true
,否则返回false
。 - clear(重点):清空有效字符。
- reserve(重点):为字符串预留空间。
- resize(重点):将有效字符的个数改为
n
个,多出的空间用字符c
填充。
相关代码演示:
小结:
注意:
size()
与length()
方法底层实现原理完全相同,引入size()
的原因是为了与其他容器的接口保持一致,一般情况下基本都是用size()
。clear()
只是将string
中有效字符清空,不改变底层空间大小。resize(size_t n)
与resize(size_t n, char c)
都是将字符串中有效字符个数改变到n
个,不同的是当字符个数增多时:resize(n)
用0
来填充多出的元素空间,resize(size_t n, charc)
用字符c
来填充多出的元素空间。注意:resize
在改变元素个数时,如果是将元素个数增多,可能会改变底层容量的大小,如果是将元素个数减少,底层空间总大小不变。reserve(size_t res_arg=0)
:为string
预留空间,不改变有效元素个数,当reserve
的参数小于string
的底层空间总大小时,reserve
不会改变容量大小。
(3)string类对象的访问及遍历操作
- operator[] (重点):返回
pos
位置的字符,const string
类对象调用。 - begin:
begin
获取第一个字符的迭代器。 - end:
end
获取最后一个字符下一个位置的迭代器。 - rbegin:
begin
获取第一个字符的迭代器。 - rend:
end
获取最后一个字符下一个位置的迭代器。 - 范围for:C++11支持更简洁的范围
for
的新遍历方式。
相关代码演示:
(4)string
类对象的修改操作
- push_back:在字符串后尾插字符
c
。 - append:在字符串后追加一个字符串。
- operator+= (重点):在字符串后追加字符串
str
。 - c_str(重点):返回C格式字符串。
- find:从字符串
pos
位置开始往后找字符c
,返回该字符在字符串中的位置。 - npos
- rfind:从字符串
pos
位置开始往前找字符c
,返回该字符在字符串中的位置。 - substr:在
str
中从pos
位置开始,截取n
个字符,然后将其返回。
相关代码演示:
注:
- 若
find
函数第二个参数不传的话,默认是从第一个字符从左往右查找。 - 若
rfind
函数第二个参数不传的话,默认是从最后一个字符从右往左查找。 - 若
find
和rfind
函数没有找到的话,返回npos
,一个极大值。
注 :若
substr
第二个参数不传或者传入的值大于剩余字符串长度的话就会全部截取完。
小结:
注:
- 在
string
尾部追加字符时,s.push_back(c) / s.append(1, c) / s += 'c'
三种的实现方式差不多,一般情况下string
类的+=
操作用的比较多,+=
操作不仅可以连接单个字符,还可以连接字符串。 - 对
string
操作时,如果能够大概预估到放多少字符,可以先通过reserve
把空间预留好(可以避免频繁扩容,提升效率)。
(5) string类非成员函数
- operator+:尽量少用,因为传值返回,导致深拷贝效率低。
- operator>> (重点):输入运算符重载。
- operator<< (重点):输出运算符重载。
- getline (重点):获取一行字符串。(遇到空格不会停止读取)
- relational operators (重点):大小比较。
(6) 拓展学习:
在VS下的string
结构(32位环境下)32位平台下指针是四个字节。
vs下string
的结构
string
总共占28个字节,内部结构稍微复杂一点,先是有一个联合体,联合体用来定义string
中字符串的存储空间:
- 当字符串长度小于16时,使用内部固定的字符数组来存放。
- 当字符串长度大于等于16时,从堆上开辟空间。
这种设计也是有一定道理的,大多数情况下字符串的长度都小于16,那string
对象创建好之后,内部已经有了16个字符数组的固定空间,不需要通过堆 创建,效率高。
其次:还有一个size_t
字段保存字符串长度,一个size_t
字段保存从堆上开辟空间总的
容量。最后:还有一个指针做一些其他事情。
故总共占16+4+4+4=28
个字节。
三:string
类模拟实现
1. 约定:
约定:在这里为了避免与标准库中的string造成冲突,所以我们模拟实现的string就放到命名空间里。
2. 基本框架:

3. 构造函数:

注:
- 这里实现构造函数的时候参数是写成了缺省值的形式,兼容传参和不传参两种形式。
- 这里在初始化列表中先求传入字符串的长度来初始化
_size
,避免了频繁求长度。 - 这里在用
new
申请空间的时候不要忘了多申请一个(字符串结尾的\0
)。
4. 析构函数
注:一般来说一个类里面如果显示写了析构函数就需要考虑深拷贝的问题了。
(记住这个点,后面会遇到)
5. 拷贝构造函数
注:
- 这里需要注意参数要用引用(避免无限递归)。
- 在申请空间的时候还是要为
\0
也开一个空间。
6. 赋值运算符重载
注:
- 这里的引用返回 也是为了支持连续赋值。
- 这里为了避免重复赋值加上了一个判断。
7. Size函数
注:这里用const来修饰,const和非const成员都可以调用。
8. 迭代器实现
注:这里我们仿照标准库里面的string也实现了两种迭代器(一种普通的迭代器,一种const类型的迭代器)。
9. [ ]运算符重载
注:这里我们也是实现两种类型,const
修饰的那个就不能修改对象里面的值。
注:在取值之前先断言下标是否合法。
10. c_str 函数

11. reserve 函数
注:
- 如果传入的
n
大于当前的容量_capacity
再进行扩容。 - 如果当前的字符串不为空再进行拷贝。
12. push_back函数
分析:

代码实现:
注:凡是插入数据,在这之前肯定要先检查空间是否足够,如果不够就先进行扩容,若空间足够就直接插入,最后还要记得补上一个\0
。
13. append 函数
分析:

代码实现:
注:
- 由于不知道传入字符串的长度,因此扩容时就写成这种形式,尽可能的减少内存碎片化。
- 这里拷贝的时候也不要忘了最后的
\0
。
14. +=
运算符重载

注:这里就直接复用之前实现的函数即可。
15. insert函数
分析:

代码实现:
注:这里的while
循环中将POS
进行了强制类型转换,否则POS
作为无符号整形,这里会造成死循环(end作为int类型,在与unsigned int 类型的POS进行操作时会整形提升为unsigned int 类型,当POS为0的时候,end在最后一次该停止的时候会减为-1,但由于是无符号整形,实际上是最大值,因此会造成死循环)。
16. erase函数
分析:

代码实现:
注:
- 这里先判断剩下的数据是否够删,这里的
npos
就是一个极大值,如果第二个参数不传的话就默认是将POS
位置之后的字符全部删除。 - 由于用到了
npos
,因此这里还需要声明,这里将npos
搞成静态变量,类里面声明,类外定义。
17. find 函数
注:若找到返回下标,否则返回极大值npos
。
18. substr 函数
19. clear 函数
注:这里的clear
只是将数据清空了,并没有销毁空间。
20. 比较运算符重载

(1)< 运算符重载
分析:

代码实现:

(2)== 运算符重载
分析:

代码实现:

(3)<= 运算符重载
#### (4)>= 运算符重载
(5)> 运算符重载

(6)!= 运算符重载

21. swap 函数
在实现swap
函数之前,一些同学可能会说:C++中不是为我们提供了swap
函数的类模版吗?为什么还要自己来实现呢?那么我们就来分析一下:
如果直接用swap
的类模板的话,这里会借助中间对象 ,相当于其实是会进行3次深拷贝,要知道深拷贝的代价是很大的。
这里的三次深拷贝会创建三块新的空间,但是我们只是想交换两个对象,其实用不着再申请新的空间,因此我们这里最好还是自己实现swap
函数。
22. 流插入重载
注:可以看到这里我们这里在实现流插入的时候和之前的日期类不同,我们没有用到其私有成员,因此也不需要友元声明。
23. 流提取重载
注:
- 在进行流提取之前我们先对字符串进行了清空操作(和标准库保持一致)。
- 这里通过一个内存池的思想来提高效率。(避免频繁去堆上扩容)
- 这里为了能读到空格,这里用到了
is
的get
函数。
string类模拟实现(补充)
1. 构造函数(迭代器实现)
注:这里用迭代器方式构造的方式封装成了一个类模版。
2. 拷贝构造函数(现代写法)
注:这里又一次感受到了复用的魅力(难道不是偷懒吗?)。
3. 赋值运算符重载(现代写法)
版本1:
注 :这里就是复用 了拷贝构造函数 ,拿s
去拷贝构造tmp
,之后将tmp
与*this
交换
版本2:
注:这里的实现就更简便了,在调用的时候就拿s去构造临时对象tmp
,之后直接交换tmp
和*this
,tmp
拿到*this
的地址之后,因为它是临时对象,出作用域就自动销毁了。