《STL--string的使用及其底层实现》

引言:

在简单学习完模版之后,我们就要开始学习C++中的另一个重要板块---STL ,并且STL 在C++中也是占据着一个重要地位,今天我们将学习STL 中的第一个容器string

一:STL简介

1.什么是STL

STL(standard template libaray-标准模板库):是C++标准库的重要组成部分,不仅是一个可复用的组件库,而且是一个包罗数据结构与算法的软件框架 。

2. STL的六大组件

3. STL的重要性

网上有句话说:"不懂STL,不要说你会C++ " 。STL是C++中的优秀作品,有了它的陪伴,许多底层的数据结构以及算法都不需要自己重新造轮子,正是能够站在前人的肩膀上,所以程序员们才能健步如飞地快速开发。

4.怎么学习STL?

第一阶段 : 熟用STL。
第二阶段 :了解泛型技术的内涵与STL的学理乃至实作。
第三阶段:扩充STL。

二:string类

1. 为什么要学习string?

在刚接触string这个容器的时候,很多同学可能会有这样的问题:我们不是有字符数组吗?为什么还要学习string呢?

下面给出几点理由:

1.1 C语言中的字符串

C语言中,字符串是以 '\0'结尾的一些字符的集合,为了操作方便,C标准库中提供了一些str系列的库函数,但是这些库函数与字符串是分离开的,不太符合OOP的思想,而且底层空间需要用户自己管理,稍不留神可能还会越界访问。

1.2 OJ题中的字符串

OJ 中,有关字符串的题目基本以string类的形式出现,而且在常规工作中,为了简单、方便、快捷,基本都使用string类,很少有人去使用C库中的字符串操作函数。

2. 标准库中的string类

2.1 接口的概念:

接口是不同组件间交互的约定或规范,它明确了组件能提供的功能以及使用这些功能的方式。在STL 中,接口使得不同容器、算法等组件能协同工作,提高了代码的复用性与可维护性。

简单来理解就是:接口是我们用来调用不同容器功能的一个窗口。

2.2 前置知识:
(1)auto关键字
  1. 在早期C/C++中auto的含义是:使用auto修饰的变量,是具有自动存储器的局部变量,后来这个不重要了。C++11中,标准委员会变废为宝赋予了auto全新的含义即:auto不再是一个存储类型指示符,而是作为一个新的类型指示符来指示编译器,auto声明的变量必须由编译器在编译时期推导而得。
  2. auto声明指针类型时,用autoauto*没有任何区别,但用auto声明引用类型时则必须加&
  3. 当在同一行声明多个变量时,这些变量必须是相同的类型,否则编译器将会报错,因为编译器实际只对第一个类型进行推导,然后用推导出来的类型定义其他变量。
  4. auto不能作为函数的参数,可以做返回值,但是建议谨慎使用。
  5. auto不能直接用来声明数组。
场景一:auto不能作为参数
场景二:auto作返回值


注:auto虽然可以作为返回值,但是不推荐这样写,因为如果多个函数之间紧密联系,会造成代码的可读性大大降低。

场景三:auto必须始终推导一个类型
场景四:auto不能直接用来声明数组
场景五:auto的简便之处


注:如果没有auto的话,光是一个类型就这么长,但是有了auto就可以让编译器自动推导类型,简便了很多。

(2)范围for
  1. 对于一个有范围的集合而言,由程序员来说明循环的范围是多余的,有时候还会容易犯错误。因此C++11 中引入了基于范围的for循环。for循环后的括号由冒号" :"分为两部分:第一部分是范围内用于迭代的变量,第二部分则表示被迭代的范围,自动迭代,自动取数据,自动判断结束。
  2. 范围for可以作用到数组和容器对象上进行遍历。
  3. 范围for的底层很简单,容器遍历实际就是替换为迭代器,这个从汇编层也可以看到。
场景一:范围for遍历数组
场景二:范围for遍历容器
2.3 string类常用接口
(1)string类对象的常见构造:
  1. string() (重点)构造空的string类对象,即空字符串。
  2. string(const char* s) (重点)C-string来构造string类对象
  3. string(size_t n, char c)string类对象中包含n个字符c
  4. string(const string&s) (重点)拷贝构造函数。


注:这里的单参数隐式类型转换使得可以让字符串直接入栈

(2)string类对象的容量操作:
  1. size(重点): 返回字符串有效字符长度。
  2. length: 返回字符串有效字符长度。
  3. capacity:返回空间总大小。
  4. empty(重点):检查字符串是否为空,若为空返回true,否则返回false
  5. clear(重点):清空有效字符。
  6. reserve(重点):为字符串预留空间。
  7. resize(重点):将有效字符的个数改为n个,多出的空间用字符c填充。
相关代码演示:



小结:

注意

  1. size()length()方法底层实现原理完全相同,引入size()的原因是为了与其他容器的接口保持一致,一般情况下基本都是用size()
  2. clear()只是将string中有效字符清空,不改变底层空间大小。
  3. resize(size_t n)resize(size_t n, char c)都是将字符串中有效字符个数改变到n个,不同的是当字符个数增多时:resize(n)0来填充多出的元素空间,resize(size_t n, charc)用字符c来填充多出的元素空间。注意:resize在改变元素个数时,如果是将元素个数增多,可能会改变底层容量的大小,如果是将元素个数减少,底层空间总大小不变。
  4. reserve(size_t res_arg=0):为string预留空间,不改变有效元素个数,当reserve的参数小于string的底层空间总大小时,reserve不会改变容量大小。
(3)string类对象的访问及遍历操作
  1. operator[] (重点)返回pos位置的字符,const string类对象调用。
  2. beginbegin获取第一个字符的迭代器。
  3. endend获取最后一个字符下一个位置的迭代器。
  4. rbeginbegin获取第一个字符的迭代器。
  5. rendend获取最后一个字符下一个位置的迭代器。
  6. 范围for:C++11支持更简洁的范围for的新遍历方式。
相关代码演示:


(4)string类对象的修改操作
  1. push_back:在字符串后尾插字符c
  2. append:在字符串后追加一个字符串。
  3. operator+= (重点):在字符串后追加字符串str
  4. c_str(重点):返回C格式字符串。
  5. find:从字符串pos位置开始往后找字符c,返回该字符在字符串中的位置。
  6. npos
  7. rfind:从字符串pos位置开始往前找字符c,返回该字符在字符串中的位置。
  8. substr:str中从pos位置开始,截取n个字符,然后将其返回。
相关代码演示:



  1. find函数第二个参数不传的话,默认是从第一个字符从左往右查找。
  2. rfind函数第二个参数不传的话,默认是从最后一个字符从右往左查找。
  3. findrfind函数没有找到的话,返回npos,一个极大值。

:若substr第二个参数不传或者传入的值大于剩余字符串长度的话就会全部截取完。

小结:

注:

  1. string尾部追加字符时,s.push_back(c) / s.append(1, c) / s += 'c'三种的实现方式差不多,一般情况下string类的+=操作用的比较多,+=操作不仅可以连接单个字符,还可以连接字符串。
  2. string操作时,如果能够大概预估到放多少字符,可以先通过reserve把空间预留好(可以避免频繁扩容,提升效率)。
(5) string类非成员函数
  1. operator+:尽量少用,因为传值返回,导致深拷贝效率低。
  2. operator>> (重点):输入运算符重载。
  3. operator<< (重点):输出运算符重载。
  4. getline (重点):获取一行字符串。(遇到空格不会停止读取)
  5. relational operators (重点):大小比较。
(6) 拓展学习:

在VS下的string结构(32位环境下)32位平台下指针是四个字节。

vs下string的结构
string总共占28个字节,内部结构稍微复杂一点,先是有一个联合体,联合体用来定义string中字符串的存储空间:

  1. 当字符串长度小于16时,使用内部固定的字符数组来存放。
  2. 当字符串长度大于等于16时,从上开辟空间。

这种设计也是有一定道理的,大多数情况下字符串的长度都小于16,那string对象创建好之后,内部已经有了16个字符数组的固定空间,不需要通过 创建,效率高。

其次:还有一个size_t字段保存字符串长度,一个size_t字段保存从堆上开辟空间总的

容量。最后:还有一个指针做一些其他事情。

故总共占16+4+4+4=28个字节。

三:string类模拟实现

1. 约定:

约定:在这里为了避免与标准库中的string造成冲突,所以我们模拟实现的string就放到命名空间里。

2. 基本框架:

3. 构造函数:

注:

  1. 这里实现构造函数的时候参数是写成了缺省值的形式,兼容传参和不传参两种形式。
  2. 这里在初始化列表中先求传入字符串的长度来初始化_size,避免了频繁求长度。
  3. 这里在用new申请空间的时候不要忘了多申请一个(字符串结尾的\0)。

4. 析构函数


注:一般来说一个类里面如果显示写了析构函数就需要考虑深拷贝的问题了。
(记住这个点,后面会遇到)

5. 拷贝构造函数


注:

  1. 这里需要注意参数要用引用(避免无限递归)。
  2. 在申请空间的时候还是要为\0也开一个空间。

6. 赋值运算符重载



注:

  1. 这里的引用返回 也是为了支持连续赋值
  2. 这里为了避免重复赋值加上了一个判断。

7. Size函数



注:这里用const来修饰,const和非const成员都可以调用。

8. 迭代器实现




注:这里我们仿照标准库里面的string也实现了两种迭代器(一种普通的迭代器,一种const类型的迭代器)。

9. [ ]运算符重载


注:这里我们也是实现两种类型,const修饰的那个就不能修改对象里面的值


注:在取值之前先断言下标是否合法。

10. c_str 函数

11. reserve 函数



注:

  1. 如果传入的n大于当前的容量_capacity再进行扩容。
  2. 如果当前的字符串不为空再进行拷贝。

12. push_back函数

分析:
代码实现:



注:凡是插入数据,在这之前肯定要先检查空间是否足够,如果不够就先进行扩容,若空间足够就直接插入,最后还要记得补上一个\0

13. append 函数

分析:
代码实现:



注:

  1. 由于不知道传入字符串的长度,因此扩容时就写成这种形式,尽可能的减少内存碎片化。
  2. 这里拷贝的时候也不要忘了最后的\0

14. +=运算符重载


注:这里就直接复用之前实现的函数即可。

15. insert函数

分析:
代码实现:



注:这里的while循环中将POS进行了强制类型转换,否则POS作为无符号整形,这里会造成死循环(end作为int类型,在与unsigned int 类型的POS进行操作时会整形提升为unsigned int 类型,当POS为0的时候,end在最后一次该停止的时候会减为-1,但由于是无符号整形,实际上是最大值,因此会造成死循环)。

16. erase函数

分析:
代码实现:




注:

  1. 这里先判断剩下的数据是否够删,这里的npos就是一个极大值,如果第二个参数不传的话就默认是将POS位置之后的字符全部删除。
  2. 由于用到了npos,因此这里还需要声明,这里将npos搞成静态变量,类里面声明,类外定义。

17. find 函数




注:若找到返回下标,否则返回极大值npos

18. substr 函数


19. clear 函数



注:这里的clear只是将数据清空了,并没有销毁空间。

20. 比较运算符重载

(1)< 运算符重载
分析:
代码实现:
(2)== 运算符重载
分析:
代码实现:
(3)<= 运算符重载

#### (4)>= 运算符重载

(5)> 运算符重载
(6)!= 运算符重载

21. swap 函数

在实现swap函数之前,一些同学可能会说:C++中不是为我们提供了swap函数的类模版吗?为什么还要自己来实现呢?那么我们就来分析一下:

如果直接用swap的类模板的话,这里会借助中间对象 ,相当于其实是会进行3次深拷贝,要知道深拷贝的代价是很大的。

这里的三次深拷贝会创建三块新的空间,但是我们只是想交换两个对象,其实用不着再申请新的空间,因此我们这里最好还是自己实现swap函数。

22. 流插入重载



注:可以看到这里我们这里在实现流插入的时候和之前的日期类不同,我们没有用到其私有成员,因此也不需要友元声明。

23. 流提取重载


注:

  1. 在进行流提取之前我们先对字符串进行了清空操作(和标准库保持一致)。
  2. 这里通过一个内存池的思想来提高效率。(避免频繁去堆上扩容)
  3. 这里为了能读到空格,这里用到了isget函数。

string类模拟实现(补充)

1. 构造函数(迭代器实现)


注:这里用迭代器方式构造的方式封装成了一个类模版。

2. 拷贝构造函数(现代写法)


注:这里又一次感受到了复用的魅力(难道不是偷懒吗?)

3. 赋值运算符重载(现代写法)

版本1:



:这里就是复用拷贝构造函数 ,拿s去拷贝构造tmp,之后将tmp与*this 交换

版本2:


注:这里的实现就更简便了,在调用的时候就拿s去构造临时对象tmp,之后直接交换tmp*thistmp拿到*this的地址之后,因为它是临时对象,出作用域就自动销毁了。

完结!!!

相关推荐
z人间防沉迷k4 分钟前
高效查询:位图、B+树
开发语言·数据结构·笔记·python·算法
白总Server1 小时前
React-fiber架构
开发语言·网络·网络协议·golang·scala·核心·fiber
.小墨迹1 小时前
Python学习——执行python时,键盘按下ctrl+c,退出程序
linux·开发语言·python·学习·自动驾驶
蓝婷儿1 小时前
6个月Python学习计划 Day 1
开发语言·python·学习
AI+程序员在路上1 小时前
MIPI摄像头linux驱动开发步骤及说明
linux·c语言·开发语言·驱动开发
chicpopoo1 小时前
Python打卡DAY33
开发语言·python
Bugabooo1 小时前
python 打卡DAY27
开发语言·python
朱小勇本勇1 小时前
QT+R&SVisa控制LXI仪器
开发语言·qt
YUNYINGXIA2 小时前
Python实现Web请求与响应
开发语言·前端·python
玉带湖水位记录员2 小时前
Qt+线段拖曳示例代码
开发语言·c++·qt