【C++】String类基本接口介绍及模拟实现(多看英文文档)

string目录

如果你很赶时间,那么就直接看我本标题下的内容即可!!

一、STL简介

1.1什么是STL

1.2STL版本

1.3STL六大组件

1.4STL重要性

1.5如何学习STL

二、什么是string??(本质上是一个类)

三、string的类模板(什么?string居然利用了模板??)

三、string的三种构造(拷贝构造也是构造奥)

四、stirng的三种遍历方式

[4.1 [ ] + 下标(operator[ ]的重载函数)](#4.1 [ ] + 下标(operator[ ]的重载函数))

4.2基于范围for循环(C++11语法糖)

4.3迭代器遍历

五、string的迭代器(迭代器是一个类,封装了指针,模拟了指针的操作)

5.1begin接口和end接口

5.2const迭代器

5.3迭代器和指针的区别

六、string之capacity(resize,reserve,clear)8

[6.1resize(Resizes the string to a length of n characters)](#6.1resize(Resizes the string to a length of n characters))

6.2reserve预留空间(一般用于扩容)(不会改变size)

6.3clear(清空字符串)

[七、string之Element Access(元素访问)](#七、string之Element Access(元素访问))

八、string之modify(+=,append,insert,erase,swap)

8.1operator+=(最牛逼的尾插)

8.2append(尾部追加数据,但是没有+=牛逼)

8.3insert(任意位置插入)(一般不用,浪费时间)

8.4erase(任意位置删除)

[8.5 swap(是一个参数,和平常见到的普通的不一样)](#8.5 swap(是一个参数,和平常见到的普通的不一样))

九、string之operation操作函数(c_str,find,,substr)

9.1c_str(为了使得C++与C语言之间有接口,算是大使馆)

9.2find(查找字符串,里面也有npos)


如果你很赶时间,那么就直接看我本标题下的内容即可!!

当然,请看下面的列表,其中包含了C++中`std::string`类的常用成员函数和操作符,以及每个函数和操作符的简要描述和一个示例用法:

  1. `begin`: 得到指向字符串开头的Iterator
cpp 复制代码
std::string::iterator it = str.begin();
  1. `end`: 得到指向字符串结尾的Iterator
cpp 复制代码
std::string::iterator it_end = str.end();
  1. `size` (或 `length`): 得到字符串的大小(capacity是返回字符串开辟空间的大小)
cpp 复制代码
std::string str = "Hello";
std::cout << "Size: " << str.size() << std::endl;
  1. `empty`: 判断是否为空
cpp 复制代码
if (str.empty()) {
    std::cout << "String is empty." << std::endl;
}
  1. `operator[]`: 取第n个元素,相当于数组
cpp 复制代码
char firstChar = str[0];
  1. `c_str`: 取得C风格的const char* 字符串
cpp 复制代码
const char* cString = str.c_str();
  1. `data`: 取得字符串内容地址
cpp 复制代码
const char* data = str.data();
  1. `operator+=`: 字符串尾插操作符
cpp 复制代码
str1 += str2;
  1. `find`: 查找子串在字符串中的位置
cpp 复制代码
size_t found = str.find("World");
  1. `substr`: 得到子串
cpp 复制代码
std::string sub = str.substr(6, 5);
  1. `compare`: 比较字符串
cpp 复制代码
int result = str1.compare(str2);
if (result == 0) {
    std::cout << "Strings are equal." << std::endl;
}
  1. `operator+`: 字符串链接
cpp 复制代码
std::string result = str1 + str2;
  1. `operator==`: 判断是否相等
cpp 复制代码
if (str1 == str2) {
    std::cout << "Strings are equal." << std::endl;
}
  1. `operator!=`: 判断是否不等于
cpp 复制代码
if (str1 != str2) {
    std::cout << "Strings are not equal." << std::endl;
}
  1. `operator<`: 判断是否小于
cpp 复制代码
if (str1 < str2) {
    std::cout << "str1 is less than str2." << std::endl;
}
  1. `insert`: 插入字符
cpp 复制代码
str.insert(3, " inserted");
  1. `resize`: 重新分配空间
  • 描述:`resize` 函数用于更改字符串的大小,可以增加或减小字符串的长度。如果新的大小大于当前大小,新元素将被默认初始化。(三种情况)
cpp 复制代码
 std::string str = "Hello";
     str.resize(8); // 增加字符串大小
     std::cout << str << std::endl; // 输出 "Hello\0\0\0"
     
     str.resize(3); // 缩小字符串大小
     std::cout << str << std::endl; // 输出 "Hel"
  1. `reserve`: 预留空间
  • 描述:`reserve` 函数用于预留字符串的存储空间,以避免在后续操作中重新分配内存。这对于减少动态内存分配的开销很有用。
cpp 复制代码
 std::string str;
     str.reserve(100); // 预留至少能容纳100个字符的空间
     str = "Hello, World!"; // 不会触发重新分配内存

请注意,以上示例仅供参考


一、STL简介

1.1什么是STL

STL (standard template libaray - 标准模板库):是C++标准库的重要组成部分,不仅是一个可复用的组件库,而且是一个包罗数据结构与算法的软件框架

1.2STL版本

原始版本:
Alexander Stepanov 、 Meng Lee 在惠普实验室完成的原始版本,本着开源精神,他们声明允许任何人任意
运用、拷贝、修改、传播、商业使用这些代码,无需付费。唯一的条件就是也需要向原始版本一样做开源使
用。 HP 版本 -- 所有 STL 实现版本的始祖。
P. J. 版本:
由 P. J. Plauger 开发,继承自 HP 版本,被 Windows Visual C++ 采用,不能公开或修改,缺陷:可读性比较低,
符号命名比较怪异。
RW 版本:
由 Rouge Wage 公司开发,继承自 HP 版本,被 C+ + Builder 采用,不能公开或修改,可读性一般。
SGI 版本:
由 Silicon Graphics Computer Systems , Inc 公司开发,继承自 HP 版 本。被 GCC(Linux) 采用,可移植性好,
可公开、修改甚至贩卖,从命名风格和编程 风格上看,阅读性非常高。 我们后面学习 STL 要阅读部分源代码,
主要参考的就是这个版本。

1.3STL六大组件

STL 共有容器、配接器、迭代器、空间配装器、算法、仿函数六大组件,其内部包含的具体内容如下:

1.4STL重要性

网上有句话说:"不懂STL,不要说你会C++"。STL是C++中的优秀作品,有了它的陪伴,许多底层的数据结构以及算法都不需要自己重新造轮子,直接使用即可,大大提高了解题和开发的效率;因此,STL 在笔试、面试以及工作中其都是一个被重点考察的对象

1.5如何学习STL

告诉大家一个英文文档的查询接口网站:cplusplus.com - The C++ Resources Network

(注:cplusplus 更新之后需要注册才能使用,我们可以点击右上角的 "Legacy version" 回到旧版,个人认为旧版的使用体验比新版要好),因为 cplusplus 更适合初学者,我们学习STL过程中遇到的任何函数接口、函数参数等等方面的内容都可以在 cplusplus 上通过搜索解决

阅读优秀的C++书籍:C++是一门比较难的语言,其中的细节非常多,我现在偶尔也会看STL源码剖析

想要电子版的可以来私聊我!!


二、什么是string??(本质上是一个类)

C语言中,字符串是以'\0'结尾的若干个字符的集合,为了操作方便,C语言 string.h 头文件提供了一些系列的库函数,但是这些库函数与字符串是分离开的,不符合面向对象的思想,而且底层空间需要用户自己管理,稍不留神可能还会越界访问。

基于上面这些原因,C++标准库提供了 string 类,string 类中提供了各种函数接口,比如类的六个默认成员函数、字符串插入删除、运算符重载等等,我们可以使用 string 来实例化对象,然后通过 string 的各种接口来完成对该对象的各种操作

string 类的实现框架大概如下:

cpp 复制代码
namespace std {
	template<class T>
	class string {
	public:
		// string 的各种成员函数
		
	private:
		T* _str;
		size_t _size;
		size_t _capacity;
		//string 的其他成员变量,比如npos
	};
}

注:严格来说 string 其实并不属于 STL,因为 string 出现的时间比 STL 要早(这也是为什么出现了.length(),和.size()俩个计算长度的原因),但是由于 string 的各种接口和 STL 中其他容器的接口非常类似,所以我们可以把 string 也当作 STL 的一种,放在一起学习


三、string的类模板(什么?string居然利用了模板??)

我们打开文档网址搜索string后会发现,string 其实是 basic_string 类模板使用字符类型 char 实例化得到的一个类(下面的英文一一定得耐着性子看完)

其实正是一个动态增长字符数组

那么什么是basic_string呢??

basic_string 是一个可以使用任意字符类型来实例化的类模板:

实在看不懂,我还是利用了翻译软件,发现居然是泛化!!!你问我什么是泛化?快去看我的模板博客!!模板初阶

所以,我们平时使用的 string 本质上是 basic_string<char>,我们不用自己显式实例化是因为 string 内部进行了 typedef:

typedef basic_string<char, char_traits, allocator> string


三、string的三种构造(拷贝构造也是构造奥)

string 提供了很多构造函数,我们只需要掌握其中最常用的几个就可以,其余的如果有需要再查询文档:(最常用的就是三个

|--------------------------------|---------------------------|
| (constructor)函数名称 | 功能说明 |
| string()(重点) | 构造空的string类对象,即空字符串 |
| string(constchar*s)(重点) | 用C-string来构造string类对象 |
| string(size_tn,charc) | string类对象中包含n个字符c |
| string(conststring&s)(重点) | 拷贝构造函数 |


四、stirng的三种遍历方式

4.1 [ ] + 下标(operator[ ]的重载函数)

我们现在先不介绍 [ ] 怎么使用,我们先对 [ ] 的重载实现和优点做一个深入了解

在数组中,我们也可以用[ ]进行数据访问,但是他对于越界读和越界写的边界感很模糊,以下是我们自己写的数组重载方括号函数:

cpp 复制代码
T& operator[](int index) {
        // 使用assert检查越界
        assert(index >= 0 && index < size);
        return data[index];
    }

这样更加保证了C++语言的封装性,更好更优秀;在string库中,也对方括号进行了重载

string中方括号的重载与上方类似,就是把assert的范围改成以下即可

index >= 0 && index < data.size()

总的来说,我们利用 [ ] 遍历访问的方式如下:

cpp 复制代码
void test_string2()
{
	string s1("1234");
	//需求:让对象s1里面的每个字符都加1

	//如果要让字符串的每个字符都加1,肯定离不开遍历,下面学习三种遍历string的方式。
	//1.下标 + []
	for (size_t i = 0; i < s1.size(); i++)
	{
		s1[i]++;//本质上
	}
	cout << s1 << endl;//GB2312兼容ascll编码,所以++后的结果为2345.
}

4.2基于范围for循环(C++11语法糖)

cpp 复制代码
void test_string2()
{
	//2.范围for
	for (auto& ch : s1)//自动推导s1数组的每个元素后,用元素的引用作为迭代变量,通过引用达到修改s1数组元素的目的。
	{
		ch++;
	}
	cout << s1 << endl;
	//在上面这种需求下,范围for看起来似乎更为方便	
}

以上俩张图片摘自小羊C++入门范围for的讲解中

4.3迭代器遍历

[ ]只是一朝鲜,要想通用还得看我迭代器!

迭代器在使用的方式和行为上比较像指针,但是它和指针还是有区别的,它既有可能是指针,又有可能不是指针。在定义时要指定类域,譬如下面代码it1的定义,就需要指定类域里面的iterator类型。从下面代码可以看出,it1不仅可以访问而且还可以修改对象s1的内容。并且除string外,我们头疼的list也可以照常使用iterator,这也验证了iterator的普适性

cpp 复制代码
list<int> lt;
	list<int>::iterator ltit = lt.begin();
	while (ltit != lt.end())
	{
		cout << *ltit << " ";
		ltit++;
	}
	cout << endl;

所以我们在遍历字符串的时候,利用begin与end接口:

cpp 复制代码
int main()
{
	string s1("i love gao_peng_yan");
	string::iterator it1=s1.begin();
	while(it1!=s1.end())
	{
		cout << *it1 ;
		it1++;//别忘了迭代器++,要不然走不后去
	}

	return 0;
}

迭代器这么重要的知识,放在遍历的小标题里可太委屈了,所以客官请往下看!!


五、string的迭代器(迭代器是一个类,封装了指针,模拟了指针的操作)

Iterators 是C++中的迭代器,具有普适性,对于大多数容器都可以适用,大家可以把它当成指针来理解,当然,并不是所有迭代器的底层都是用指针实现的:

cpp 复制代码
typedef char* iterator;  //简单理解string中的迭代器

实际代码写法:

cpp 复制代码
string::iterator it1=s1.begin();//(it1的类型是属于string类域当中的)

|----------|--------------------------------------|
| 函数名称 | 功能说明 |
| begin() | 返回一个指向字符串中第一个字符的迭代器 |
| end() | 返回一个指向字符串最后一个字符下一个位置('\0')的迭代器 |
| rbegin() | 反向开始,返回一个指向字符串最后一个字符下一个位置('\0')的迭代器 |
| rend() | 反向开始,返回一个指向字符串中第一个字符的迭代器 |

这里有一个end迭代器在哪里的误区,我画个图出来给大家看:

5.1begin接口和end接口

在我们遍历的时候,我们需要用到接口begin与end 通过查阅文档,我么们发现他们的返回值都是迭代器。begin()会返回获取第一个字符的迭代器,end()会返回最后一个字符下一个位置的迭代器,一般情况下就是标识字符\0。其实在使用上就是类似于指针,解引用迭代器就可以获得相应的字符,然后就可以对字符进行操作。

所以我们在遍历字符串的时候,利用begin与end接口:

cpp 复制代码
int main()
{
	string s1("i love gao_peng_yan");
	string::iterator it1=s1.begin();
	while(it1!=s1.end())
	{
		cout << *it1 ;
		it1++;//别忘了迭代器++,要不然走不后去
	}

	return 0;
}

5.2const迭代器

当我们在字符串前面加上const之后,我们发现的代码居然报错了,const对象使用了非const对象的迭代器,查阅文档发现,确实有const迭代器

所以我们对代码进行修改:

嗷嗷通过!!!

小羊注:

const string::iterator it1=s1.begin();

string::const_iterator it1=s1.begin();

这俩种截然不同的写法:

对于第一个迭代器,意思是不修改迭代器的指向,但是我们一般都不这么写,因为迭代器本来就是要往后走的。

对于第二个迭代器,意思是不修改迭代器访问元素的内容

5.3迭代器和指针的区别

迭代器(Iterator)和指针(Pointer)是两种不同的概念,尽管它们在某些方面有一些相似之处,但它们在不同的编程语境中使用,具有不同的特性和用途。以下是它们之间的主要区别:

  1. 用途:
  • 迭代器:迭代器是一种抽象的数据访问方式,通常用于遍历集合(如数组、列表、映射等)中的元素,迭代器提供了一种通用的方式来访问集合中的元素,不需要了解底层数据结构。

  • 指针:指针是一种变量类型,它存储了内存中某个对象的地址。指针通常用于在低级语言(如C和C++)中进行内存操作,包括直接访问内存地址、动态分配内存等。

  1. 安全性:
  • 迭代器:迭代器通常被设计为更安全的方式来遍历集合,因为它们提供了一些保护机制,以避免越界访问和内存错误。不同编程语言中的迭代器可能具有不同的安全性特性。

  • 指针:指针在低级语言中使用时,容易引发内存错误,如空指针引用、越界访问等问题。因此,使用指针需要更谨慎,需要程序员自行确保安全性。

  1. 抽象程度:
  • 迭代器:迭代器提供了一种更高级别的抽象,隐藏了底层数据结构的细节。这使得代码更易读和维护,并且有助于降低程序中的错误。

  • 指针:指针是一种低级别的抽象,直接操作内存地址,需要程序员了解内存布局和数据结构的细节。

  1. 语言相关性:
  • 迭代器:迭代器通常与高级编程语言(如Python、C#、Java等)一起使用,这些语言提供了内置的迭代器或集合遍历机制。

  • 指针:指针更常见于低级编程语言(如C和C++),这些语言直接支持内存操作,因此需要程序员更深入地了解计算机硬件和内存管理。


六、string之capacity(resize,reserve,clear)8

string 中提供了一些对容量进行操作的函数:

函数名称 函数功能
size() 返回字符串的长度
capacity 返回字符串的容量
empty 判断字符串是否为空

注意:size和capacity是完全俩个不同的函数接口


6.1resize(Resizes the string to a length of n characters)

resize 函数用来调整字符串大小,它一共分为三种情况:

  • n 小于原字符串的 size,此时 resize 函数会将原字符串的 size 改为 n,也会改变字符串初始值,但不会改变 capacity
  • n 大于原字符串的 size,但小于其 capacity,此时 resize 函数会将 size 后面的空间全部设置为字符 c
  • n 大于原字符串的 capacity,此时 resize 函数会将原字符串扩容,然后将size 后面的空间全部设置为字符 c

情况一(发生截断):

情况二(不扩容,但可以进行赋值):

将string的size变成了13,但是并没有扩容

情况三(扩容,且进行赋值):


6.2reserve预留空间(一般用于扩容)(不会改变size)

reserve 用来扩容与预留空间,相当于C语言中的 realloc 函数,它分两种情况:

  • n 大于原字符串的 capacity,此时 reserve 函数会将 capacity 扩容到 n;
  • n 小于等于原字符串的 capacity,标准未规定是否要缩容 (VS下不缩容);
cpp 复制代码
string s1("xiao_yang");
    cout << s1.size() <<endl;
    cout << s1.capacity() << endl << endl;

    s1.reserve(100);//预留100的空间
    cout << "预留后的size与capacity" << endl;
    cout << s1.size() << endl;
    cout << s1.capacity() << endl;

小羊注:reserve 函数不会改变原字符串的 size 以及数据


6.3clear(清空字符串)

clear 函数用来清空字符串,即将 size 改为0,至于是否会改变 capacity,标准也未规定:


七、string之Element Access(元素访问)

string 提供了一些接口来获取字符串中的单个字符:

operator[ ](在上方string的遍历中已经有了详细讲解,这里再回顾回顾)

运算符重载的一种,我们可以通过 opetator[] 来获取与修改字符串中具体下标的字符:

这里虽然正确输出了,但是为什么箭头这里会有提示呢??

通过查阅文档可知:[ ] 的参数是size_t 也就是unsigned int 所以这里写 int 是不合理的

八、string之modify(+=,append,insert,erase,swap)

string 提供了一些列用来修改字符串内容的函数:

8.1operator+=(最牛逼的尾插)

operator+= 是运算符重载的一种,用于向字符串尾插数据,支持尾插一个字符串、尾插一个字符数组以及尾插一个字符:

cpp 复制代码
string s1("xiao_yang");
    string s2="   hehe   ";

    s1+=s2;cout << s1 << endl;
    s1+="abcabc";cout << s1 << endl;
    s1+='c';cout << s1 << endl;

8.2append(尾部追加数据,但是没有+=牛逼)

append 的功能和 operator+= 的功能类似,都是向字符串尾部追加数据:

8.3insert(任意位置插入)(一般不用,浪费时间)

insert 函数用于向在字符串的 pos 处插入数据:

cpp 复制代码
#include <iostream>
#include <string>

int main() {
    std::string original_string = "Hello, world!";
    
    // 在字符串的指定位置插入字符或子字符串
    original_string.insert(7, "there, ");
    std::cout << original_string << std::endl;
    // 输出: "Hello, there, world!"

    // 在字符串的末尾插入字符或子字符串
    original_string.insert(original_string.length(), " How are you?");
    std::cout << original_string << std::endl;
    // 输出: "Hello, there, world! How are you?"

    // 在字符串的开头插入字符或子字符串
    original_string.insert(0, "Hi, ");
    std::cout << original_string << std::endl;
    // 输出: "Hi, Hello, there, world! How are you?"

    return 0;
}

8.4erase(任意位置删除)

erase 用来从 pos 位置开始向后删除 len 个字符:

这里的npos是一个很有讲究的东西!

这里npos特殊就特殊在它的类型值是size_t 不是简单的int 在上方erase的第一个接口len后面,len 的缺省值是 npos,虽然 npos 的值为-1,但是 npos 是无符号数,所以 npos 其实是无符号整形的最大值;所以,如果我们不知道 len,那么 erase 函数会一直往后删除,直到遇到 '\0'



8.5 swap(是一个参数,和平常见到的普通的不一样)

swap 函用于交换两个字符串的内容,包括指向的字符数组、有效数据个数以及容量大小:

cpp 复制代码
string s1("dsjnaiodioasndosdaiosandsaoindsisdaoidnsaionds0asnisdanas");
    string s2;
    cout << "s1原来的size " << s1.size() << endl;
    cout << "s1原来的capacity " << s1.capacity() << endl;
    cout << "s2原来的size " << s2.size() << endl;
    cout << "s2原来的capacity " << s2.capacity() << endl;

    s1.swap(s2);
    cout << endl << endl << endl;
    cout << "s1交换后的size " << s1.size() << endl;
    cout << "s1交换后的capacity " << s1.capacity() << endl;
    cout << "s2交换后的size " << s2.size() << endl;
    cout << "s2交换后的capacity " << s2.capacity() << endl;

九、string之operation操作函数(c_str,find,,substr)

string 提供了系列对 string 进行操作的函数:

9.1c_str(为了使得C++与C语言之间有接口,算是大使馆)

在某些场景中只支持对C形式的字符串,即字符数组进行操作,比如网络传输、fopen,而不支持对C++中的 string 对象进行操作,所以 string 提供了c_str,用于返回C形式的字符串:

cpp 复制代码
#include<iostream>
#include<string.h>
using namespace std;
int main()
{
    string s1("haha");
    cout << strlen(s1.c_str()) << endl;
    return 0;
}

9.2find(查找字符串,里面也有npos)

find 用于返回 一个字符或一个字符数组或一个string对象 在 string 中首次出现的位置,如果找不到就返回 npos:

rfind,findfirstof,substr,流插入重载,getline,模拟实现,未完待续...........

十。。。。(未完待续)

相关推荐
捕鲸叉5 小时前
创建线程时传递参数给线程
开发语言·c++·算法
A charmer5 小时前
【C++】vector 类深度解析:探索动态数组的奥秘
开发语言·c++·算法
Peter_chq5 小时前
【操作系统】基于环形队列的生产消费模型
linux·c语言·开发语言·c++·后端
青花瓷6 小时前
C++__XCode工程中Debug版本库向Release版本库的切换
c++·xcode
幺零九零零8 小时前
【C++】socket套接字编程
linux·服务器·网络·c++
捕鲸叉8 小时前
MVC(Model-View-Controller)模式概述
开发语言·c++·设计模式
Dola_Pan9 小时前
C++算法和竞赛:哈希算法、动态规划DP算法、贪心算法、博弈算法
c++·算法·哈希算法
yanlou2339 小时前
KMP算法,next数组详解(c++)
开发语言·c++·kmp算法
小林熬夜学编程9 小时前
【Linux系统编程】第四十一弹---线程深度解析:从地址空间到多线程实践
linux·c语言·开发语言·c++·算法
阿洵Rain10 小时前
【C++】哈希
数据结构·c++·算法·list·哈希算法