【C++】String类基本接口介绍及模拟实现(多看英文文档)

string目录

如果你很赶时间,那么就直接看我本标题下的内容即可!!

一、STL简介

1.1什么是STL

1.2STL版本

1.3STL六大组件

1.4STL重要性

1.5如何学习STL

二、什么是string??(本质上是一个类)

三、string的类模板(什么?string居然利用了模板??)

三、string的三种构造(拷贝构造也是构造奥)

四、stirng的三种遍历方式

[4.1 [ ] + 下标(operator[ ]的重载函数)](#4.1 [ ] + 下标(operator[ ]的重载函数))

4.2基于范围for循环(C++11语法糖)

4.3迭代器遍历

五、string的迭代器(迭代器是一个类,封装了指针,模拟了指针的操作)

5.1begin接口和end接口

5.2const迭代器

5.3迭代器和指针的区别

六、string之capacity(resize,reserve,clear)8

[6.1resize(Resizes the string to a length of n characters)](#6.1resize(Resizes the string to a length of n characters))

6.2reserve预留空间(一般用于扩容)(不会改变size)

6.3clear(清空字符串)

[七、string之Element Access(元素访问)](#七、string之Element Access(元素访问))

八、string之modify(+=,append,insert,erase,swap)

8.1operator+=(最牛逼的尾插)

8.2append(尾部追加数据,但是没有+=牛逼)

8.3insert(任意位置插入)(一般不用,浪费时间)

8.4erase(任意位置删除)

[8.5 swap(是一个参数,和平常见到的普通的不一样)](#8.5 swap(是一个参数,和平常见到的普通的不一样))

九、string之operation操作函数(c_str,find,,substr)

9.1c_str(为了使得C++与C语言之间有接口,算是大使馆)

9.2find(查找字符串,里面也有npos)


如果你很赶时间,那么就直接看我本标题下的内容即可!!

当然,请看下面的列表,其中包含了C++中`std::string`类的常用成员函数和操作符,以及每个函数和操作符的简要描述和一个示例用法:

  1. `begin`: 得到指向字符串开头的Iterator
cpp 复制代码
std::string::iterator it = str.begin();
  1. `end`: 得到指向字符串结尾的Iterator
cpp 复制代码
std::string::iterator it_end = str.end();
  1. `size` (或 `length`): 得到字符串的大小(capacity是返回字符串开辟空间的大小)
cpp 复制代码
std::string str = "Hello";
std::cout << "Size: " << str.size() << std::endl;
  1. `empty`: 判断是否为空
cpp 复制代码
if (str.empty()) {
    std::cout << "String is empty." << std::endl;
}
  1. `operator[]`: 取第n个元素,相当于数组
cpp 复制代码
char firstChar = str[0];
  1. `c_str`: 取得C风格的const char* 字符串
cpp 复制代码
const char* cString = str.c_str();
  1. `data`: 取得字符串内容地址
cpp 复制代码
const char* data = str.data();
  1. `operator+=`: 字符串尾插操作符
cpp 复制代码
str1 += str2;
  1. `find`: 查找子串在字符串中的位置
cpp 复制代码
size_t found = str.find("World");
  1. `substr`: 得到子串
cpp 复制代码
std::string sub = str.substr(6, 5);
  1. `compare`: 比较字符串
cpp 复制代码
int result = str1.compare(str2);
if (result == 0) {
    std::cout << "Strings are equal." << std::endl;
}
  1. `operator+`: 字符串链接
cpp 复制代码
std::string result = str1 + str2;
  1. `operator==`: 判断是否相等
cpp 复制代码
if (str1 == str2) {
    std::cout << "Strings are equal." << std::endl;
}
  1. `operator!=`: 判断是否不等于
cpp 复制代码
if (str1 != str2) {
    std::cout << "Strings are not equal." << std::endl;
}
  1. `operator<`: 判断是否小于
cpp 复制代码
if (str1 < str2) {
    std::cout << "str1 is less than str2." << std::endl;
}
  1. `insert`: 插入字符
cpp 复制代码
str.insert(3, " inserted");
  1. `resize`: 重新分配空间
  • 描述:`resize` 函数用于更改字符串的大小,可以增加或减小字符串的长度。如果新的大小大于当前大小,新元素将被默认初始化。(三种情况)
cpp 复制代码
 std::string str = "Hello";
     str.resize(8); // 增加字符串大小
     std::cout << str << std::endl; // 输出 "Hello\0\0\0"
     
     str.resize(3); // 缩小字符串大小
     std::cout << str << std::endl; // 输出 "Hel"
  1. `reserve`: 预留空间
  • 描述:`reserve` 函数用于预留字符串的存储空间,以避免在后续操作中重新分配内存。这对于减少动态内存分配的开销很有用。
cpp 复制代码
 std::string str;
     str.reserve(100); // 预留至少能容纳100个字符的空间
     str = "Hello, World!"; // 不会触发重新分配内存

请注意,以上示例仅供参考


一、STL简介

1.1什么是STL

STL (standard template libaray - 标准模板库):是C++标准库的重要组成部分,不仅是一个可复用的组件库,而且是一个包罗数据结构与算法的软件框架

1.2STL版本

原始版本:
Alexander Stepanov 、 Meng Lee 在惠普实验室完成的原始版本,本着开源精神,他们声明允许任何人任意
运用、拷贝、修改、传播、商业使用这些代码,无需付费。唯一的条件就是也需要向原始版本一样做开源使
用。 HP 版本 -- 所有 STL 实现版本的始祖。
P. J. 版本:
由 P. J. Plauger 开发,继承自 HP 版本,被 Windows Visual C++ 采用,不能公开或修改,缺陷:可读性比较低,
符号命名比较怪异。
RW 版本:
由 Rouge Wage 公司开发,继承自 HP 版本,被 C+ + Builder 采用,不能公开或修改,可读性一般。
SGI 版本:
由 Silicon Graphics Computer Systems , Inc 公司开发,继承自 HP 版 本。被 GCC(Linux) 采用,可移植性好,
可公开、修改甚至贩卖,从命名风格和编程 风格上看,阅读性非常高。 我们后面学习 STL 要阅读部分源代码,
主要参考的就是这个版本。

1.3STL六大组件

STL 共有容器、配接器、迭代器、空间配装器、算法、仿函数六大组件,其内部包含的具体内容如下:

1.4STL重要性

网上有句话说:"不懂STL,不要说你会C++"。STL是C++中的优秀作品,有了它的陪伴,许多底层的数据结构以及算法都不需要自己重新造轮子,直接使用即可,大大提高了解题和开发的效率;因此,STL 在笔试、面试以及工作中其都是一个被重点考察的对象

1.5如何学习STL

告诉大家一个英文文档的查询接口网站:cplusplus.com - The C++ Resources Network

(注:cplusplus 更新之后需要注册才能使用,我们可以点击右上角的 "Legacy version" 回到旧版,个人认为旧版的使用体验比新版要好),因为 cplusplus 更适合初学者,我们学习STL过程中遇到的任何函数接口、函数参数等等方面的内容都可以在 cplusplus 上通过搜索解决

阅读优秀的C++书籍:C++是一门比较难的语言,其中的细节非常多,我现在偶尔也会看STL源码剖析

想要电子版的可以来私聊我!!


二、什么是string??(本质上是一个类)

C语言中,字符串是以'\0'结尾的若干个字符的集合,为了操作方便,C语言 string.h 头文件提供了一些系列的库函数,但是这些库函数与字符串是分离开的,不符合面向对象的思想,而且底层空间需要用户自己管理,稍不留神可能还会越界访问。

基于上面这些原因,C++标准库提供了 string 类,string 类中提供了各种函数接口,比如类的六个默认成员函数、字符串插入删除、运算符重载等等,我们可以使用 string 来实例化对象,然后通过 string 的各种接口来完成对该对象的各种操作

string 类的实现框架大概如下:

cpp 复制代码
namespace std {
	template<class T>
	class string {
	public:
		// string 的各种成员函数
		
	private:
		T* _str;
		size_t _size;
		size_t _capacity;
		//string 的其他成员变量,比如npos
	};
}

注:严格来说 string 其实并不属于 STL,因为 string 出现的时间比 STL 要早(这也是为什么出现了.length(),和.size()俩个计算长度的原因),但是由于 string 的各种接口和 STL 中其他容器的接口非常类似,所以我们可以把 string 也当作 STL 的一种,放在一起学习


三、string的类模板(什么?string居然利用了模板??)

我们打开文档网址搜索string后会发现,string 其实是 basic_string 类模板使用字符类型 char 实例化得到的一个类(下面的英文一一定得耐着性子看完)

其实正是一个动态增长字符数组

那么什么是basic_string呢??

basic_string 是一个可以使用任意字符类型来实例化的类模板:

实在看不懂,我还是利用了翻译软件,发现居然是泛化!!!你问我什么是泛化?快去看我的模板博客!!模板初阶

所以,我们平时使用的 string 本质上是 basic_string<char>,我们不用自己显式实例化是因为 string 内部进行了 typedef:

typedef basic_string<char, char_traits, allocator> string


三、string的三种构造(拷贝构造也是构造奥)

string 提供了很多构造函数,我们只需要掌握其中最常用的几个就可以,其余的如果有需要再查询文档:(最常用的就是三个

|--------------------------------|---------------------------|
| (constructor)函数名称 | 功能说明 |
| string()(重点) | 构造空的string类对象,即空字符串 |
| string(constchar*s)(重点) | 用C-string来构造string类对象 |
| string(size_tn,charc) | string类对象中包含n个字符c |
| string(conststring&s)(重点) | 拷贝构造函数 |


四、stirng的三种遍历方式

4.1 [ ] + 下标(operator[ ]的重载函数)

我们现在先不介绍 [ ] 怎么使用,我们先对 [ ] 的重载实现和优点做一个深入了解

在数组中,我们也可以用[ ]进行数据访问,但是他对于越界读和越界写的边界感很模糊,以下是我们自己写的数组重载方括号函数:

cpp 复制代码
T& operator[](int index) {
        // 使用assert检查越界
        assert(index >= 0 && index < size);
        return data[index];
    }

这样更加保证了C++语言的封装性,更好更优秀;在string库中,也对方括号进行了重载

string中方括号的重载与上方类似,就是把assert的范围改成以下即可

index >= 0 && index < data.size()

总的来说,我们利用 [ ] 遍历访问的方式如下:

cpp 复制代码
void test_string2()
{
	string s1("1234");
	//需求:让对象s1里面的每个字符都加1

	//如果要让字符串的每个字符都加1,肯定离不开遍历,下面学习三种遍历string的方式。
	//1.下标 + []
	for (size_t i = 0; i < s1.size(); i++)
	{
		s1[i]++;//本质上
	}
	cout << s1 << endl;//GB2312兼容ascll编码,所以++后的结果为2345.
}

4.2基于范围for循环(C++11语法糖)

cpp 复制代码
void test_string2()
{
	//2.范围for
	for (auto& ch : s1)//自动推导s1数组的每个元素后,用元素的引用作为迭代变量,通过引用达到修改s1数组元素的目的。
	{
		ch++;
	}
	cout << s1 << endl;
	//在上面这种需求下,范围for看起来似乎更为方便	
}

以上俩张图片摘自小羊C++入门范围for的讲解中

4.3迭代器遍历

\]只是一朝鲜,要想通用还得看我迭代器! 迭代器在使用的方式和行为上比较像指针,但是它和指针还是有区别的,它既有可能是指针,又有可能不是指针。在定义时要指定类域,譬如下面代码it1的定义,就需要指定类域里面的iterator类型。从下面代码可以看出,it1不仅可以访问而且还可以修改对象s1的内容。**并且除string外,我们头疼的list也可以照常使用iterator,这也验证了iterator的普适性**。 ```cpp list lt; list::iterator ltit = lt.begin(); while (ltit != lt.end()) { cout << *ltit << " "; ltit++; } cout << endl; ``` 所以我们在遍历字符串的时候,利用begin与end接口: ```cpp int main() { string s1("i love gao_peng_yan"); string::iterator it1=s1.begin(); while(it1!=s1.end()) { cout << *it1 ; it1++;//别忘了迭代器++,要不然走不后去 } return 0; } ``` 迭代器这么重要的知识,放在遍历的小标题里可太委屈了,所以客官请往下看!! *** ** * ** *** ## 五、string的迭代器(迭代器是一个类,封装了指针,模拟了指针的操作) Iterators 是C++中的迭代器,具有普适性,对于大多数容器都可以适用,大家可以把它当成指针来理解,当然,并不是所有迭代器的底层都是用指针实现的: ```cpp typedef char* iterator; //简单理解string中的迭代器 ``` 实际代码写法: ```cpp string::iterator it1=s1.begin();//(it1的类型是属于string类域当中的) ``` ![](https://file.jishuzhan.net/article/1705409804920426498/83627ee8a4a2498f8ef1467b4fbc51a2.png) |----------|--------------------------------------| | **函数名称** | **功能说明** | | begin() | 返回一个指向字符串中第一个字符的迭代器 | | end() | 返回一个指向字符串**最后一个字符下一个位置**('\\0')的迭代器 | | rbegin() | 反向开始,返回一个指向字符串最后一个字符下一个位置('\\0')的迭代器 | | rend() | 反向开始,返回一个指向字符串中第一个字符的迭代器 | 这里有一个end迭代器在哪里的误区,我画个图出来给大家看: ![](https://file.jishuzhan.net/article/1705409804920426498/8986cc39a5e94c6c88e9da82a77b09b8.png) ### 5.1begin接口和end接口 在我们遍历的时候,我们需要用到接口begin与end 通过查阅文档,我么们发现他们的返回值都是迭代器。begin()会返回获取第一个字符的迭代器,end()会返回最后一个字符下一个位置的迭代器,一般情况下就是标识字符\\0。其实在使用上就是类似于指针,解引用迭代器就可以获得相应的字符,然后就可以对字符进行操作。 ![](https://file.jishuzhan.net/article/1705409804920426498/1bb3306044534fe08e001d6ca74f811c.png) ![](https://file.jishuzhan.net/article/1705409804920426498/c676b7000d3142cd9e5b151613258970.png) 所以我们在遍历字符串的时候,利用begin与end接口: ```cpp int main() { string s1("i love gao_peng_yan"); string::iterator it1=s1.begin(); while(it1!=s1.end()) { cout << *it1 ; it1++;//别忘了迭代器++,要不然走不后去 } return 0; } ``` ### 5.2const迭代器 ![](https://file.jishuzhan.net/article/1705409804920426498/8b4510523e7d41cc8dc00868ff630d26.png) 当我们在字符串前面加上const之后,我们发现的代码居然报错了,const对象使用了非const对象的迭代器,查阅文档发现,确实有const迭代器 ![](https://file.jishuzhan.net/article/1705409804920426498/090db224bfad4e4db7ad7a697e5f2d5f.png) 所以我们对代码进行修改: ![](https://file.jishuzhan.net/article/1705409804920426498/2859593f0a454d1d93188e79e8ea4010.png) 嗷嗷通过!!! 小羊注: > const string::iterator it1=s1.begin(); > > string::const_iterator it1=s1.begin(); 这俩种截然不同的写法: 对于第一个迭代器,意思是不修改迭代器的指向,但是我们一般都不这么写,因为迭代器本来就是要往后走的。 对于第二个迭代器,意思是**不修改迭代器访问元素的内容**。 ![](https://file.jishuzhan.net/article/1705409804920426498/b8279f7992264b2b878905e17ec0d199.png) ### 5.3迭代器和指针的区别 迭代器(Iterator)和指针(Pointer)是两种不同的概念,尽管它们在某些方面有一些相似之处,但它们在不同的编程语境中使用,具有不同的特性和用途。以下是它们之间的主要区别: > 1. 用途: > > - 迭代器:迭代器是一种抽象的数据访问方式,通常用于遍历集合(如数组、列表、映射等)中的元素,迭代器提供了一种通用的方式来访问集合中的元素,不需要了解底层数据结构。 > > - 指针:指针是一种变量类型,它存储了内存中某个对象的地址。指针通常用于在低级语言(如C和C++)中进行内存操作,包括直接访问内存地址、动态分配内存等。 > > 2. 安全性: > > - 迭代器:迭代器通常被设计为更安全的方式来遍历集合,因为它们提供了一些保护机制,以避免越界访问和内存错误。不同编程语言中的迭代器可能具有不同的安全性特性。 > > - 指针:指针在低级语言中使用时,容易引发内存错误,如空指针引用、越界访问等问题。因此,使用指针需要更谨慎,需要程序员自行确保安全性。 > > 3. 抽象程度: > > - 迭代器:迭代器提供了一种更高级别的抽象,隐藏了底层数据结构的细节。这使得代码更易读和维护,并且有助于降低程序中的错误。 > > - 指针:指针是一种低级别的抽象,直接操作内存地址,需要程序员了解内存布局和数据结构的细节。 > > 4. 语言相关性: > > - 迭代器:迭代器通常与高级编程语言(如Python、C#、Java等)一起使用,这些语言提供了内置的迭代器或集合遍历机制。 > > - 指针:指针更常见于低级编程语言(如C和C++),这些语言直接支持内存操作,因此需要程序员更深入地了解计算机硬件和内存管理。 *** ** * ** *** ## 六、string之capacity(resize,reserve,clear)8 string 中提供了一些对容量进行操作的函数: ![](https://file.jishuzhan.net/article/1705409804920426498/6bb5ccf5acb44084b4477b979737c317.png) | 函数名称 | 函数功能 | |----------|-----------| | size() | 返回字符串的长度 | | capacity | 返回字符串的容量 | | empty | 判断字符串是否为空 | 注意:size和capacity是完全俩个不同的函数接口 ![](https://file.jishuzhan.net/article/1705409804920426498/f0ee60911a7841ab834701dff1a653b0.png) *** ** * ** *** ### 6.1resize(Resizes the string to a length of *n* characters) ![](https://file.jishuzhan.net/article/1705409804920426498/6935879e66714931ad239e0a16f5491f.png) resize 函数用来调整字符串大小,它一共分为三种情况: ![](https://file.jishuzhan.net/article/1705409804920426498/0e1be9de3b1847c892fad3c3e46e835e.png) > * n 小于原字符串的 size,此时 resize 函数会将原字符串的 size 改为 n,也会改变字符串初始值,但不会改变 capacity > * n 大于原字符串的 size,但小于其 capacity,此时 resize 函数会将 size 后面的空间全部设置为字符 c > * n 大于原字符串的 capacity,此时 resize 函数会将原字符串扩容,然后将size 后面的空间全部设置为字符 c **情况一(发生截断):** ![](https://file.jishuzhan.net/article/1705409804920426498/83f8157da1ff429395b196faa09bf38c.png) **情况二(不扩容,但可以进行赋值):** **将string的size变成了13,但是并没有扩容** ![](https://file.jishuzhan.net/article/1705409804920426498/144c80fc2b4b42059ac8187fb7dadfe5.png) **情况三(扩容,且进行赋值):** ![](https://file.jishuzhan.net/article/1705409804920426498/8ebeb4c9a24a4a3ca079bc97d5274ea7.png) *** ** * ** *** ### **6.2reserve预留空间(一般用于扩容)(不会改变size)** ![](https://file.jishuzhan.net/article/1705409804920426498/81b8e83c0b284be59bdbb7014e7c683c.png) reserve 用来扩容与预留空间,相当于C语言中的 realloc 函数,它分两种情况: > * n 大于原字符串的 capacity,此时 reserve 函数会将 capacity 扩容到 n; > * n 小于等于原字符串的 capacity,标准未规定是否要缩容 (VS下不缩容); ```cpp string s1("xiao_yang"); cout << s1.size() < #include int main() { std::string original_string = "Hello, world!"; // 在字符串的指定位置插入字符或子字符串 original_string.insert(7, "there, "); std::cout << original_string << std::endl; // 输出: "Hello, there, world!" // 在字符串的末尾插入字符或子字符串 original_string.insert(original_string.length(), " How are you?"); std::cout << original_string << std::endl; // 输出: "Hello, there, world! How are you?" // 在字符串的开头插入字符或子字符串 original_string.insert(0, "Hi, "); std::cout << original_string << std::endl; // 输出: "Hi, Hello, there, world! How are you?" return 0; } ``` ### 8.4erase(任意位置删除) erase 用来从 pos 位置开始向后删除 len 个字符: ![](https://file.jishuzhan.net/article/1705409804920426498/5e7345cf33284f018cf51ba7654a65bf.png) 这里的npos是一个很有讲究的东西! ![](https://file.jishuzhan.net/article/1705409804920426498/38f3d734a26a41afad24d05f8f444037.png) ![](https://file.jishuzhan.net/article/1705409804920426498/9449086243c34bc4849e62925bde2d68.png) 这里npos特殊就特殊在它的类型值是size_t 不是简单的int 在上方erase的第一个接口len后面,len 的缺省值是 npos,虽然 npos 的值为-1,但是 npos 是无符号数,所以 npos 其实是无符号整形的最大值;所以,如果我们不知道 len,那么 erase 函数会一直往后删除,直到遇到 '\\0' *** ** * ** *** ![](https://file.jishuzhan.net/article/1705409804920426498/a416a7f21fb44a548b1f77b8b2c3fc15.png) *** ** * ** *** ### 8.5 swap(是一个参数,和平常见到的普通的不一样) swap 函用于交换两个字符串的内容,包括指向的字符数组、有效数据个数以及容量大小: ![](https://file.jishuzhan.net/article/1705409804920426498/a3c05f84b96f4b2caf488594257ee629.png) ```cpp string s1("dsjnaiodioasndosdaiosandsaoindsisdaoidnsaionds0asnisdanas"); string s2; cout << "s1原来的size " << s1.size() << endl; cout << "s1原来的capacity " << s1.capacity() << endl; cout << "s2原来的size " << s2.size() << endl; cout << "s2原来的capacity " << s2.capacity() << endl; s1.swap(s2); cout << endl << endl << endl; cout << "s1交换后的size " << s1.size() << endl; cout << "s1交换后的capacity " << s1.capacity() << endl; cout << "s2交换后的size " << s2.size() << endl; cout << "s2交换后的capacity " << s2.capacity() << endl; ``` ![](https://file.jishuzhan.net/article/1705409804920426498/7e9bd91e5fe94c6984c74f365dfd0bd0.png) *** ** * ** *** ## 九、string之operation操作函数(c_str,find,,substr) string 提供了系列对 string 进行操作的函数: ![](https://file.jishuzhan.net/article/1705409804920426498/ba71c394e18d48edbbae77a9464a91e6.png) ### 9.1c_str(为了使得C++与C语言之间有接口,算是大使馆) 在某些场景中只支持对C形式的字符串,即字符数组进行操作,比如网络传输、fopen,而不支持对C++中的 string 对象进行操作,所以 string 提供了c_str,用于返回C形式的字符串: ![](https://file.jishuzhan.net/article/1705409804920426498/ac91d318307344469ce6393308627bd2.png) ```cpp #include #include using namespace std; int main() { string s1("haha"); cout << strlen(s1.c_str()) << endl; return 0; } ``` ![](https://file.jishuzhan.net/article/1705409804920426498/2edd16f175d94bc990418cc6128f2f46.png) *** ** * ** *** ### 9.2find(查找字符串,里面也有npos) find 用于返回 一个字符或一个字符数组或一个string对象 在 string 中首次出现的位置,如果找不到就返回 npos: ![](https://file.jishuzhan.net/article/1705409804920426498/76d3531f88c949deb41ad38d6045b690.png) rfind,findfirstof,substr,流插入重载,getline,模拟实现,未完待续........... 未 完 待 续 ## 十。。。。(未完待续)

相关推荐
Merokes4 小时前
关于Gstreamer+MPP硬件加速推流问题:视频输入video0被占用
c++·音视频·rk3588
请来次降维打击!!!5 小时前
优选算法系列(5.位运算)
java·前端·c++·算法
别NULL5 小时前
机试题——统计最少媒体包发送源个数
c++·算法·媒体
嘤国大力士5 小时前
C++11&QT复习 (七)
java·c++·qt
背影疾风6 小时前
C++学习之路:指针基础
c++·学习
x-cmd6 小时前
[250331] Paozhu 发布 1.9.0:C++ Web 框架,比肩脚本语言 | DeaDBeeF 播放器发布 1.10.0
android·linux·开发语言·c++·web·音乐播放器·脚本语言
myloveasuka6 小时前
[Linux]从硬件到软件理解操作系统
linux·开发语言·c++
UpUpUp……6 小时前
特殊类的设计/单例模式
开发语言·c++·笔记·单例模式
苏克贝塔6 小时前
CMake学习--Window下VSCode 中 CMake C++ 代码调试操作方法
c++·vscode·学习
嘤国大力士7 小时前
C++11&QT复习 (十一)
开发语言·c++·qt