C++ string类的使用

STL简介

1. 什么是STL

STL(standard template libaray - 标准模板库):是C++标准库的重要组成部分,不仅是一个可复用的组件库,而且是一个包罗数据结构与算法的软件框架。

2. STL的版本

原始版本

Alexander Stepanov、Meng Lee 在惠普实验室完成的原始版本,本着开源精神,他们声明允许任何人任意运用、拷贝、修改、传播、商业使用这些代码,无需付费。唯一的条件就是也需要向原始版本一样做开源使用。 HP 版本--所有STL实现版本的始祖。

P.J.版本

由P.J.Plauger开发,继承自HP版本,被Windows Visual C++采用,不能公开或修改,缺陷:可读性比较低,符号命名比较怪异。

RW版本

由Rouge Wage公司开发,继承自HP版本,被C + +Builder 采用,不能公开或修改,可读性一般。

SGI版本

由Silicon Graphics Computer Systems,Inc公司开发,继承自HP版 本。被GCC(Linux)采用,可移植性好,可公开、修改甚至贩卖,从命名风格和编程 风格上看,阅读性非常高。我们后面学习STL要阅读部分源代码,主要参考的就是这个版本。

3.STL的六大组件

分别是:仿函数、算法、迭代器、配接器、容器、空间配置器

string类

一、为什么有string类?

C语言中,字符串是以'\0'结尾的一些字符的集合,为了操作方便,C标准库中提供了一些str系列的库函数,但是这些库函数与字符串是分离开的,不太符合OOP的思想,而且底层空间需要用户自己管理,稍不留神可能还会越界访问

c: str××× 系列库函数 面向过程

cpp: string 管理字符数组的增删查改+算法 面向对象

二、标准库中的string类

2.1 string类(了解)

  1. 字符串是表示字符序列的类

  2. 标准的字符串类提供了对此类对象的支持,其接口类似于标准字符容器的接口,但添加了专门用于操作单字节字符字符串的设计特性。

  3. string类是使用char(即作为它的字符类型,使用它的默认char_traits和分配器类型(关于模板的更多信息,请参阅basic_string)。

  4. string类是basic_string模板类的一个实例,它使用char来实例化basic_string模板类,并用char_traits和allocator作为basic_string的默认参数(根于更多的模板信息请参考basic_string)。

  5. 注意,这个类独立于所使用的编码来处理字节:如果用来处理多字节或变长字符(如UTF - 8)的序列,这个类的所有成员(如长度或大小)以及它的迭代器,将仍然按照字节(而不是实际编码的字符)来操作。

总结:

  1. string是表示字符串的字符串类

  2. 该类的接口与常规容器的接口基本相同,再添加了一些专门用来操作string的常规操作。

  3. string在底层实际是:basic_string模板类的别名,typedef basic_string<char, char_traits, allocator> string;

  4. 不能操作多字节或者变长字符的序列。

在使用string类时,必须包含#include头文件以及using namespace std;

例如:

cpp 复制代码
void teststring()
{
	string st1;//展开命名空间域
	std::string st2;//未展开命名空间域

	//基本用法
	string name("张三");
	name = "李四";
}

2.2 string类的常用接口说明(注意下面我只讲解最常用的接口)

2.2.1string类对象常见的构造

(constructor)函数名称 功能说明

string()(常用) 构造空的string类对象,即空字符串

string(const char* s) (常见) 用C - string来构造string类对象

string(size_t n, char c) string类对象中包含n个字符c

string(const string & s) (常见) 拷贝构造函数

string (const string& str, size_t pos, size_t len = npos) 取从字符串str的pos位置往后的npos个字符

注意:

在构造函数类型string (const string& str, size_t pos, size_t len = npos)中,npos默认值是-1,

是整型的最大值,因为他是无符号整型

cpp 复制代码
void Teststring()
{
	string s1; // 构造空的string类对象s1
	string s2("love"); // 用C格式字符串构造string类对象s2
	string s3(12, '*');//用12个*初始化对s3
	string s4(s2); // 拷贝构造s3

	cout << s2 << endl;
	cout << s3 << endl;
	cout << s4 << endl;
}

string常见的构造函数的使用:

cpp 复制代码
void testst()
{
	string st("hello");
	//尾插一个空格,尾插单个字符使用push_back
	st.push_back(' ');
	//尾插world,尾插整个字符使用append
	st.append("world");
	cout << st << endl;

	string st1("hello");
	//以上操作可以直接使用运算符重载直接进行尾插操作
	st1 += " ";
	st1 += "world";
	cout << st1 << endl;

	//把一个数字x转换程字符
	int x = 0;
	cin >> x;
	string xstr;
	while (x)
	{
		size_t val = x % 10;
		xstr += ('0' + val);
		x /= 10;
	}
	cout << xstr << endl;

}

2.2.2. string类对象的容量操作

函数名称 功能说明

size(常见) 返回字符串有效字符长度

length 返回字符串有效字符长度

capacity 返回空间总大小(容量)

empty (常见) 检测字符串释放为空串,是返回true,否则返回false

clear (常见) 清空有效字符(清除size)

reserve (常见) 为字符串预留空间n,例如reserve(100)

resize (常见) 将有效字符的个数该成n个,多出的空间用字符c填充

max_size (不靠谱) 返回字符串可以达到的最大的长度

shrink_to_fit 把他的容量capacity缩至他的size

注意:

  1. size()与length()方法底层实现原理完全相同,引入size()的原因是为了与其他容器的接口保持一

致,一般情况下基本都是用size()。

  1. clear()只是将string中有效字符清空,不改变底层空间大小。

  2. resize(size_t n) 与 resize(size_t n, char c)都是将字符串中有效字符个数改变到n个,不同的是当字符个数增多时:resize(n)用0来填充多出的元素空间,resize(size_t n, char c)用字符c来填充多出的元素空间。注意:resize在改变元素个数时,如果是将元素个数增多,可能会改变底层容量的大

小,如果是将元素个数减少,底层空间总大小不变。

  1. reserve(size_t res_arg = 0):为string预留空间,不改变有效元素个数,当reserve的参数小于

string的底层空间总大小时,reserver不会改变容量大小。

cpp 复制代码
void testcontain()
{
	string s1("I Love  You");
	//size和length返回字符串个数和长度,但是更简易使用size
	cout << s1.size() << endl;
	cout << s1.length() << endl;
	
	//返回可以达到的最大的长度
	cout << s1.max_size() << endl;

	//返回这个开辟空间的总大小(容量)
	cout << s1.capacity() << endl;//不同服务器下的结果不一样

	//clear清理数据,同时将size变为0,但是不会改变capacity
	cout << s1.size() << endl;
	cout << s1.capacity() << endl;
	s1.clear();
	cout << s1.size() << endl;
	cout << s1.capacity() << endl;

	//使用reverse为字符串预留空间(开空间并不初始化)
	string s2;
	s2.reserve(100);
	size_t sz = s2.capacity();
	cout << "capacity chaaged:" << sz << endl;

	//使用resize开空间+初始化
	string s3;
	s3.resize(100);
	cout << s3.size() << endl;
	cout << s3.capacity() << endl;

}

2.2.3. string类对象的访问及遍历操作(主要是迭代器操作)

函数名称 功能说明

operator[size_t pos] (常见) 返回pos位置的字符,const string类对象调用

char at(size_t pos) 和[ ]一样也是返回pos位置的字符

begin + end begin获取一个字符的迭代器 + end获取最后一个字符下一个位置的迭代器

rbegin + rend begin获取一个字符的迭代器 + end获取最后一个字符下一个位置的迭代器(反 向迭代器)

范围for C++11支持更简洁的范围for的新遍历方式

注:

如果要支持范围for,那么就得支持迭代器,因为范围for底层就是迭代器,并且任何容器都支持迭代器并且用法是类似的at和[ ]没有很大的区别,都是返回pos位置的字符,但是如果访问越界,那么at是抛异常,而[]是assert断言

例如:(里面包含四种迭代器的使用和细节)

cpp 复制代码
void test1()
{
	string s0;
	string s1("hello world");
	cout << s1 << endl;

	//遍历string
	//下标+[ ]访问+打印st1
	for (size_t i = 0; i < s1.size(); i++)
	{
		cout << s1[i] << ' ';
	}
	cout << endl;

	//遍历s1后对s1进行修改
	for (size_t i = 0; i < s1.size(); i++)
	{
		cout << s1[i]++ << " ";
	}
	cout << endl;

	//与数组对比:
	char s2[] = "hello world";
	s2[0];//->*(s2+0)
	s1[0];//->s1.operator[](0)
	//虽然二者看着很像,但底层有本质的区别:s2是数组名,代表的是数组首元素的地址,s1是一个对象,本质在调用[]使用的是运算符有重载

	//迭代器
	string::iterator it = s1.begin();
	while (it != s1.end())
	{
		cout << *it << " ";
		++it;
	}
	cout << endl;
	//iterator是一个像指针一样的东西,有可能是指针也有可能不是指针
	//同样,迭代器也可以进行修改,因为指针也可以修改

	//范围for访问(实际范围for底层就是迭代器)
	for (auto ch : s1)
	{
		cout << ch << " ";
	}
	cout << endl;

	//范围for修改s1
	for (auto& ch : s1)
	{
		cout << ch++ << " ";
	}
	cout << endl;
	
	//任何容器都支持迭代器,并且都是相似的
	//例如:栈
	vector<int> v;
	v.push_back(1);
	v.push_back(2);
	v.push_back(3);
	v.push_back(4);

	//迭代器访问打印栈
	vector<int>::iterator vit = v.begin();
	while (vit != v.end())
	{
		cout << *vit << " ";
		++vit;
	}
	cout << endl;

	//迭代器跟容器可以很好的配合容器进行访问和修改
	//迭代器跟容器配合
	reverse(v.begin(), v.end());
	for (auto element : v)
	{
		cout << element << " ";
	}
	cout << endl;

	string s4("I love you");
	cout << s4.at(3) << endl;

}

总结:迭代器(iterator)提供一种统一的方式访问和修改容器得数据,使得其跟容器可以很好的配合容器进行访问和修改

反向迭代器:reverse_iterator

cpp 复制代码
void rit()
{
	string s1("hello world");
	//string::reverse_iterator rit = s1.rbegin();
	//这里迭代器的类型可以换成auto
	auto rit = s1.rbegin();
	while (rit != s1.rend())
	{
		cout << *rit << " ";
		++rit;
	}
	//会到着遍历这个s1
}

范围for不能倒着遍历,只有迭代器可以倒着遍历

有时候在传参数给一个函数的时候,通常会使用const加以修饰,那么这里就会使用到const迭代器

cpp 复制代码
void test2(const string s)
{
	//const迭代器
	string::const_iterator it = s.begin();
	while (it != s.end())
	{
		cout << *it << " ";
		++it;
	}

	//const反迭代器
	string::const_reverse_iterator rit = s.rbegin();
	while (rit != s.rend())
	{
		cout << *rit << " ";
		++rit;
	}
}

注意:const迭代器和const反迭代器都只能读,不能写

总结:

(1)迭代器一共有四种:分别是迭代器(iterator)、反向迭代器(riterator)、const迭代器(const iterator)、const反向迭代器(const riterator)

(2)迭代器个反向迭代器是可以修改的(可读可写),而const迭代器和const反向迭代器是不可以写只能进行读操作

2.2.4 string类对象的修改操作

函数名称 功能说明

push_back 在字符串后尾插字符c

append 在字符串后追加一个字符串

operator+=(常用) 在字符串后追加字符串str

c_str(常用) 返回C格式字符串

find + npos(常用) 从字符串pos位置开始往后找字符c,返回该字符在字符串中的位置(下标)

rfind 从字符串pos位置开始往前找字符c,返回该字符在字符串中的位置

substr(size_t pos,size_t n) 在str中从pos位置开始,截取n个字符,然后将其返回

insert(size_t pos,const string& str) 在pos位置前面插入字符、字符串

erase(size_t pos=0,size_t len =npos) 支持从pos位置开始往后删除n个字符

c_str 返回该字符串的内容

注意:

  1. 在string尾部追加字符时,s.push_back(c) / s.append(1, c) / s += 'c'三种的实现方式差不多,一般情况下string类的 += 操作用的比较多, += 操作不仅可以连接单个字符,还可以连接字符串。

  2. 对string操作时,如果能够大概预估到放多少字符,可以先通过reserve把空间预留好。

3.find的详细使用以及各个接口:

4.rfind的详细使用以及各个接口:

cpp 复制代码
void test4()
{
	//尾插一个字符串
	string s1("I miss");
	s1.append("you");
	cout << s1 << endl;

	//尾插一个字符
	string s2("lov");
	s2.push_back('e');
	cout << s2 << endl;

	//insert使用
	string s3("dear");
	s3.insert(0, "oh");
	cout << s3 << endl;

	//erase是的使用
	string s4("mi ss");
	//从第二个位置开始删一个
	s4.erase(2, 1);
	cout << s4 << endl;

	//打开某个文件
	string filename("test.cpp");
	FILE* file = fopen(filename.c_str(), "r");
}

注意:erase如果从某个位置开始往后删掉,后面全不要了,那就不用给npos,因为npos默认是无符号的-1

cpp 复制代码
void divideweb()//find+substr的使用
{
	//分离下面这个网址的协议、域名和资源名

	//https://legacy.cplusplus.com/reference/string/string/c_str/
	//协议     域名    资源名
	string ur1 = "https://legacy.cplusplus.com/reference/string/string/c_str/";

	//取协议
	size_t pos1 = ur1.find("://");
	string protocol;
	if (pos1 != string::npos)
	{ 
		protocol.substr(0, pos1);
	}
	cout << protocol << endl;

	//取域名
	string domain;
	unsigned int pos2 = ur1.find('/', pos1 + 3);
	if (pos2 != string::npos)
	{
		domain.substr(pos1 + 3, pos2 - (pos1 + 3));
	}
	cout << domain << endl;

	//取资源名
	string uri;
	uri.substr(pos2 + 1);
	cout << uri << endl;
}

2.2.5string类非成员函数

函数 功能说明

operator+ 尽量少用,因为传值返回,导致深拷贝效率低

operator>>(常见) 输入运算符重载

operator<<(常见) 输出运算符重载

getline(常见) 获取一行字符串

relational operators(常见) 大小比较

注意:getline不给结束位置的时候,就是默认遇到换行符才停止

getline的详细使用以及各个接口:

2.2.6其他类型转换成字符类型函数to_string

函数 功能说明

to_string 将其他类型转换程字符类型

cpp 复制代码
void swapstring()
{
	string stdint = to_string(1234);//整型转换成字符型
	string stdouble = to_string(22.22);//浮点型转换程字符类型
}

2.2.7字符类型转换成其他类型函数

函数 功能说明

stoi 将字符类型转换程整型

stoul 将字符类型转换程无符号整型

stol 将字符类型转换成长整型

stod 将字符类型转换程double型

相关推荐
JAVA学习通4 小时前
Replication(下):事务,一致性与共识
大数据·分布式·算法
胖咕噜的稞达鸭4 小时前
C++中的父继子承(2)多继承菱形继承问题,多继承指针偏移,继承组合分析+高质量习题扫尾继承多态
c语言·开发语言·数据结构·c++·算法·链表·c#
ajsbxi4 小时前
【Redis】缓存读/写操作流程
redis·笔记·spring·缓存·bootstrap
蓝色汪洋4 小时前
Completed String easy
算法
铭哥的编程日记4 小时前
贪心算法精选30道编程题 (附有图解和源码)
算法·贪心算法
CoovallyAIHub4 小时前
顶刊新发!上海交大提出PreCM:即插即用的旋转等变卷积,显著提升分割模型鲁棒性
人工智能·算法·计算机视觉
JAVA学习通4 小时前
基本功 | 一文讲清多线程和多线程同步
java·开发语言·多线程
啦啦9117144 小时前
如何理解Java中的并发?
java·开发语言
超级大只老咪4 小时前
哈希表(算法)
java·算法·哈希算法