🚀个人主页:奋斗的小羊 🚀所属专栏:C++ 很荣幸您能阅读我的文章,诚请评论指点,欢迎欢迎 ~
目录
- 前言
- 💥1、string类主要函数接口
- 💥2、string类的模拟实现
-
- [💥2.1 构造和析构](#💥2.1 构造和析构)
- [💥2.2 运算符重载](#💥2.2 运算符重载)
-
- [💥2.2.1 赋值重载](#💥2.2.1 赋值重载)
- [💥2.2.2 [ ]重载](#💥2.2.2 [ ]重载)
- [💥2.2.3 +=重载](#💥2.2.3 +=重载)
- [💥2.2.4 <<重载](#💥2.2.4 <<重载)
- [💥2.2.5 >>重载](#💥2.2.5 >>重载)
- [💥2.2.6 关系运算符重载](#💥2.2.6 关系运算符重载)
- [💥2.3 迭代器](#💥2.3 迭代器)
- [💥2.4 扩容](#💥2.4 扩容)
- [💥2.5 插入](#💥2.5 插入)
-
- [💥2.5.1 尾插](#💥2.5.1 尾插)
- [💥2.5.2 追加字符串](#💥2.5.2 追加字符串)
- [💥2.5.3 插入字符](#💥2.5.3 插入字符)
- [💥2.5.4 插入字符串](#💥2.5.4 插入字符串)
- [💥2.6 删除](#💥2.6 删除)
- [💥2.7 查找](#💥2.7 查找)
-
- [💥2.7.1 查找字符](#💥2.7.1 查找字符)
- [💥2.7.2 查找字符串](#💥2.7.2 查找字符串)
- [💥2.7.3 返回子串](#💥2.7.3 返回子串)
前言
通过模拟实现string类的主要接口可以使我们对string类的理解更加透彻,深入理解内存管理,可以更好地理解字符串在内存中的存储方式,以及如何进行内存分配和释放,从而避免常见的内存泄漏和溢出问题,加深对面向对象编程理念的理解,比如封装、继承和多态。
💥1、string类主要函数接口
模拟实现string
类,主要是实现string
类的构造、拷贝构造、运算符重载、析构等。
为了防止与标准库中string
类命名冲突,我们在空间域yjz
中来模拟实现我们的string
类。
cpp
namespace yjz
{
class string
{
public:
typedef char* iterator;
typedef const char* const_iterator;
//无参构造
string()
{}
//带参构造
string(const char* str = "")//合二为一为缺省参数,空字符串表示'\0'
{}
//拷贝构造
string(const string& str)
{}
//赋值重载
string& operator=(const string& str)
{}
//析构
~string()
{}
size_t size() const
{}
size_t capacity() const
{}
//清理数据
void clear()
{}
//返回C格式
const char* c_str() const
{}
char& operator[](size_t n)//可修改
{}
const char& operator[](size_t n) const//常量
{}
//迭代器
iterator begin()
{}
iterator end()
{}
const_iterator begin() const
{}
const_iterator end() const
{}
void reserve(size_t n = 0);//扩容
void push_back(char ch);//尾插
void append(const char* str);//追加字符串
string& operator+=(char ch);//尾插
string& operator+=(const char* str);//追加字符串
void insert(size_t pos, char ch);//插入字符
void insert(size_t pos, const char* str);//插入字符串
void erase(size_t pos, size_t len = npos);//删除
size_t find(char ch, size_t pos = 0) const;//返回字符位置
size_t find(const char* str, size_t pos = 0) const;//返回字符串位置
string substr(size_t pos, size_t len = npos) const;//截取n个字符返回
private:
char* _str;
size_t _size;
size_t _capacity;
static const size_t npos;
};
//实现成全局函数,支持字符串和string对象比较
bool operator<(const string& s1, const string& s2);
bool operator<=(const string& s1, const string& s2);
bool operator>(const string& s1, const string& s2);
bool operator>=(const string& s1, const string& s2);
bool operator==(const string& s1, const string& s2);
bool operator!=(const string& s1, const string& s2);
ostream& operator<<(ostream& out, const string& str);
istream& operator>>(istream& in, string& str);
}
💥2、string类的模拟实现
💥2.1 构造和析构
- 无参构造和带参构造可以合为一个默认构造,缺省参数不能给
nullptr
,可以给空字符串" "
,用'\0'
初始化 _capacity
不包含'\0'
,每次开空间都要多开一个- 给被拷贝构造的对象新开一块空间,用
strcpy
将原字符串拷贝给新对象
cpp
无参构造
//string()
// :_str(new char[1]{'\0'})
// ,_size(0)
// ,_capacity(0)
//{}
//带参构造
string(const char* str = "")//合二为一为缺省参数,空字符串表示'\0'
{
_size = strlen(str);
_capacity = _size;
_str = new char[_size + 1];//多开一个存'\0'
strcpy(_str, str);//strcpy把'\0'也拷贝
}
//拷贝构造
string(const string& str)
{
_str = new char[str._capacity + 1];//多开一个存'\0'
strcpy(_str, str._str);
_size = str._size;
_capacity = str._capacity;
}
//析构
~string()
{
delete[] _str;
_str = nullptr;
_size = _capacity = 0;
}
size_t size() const
{
return _size;
}
size_t capacity() const
{
return _capacity;
}
void clear()
{
_str[0] = '\0';
_size = 0;
}
//返回C格式
const char* c_str() const
{
return _str;
}
💥2.2 运算符重载
💥2.2.1 赋值重载
- 编译器默认生成的赋值重载完成的是浅拷贝 ,还是和拷贝构造一样的问题,同一块空间会析构两次,所以需要我们自己实现赋值重载,完成深拷贝
- 先释放掉旧空间,申请一块新空间往新空间内赋值,重新申请一块空间而不在原空间内直接赋值的原因是赋值的两个对象大小可能不一样,扩容比较麻烦
- 还要考虑自己给自己赋值的情况,虽然我们不这么干,但是语法上是允许的
- 参数和返回值我们都用引用,可以减少拷贝提高效率
cpp
string& operator=(const string& str)
{
//防止自己给自己赋值
if (this != &str)
{
delete[] _str;
_str = new char[str._capacity + 1];
strcpy(_str, str._str);
_size = str._size;
_capacity = str._capacity;
}
return *this;
}
💥2.2.2 [ ]重载
cpp
char& operator[](size_t n)//可修改
{
assert(n < _size);
return _str[n];
}
const char& operator[](size_t n) const//常量
{
assert(n < _size);
return _str[n];
}
💥2.2.3 +=重载
cpp
string& string::operator+=(char ch)//尾插
{
push_back(ch);
return *this;
}
string& string::operator+=(const char* str)//追加字符串
{
append(str);
return *this;
}
💥2.2.4 <<重载
- 流插入、流提取重载放到全局,不需要定义为友元函数,因为没有访问成员变量,只访问的成员函数
cpp
ostream& operator<<(ostream& out, const string& str)
{
for (auto ch : str)
{
out << ch;
}
return out;
}
💥2.2.5 >>重载
- 从输入流中提取一个字符串,将序列存储在
str
中,该序列将被覆盖 istream
提取操作使用空格作为分隔符
cpp
istream& operator>>(istream& in, string& str)
{
char ch;
in >> ch;
while (ch != ' ' && ch != '\n')
{
str += ch;
in >> ch;
}
return in;
}
上面的流提取重载是存在问题的,我们期望的是读到空格或者换行就结束,但是对于字符而言是不需要分割的,没有分隔符的概念,所以提取字符会跳过空格和换行,因次不能用复用库中的流提取。
- 为了能读到空格和换行字符,我们可以使用
get
- 调用
clear
清空原始数据,但不改变空间大小
cpp
istream& operator>>(istream& in, string& str)
{
str.clear();
char ch;
//cin >> ch;
ch = in.get();
while (ch != ' ' && ch != '\n')
{
str += ch;
//in >> ch;
ch = in.get();
}
return in;
}
💥2.2.6 关系运算符重载
- 我们只需要写其中的两个,剩下的可以复用
cpp
bool operator<(const string& s1, const string& s2)
{
return strcmp(s1.c_str(), s2.c_str()) < 0;
}
bool operator<=(const string& s1, const string& s2)
{
return s1 < s2 || s1 == s2;
}
bool operator>(const string& s1, const string& s2)
{
return !(s1 <= s2);
}
bool operator>=(const string& s1, const string& s2)
{
return !(s1 < s2);
}
bool operator==(const string& s1, const string& s2)
{
return strcmp(s1.c_str(), s2.c_str()) == 0;
}
bool operator!=(const string& s1, const string& s2)
{
return !(s1 == s2);
}
- 库中写了类和类、类和字符串、字符串和类比较,我们只写了类和类比较但也能完成字符串和类比较是因为隐式类型转换 (但是类型转换中间会构造一个临时对象,再用这个临时对象去拷贝构造,编译器优化为直接构造)
💥2.3 迭代器
- 普通迭代器
cpp
typedef char* iterator;
iterator begin()
{
return _str;//指向第一个字符
}
iterator end()
{
return _str + _size;//指向'\0'
}
- 常量迭代器
cpp
typedef const char* const_iterator;
const_iterator begin() const
{
return _str;//指向第一个字符
}
const_iterator end() const
{
return _str + _size;//指向'\0'
}
💥2.4 扩容
- 大了扩容,小了不变
- 手动异地扩容
- 多开一个空间用于存字符
'\0'
- 拷贝完原始数据后手动释放旧空间
cpp
void string::reserve(size_t n)//【异地扩容】
{
if (n > _capacity)
{
char* tmp = new char[n + 1];//多开一个存'\0'
strcpy(tmp, _str);
delete[] _str;
_str = tmp;
tmp = nullptr;
_capacity = n;//不包含'\0'
}
}
💥2.5 插入
💥2.5.1 尾插
- 如果空间不够,可以调用
reserve
来扩容 - 尾插一个字符后,不要忘了
++_size
- 因为尾插的字符覆盖了字符
'\0'
,所以我们还要在字符串末尾手动加上'\0'
cpp
void string::push_back(char ch)//尾插
{
if (_size == _capacity)
{
reserve(_capacity == 0 ? 4 : 2 * _capacity);
}
_str[_size++] = ch;
_str[_size] = '\0';//尾插完后不要忘了补上'\0'
}
💥2.5.2 追加字符串
- 追加字符串之前,我们要算一下追加后的字符串长度 ,如果长度大于二倍的原空间,就按字符串长度扩;如果小于二倍的原空间,就按二倍扩容
- 扩容完用
strcpy
拷贝追加的字符串时,要追加到_str + _size
的位置 - 追加完成后及时更新
_size
的值
cpp
void string::append(const char* str)//追加字符串
{
size_t len = strlen(str);
if (_size + len > _capacity)
{
reserve(_size + len > 2 * _capacity ? _size + len : 2 * _capacity);
}
strcpy(_str + _size, str);
_size += len;//更新_size
}
💥2.5.3 插入字符
这里有一个比较容易踩坑的点,像下面实现的函数,当我们在除了_size == 0
位置插入字符外其他地方都是可以正常实现的,但是头插会陷入死循环。
cpp
void string::insert(size_t pos, char ch)//插入字符
{
assert(pos <= _size);
if (_size == _capacity)
{
reserve(_capacity == 0 ? 4 : 2 * _capacity);
}
size_t end = _size;
while (end >= pos)
{
_str[end + 1] = _str[end--];
}
_str[pos] = ch;
_str[_size + 1] = '\0';
}
头插会失败的原因是:我们定义的end
是无符号整型 ,所以end
始终都是不小于0的,有同学可能会说把end
改为int
类型不就好了?但是就算用int
定义end
,这个函数还是会陷入死循环。
因为
pos
是无符号整型,pos
和end
比较时pos
会使end
转换为无符号整型,然后再参与比较。
关于算数转换 更多详细内容请跳转阅读 ---> C语言(操作符)2
要解决这个问题可以强制类型转换,但更建议像下面这样修改:
cpp
void string::insert(size_t pos, char ch)//插入字符
{
assert(pos <= _size);
if (_size == _capacity)
{
reserve(_capacity == 0 ? 4 : 2 * _capacity);
}
size_t end = _size + 1;
while (end > pos)
{
_str[end--] = _str[end - 1];
}
_str[pos] = ch;
_size++;
}
💥2.5.4 插入字符串
- 插入字符串前也要先计算一下插入后字符串的总长度,如果长度大于二倍的原空间,就按字符串长度扩;如果小于二倍的原空间,就按二倍扩容
- 写循环结束条件时要细心的画图确定,如果有空格字符也要挪动
- 插入字符串和追加字符串不同,追加字符串可以调用
strcpy
函数,因为strcpy
函数可以将'\0'
也拷贝过来,而插入字符串不需要将'\0'
插入进来,所以不适合使用strcpy
,可以考虑循环插入
cpp
void string::insert(size_t pos, const char* str)//插入字符串
{
assert(pos <= _size);
size_t len = strlen(str);
if (len + _size > _capacity)
{
reserve(len + _size > 2 * _capacity ? len + _size : 2 * _capacity);
}
size_t end = _size + len;
while (end > pos + len - 1)
{
_str[end--] = _str[end - len];
}
for (size_t i = 0; i < len; i++)
{
_str[pos + i] = str[i];
}
}
- 其实插入一个字符和插入一个字符串本质上是一样的,不同的只是一些值的差异和细节的处理
💥2.6 删除
- 在
string
类里面声明函数时可以给一个缺省值npos
,如果函数调用时只给一个实参则默认pos
位置后面的内容全部删除 - 函数声明和定义分离时,缺省参数不能在函数声明和定义中同时出现,规定必须函数声明给缺省值
cpp
void erase(size_t pos, size_t len = npos);//删除
npos
我们也只能在.h
文件中声明(声明在string类private
成员变量下,为静态常量 ),在.cpp
文件中定义 ,npos
为无符号整型,-1的补码为全1,经过算数转换后就成了整型最大值
cpp
const size_t string::npos = -1;
- 擦除字符串值中从字符位置开始 并跨越
len
字符的部分,如果内容太短或len
为string::npos
,则擦除直到字符串末尾的部分 - 要分两种情况分别讨论 ,
len
大于pos
位置后面字符串的长度和小于后面字符串的长度 - 删除后也要及时更新
_size
的值
cpp
void string::erase(size_t pos, size_t len)//删除
{
assert(pos < _size);
if (len >= _size - pos)//pos后面全删
{
_str[pos] = '\0';
_size = pos;
}
else//pos后面不全删
{
for (size_t i = pos; i < _size - len + 1; i++)
{
_str[i] = _str[i + len];
}
_size -= len;
}
}
💥2.7 查找
💥2.7.1 查找字符
- 当只传一个实参时,默认从头开始往后查找
- 当指定
pos
时,搜索仅包括位置pos
处或位置后的字符 ,而忽略任何可能出现的包含pos
之前字符的情况
cpp
size_t string::find(char ch, size_t pos)//返回字符位置
{
for (size_t i = pos; i < _size; i++)
{
if (_str[i] == ch)
{
return i;
}
}
return npos;//没找到则返回npos
}
💥2.7.2 查找字符串
- 当只传一个实参时,默认从头开始往后查找
- 可以调用
strstr
来完成,注意第一个参数不是_str
,而是_str + pos
- 如果没找到则返回npos,找到了则返回字符串第一个字符的下标,可以用
ptr - _str
两指针相减来获得下标
cpp
size_t string::find(const char* str, size_t pos) const//返回字符串位置
{
assert(pos < _size);
const char* ptr = strstr(_str + pos, str);
if (nullptr == ptr)
{
return npos;
}
else
{
return ptr - _str;
}
}
💥2.7.3 返回子串
- 只传一个实参时默认返回
pos
位置后面的整个子串 sub += _str[pos + i];
是尾插一个字符,这一步骤不能写sub[i] = _str[pos + i];
因为虽然运算符重载的operator[]
可以返回指定位置的值,但是此时sub
只是开了len
个长度的空间,没有元素,_size
为0,assert(pos < _size)
会报错
cpp
string string::substr(size_t pos, size_t len) const//截取n个字符返回
{
assert(pos < _size);
if (len > _size - pos)
{
len = _size - pos;
}
string sub;
sub.reserve(len);
for (size_t i = 0; i < len; i++)
{
sub += _str[pos + i];
}
return sub;
}