前面我们了解了string类的常用接口使用,那么现在就来模拟实现一下。
1.constructor
string.h
cpp
namespace Ro
{
class string
{
public:
string()
{
}
string(const char* str)
{
}
~string()
{
}
private:
char* _str;
size_t _size;
size_t _capacity;
};
}
为了和库里面的string进行区分,我们使用命名空间将它包含进来。
1.1构造函数和析构函数
cpp
string()
:_str(nullptr)
,_size(0)
,_capacity(0)
{}
string(const char* str)
:_str(new char[strlen(str)+1])
,_size(strlen(str))
,_capacity(strlen(str))
{
strcpy(_str, str);
}
~string()
{
delete[] _str;
_str = nullptr;
_size = _capacity = 0;
}
大家可以看一下这样写有没有什么问题呢?
首先我们来看一下带参构造,这样写感到会太麻烦了,每次都要调用strlen,我们干脆就不写初始化列表,虽然初始化列表不写也会走,但是我们没写的话我们的成员就不会初始化,之前有讲过在语法理解上初始化列表是成员变量定义的地方,我们定义的成员变量并不是引用成员变量和const成员变量,所以可以不初始化
cpp
string(const char* str)
{
_size = strlen(str);
_capacity = _size;
_str = new char[_capacity + 1];
strcpy(_str, str);
}
注意这里多开一个空间是留给\0的
然后再看一下我们的无参构造,其实这里是有问题的,我们可以验证一下。
不过在这之前,我们先把c_str()这个接口实现一下,方便我们打印出来查看,因为流插入和流提取我们还没有重载实现
这还是很好实现的,直接返回_str就行
cpp
const char* c_str() const
{
return _str;
}
我们测试一下:
cpp
void test_string1()
{
string s1;
string s2("hello world");
cout << s1.c_str() << endl;
cout << s2.c_str() << endl;
}
这里直接就崩掉了,我们先把s1屏蔽,测试s2看一下
没崩,我们再来看看库里面的是什么样的
cpp
void test_string1()
{
std::string s1;
std::string s2("hello world");
cout << s1.c_str() << endl;
cout << s2.c_str() << endl;
}
库里面的string是可以的,说明我们无参构造是有问题的
再来看一下我们的无参构造是这么写的
cpp
string()
:_str(nullptr)
,_size(0)
,_capacity(0)
{}
这里直接将_str 初始化为空指针,那我们通过s1.c_str()就会对空指针解引用从而引发空指针问题,所以这里我们不能初始化为空指针,我们直接将它初始化为\0不就行了吗
cpp
string()
:_str(new char[1]{'\0'})
,_size(0)
,_capacity(0)
{}
再来测试一下:
可以了,那干脆直接将无参和带参合并在一起,给个缺省参数。
cpp
string(const char* str = "")
{
_size = strlen(str);
_capacity = _size;
_str = new char[_capacity + 1];
strcpy(_str, str);
}
没有问题
1.2拷贝构造和赋值重载
cpp
void test_string1()
{
/*string s1;
string s2("hello world");*/
string s1("hello world");
string s2(s1);
cout << s1.c_str() << endl;
cout << s2.c_str() << endl;
}
如果我们不写,直接使用编译器自己默认的呢
来测试一下:
直接崩了,这是为什么呢?是因为这里编译器自己默认的拷贝构造是浅拷贝
那浅拷贝是什么?又为什么不行呢?
浅拷贝:也称位拷贝,编译器只是将对象中的值拷贝过来 。如果对象中管理资源 ,最后就会导致
多个对象共享同一份资源,当一个对象销毁时就会将该资源释放掉,而此时另一些对象不知道该
资源已经被释放,以为还有效,所以当继续对资源进项操作时,就会发生发生了访问违规。
如果一个类中涉及到资源的管理,其拷贝构造函数、赋值运算符重载以及析构函数必须要显式给
出。一般情况都是按照深拷贝方式提供。
所以需要我们自己来实现深拷贝
cpp
string(const string& s)
{
_size = s._size;
_capacity = s._capacity;
_str = new char[_capacity + 1];
strcpy(_str, s._str);
}
此时再来测试一下:
同样再把赋值重载实现出来
cpp
string& operator=(const string& s)
{
if (this != &s)
{
char* tmp = new char[s._capacity + 1];
strcpy(tmp, s._str);
delete[] _str;
_str = tmp;
_size = s._size;
_capacity = s._capacity;
}
return *this;
}
cpp
void test_string1()
{
/*string s1;
string s2("hello world");*/
string s1("hello world");
string s2(s1);
string s3("xxxxxx");
s3 = s1;
cout << s1.c_str() << endl;
cout << s2.c_str() << endl;
cout << s3.c_str() << endl;
}
测试一下:
2.string类的容量接口
2.1 size(),capacity()和empty()
cpp
size_t size() const
{
return _size;
}
size_t capacity() const
{
return _capacity;
}
bool empty() const
{
return _size == 0;
}
这几个接口都非常简单,就不多说,直接上代码
2.2 reserve()
扩容操作,一般不会缩容
cpp
void string::reserve(size_t n)
{
if (n > _capacity)
{
char* tmp = new char[n + 1];
strcpy(tmp, _str);
delete[] _str;
_str = tmp;
_capacity = n;
}
}
这就不测试了,还是比较简单的,后面会用到
2.3 resize()
库里面有两个,一个是n<size,那么就只需要把size缩到n就行,其他数据不变,另一个就是n>size(此时如果n>capacity就还需要扩容),然后就将[size, n]之间的数据初始化为c。
不过我们将两者合并在一起,给个缺省值\0(缺省值不能声明和定义的时候都出现,所以我们在声明的头文件中给)
cpp
void string::resize(size_t n, char ch)
{
if (n <= _size)
{
_str[n] = '\0';
_size = n;
}
else
{
if (n > _capacity)
{
reserve(n > 2 * _capacity ? n : 2 * _capacity);
}
for (size_t i = _size; i < n; i++)
{
_str[i] = ch;
}
_size = n;
_str[_size] = '\0';
}
}
如果n<=size,我们直接将数据截断,给个\0就行,没必要把数据都给删除。
如果n>size,判断是否需要扩容,然后再初始化数据。(不过最后不要忘记加\0)
测试一下:
cpp
void test_string2()
{
string s("hello world");
cout << s.c_str() << endl;
cout << s.size() << endl;
cout << s.capacity() << endl;
s.resize(20, 'x');
cout << s.c_str() << endl;
cout << s.size() << endl;
cout << s.capacity() << endl;
s.resize(0);
cout << s.c_str() << endl;
cout << s.size() << endl;
cout << s.capacity() << endl;
}
2.4 clear()
clear()清空有效字符,直接将所有数据截断,在下标0处的数据修改为\0,容量不变
cpp
void clear()
{
_str[0] = '\0';
_size = 0;
}
这里同样比较简单就不测试了
3.string类的访问和遍历
3.1访问
通过下标访问元素,一个可读可写,还有一个可读不可写
cpp
char& operator[](size_t index)
{
return _str[index];
}
const char& operator[](size_t index) const
{
return _str[index];
}
也比较简单,不过这个待会可以和遍历一起测试。
3.2迭代器实现遍历
之前有提到迭代器是一个像指针的东西,因为迭代器要模仿指针的行为,虽然在这里它确实是一个指针,但是在其他容器中,比如在list中,它就不是一个指针,而是通过封装来实现对指针行为的模仿,在list中,对迭代器++,--的操作,来让它指向下一个或者上一个节点,但是在链表中,直接对指针++,--是没有用的,因为链表不是一块连续的空间,但迭代器却能实现这种操作,所以说它不一定是指针,而是一个像指针的东西
cpp
typedef char* iterator;
typedef const char* const_iterator;
iterator begin()
{
return _str;
}
iterator end()
{
return _str + _size;
}
const_iterator begin() const
{
return _str;
}
const_iterator end() const
{
return _str + _size;
}
这里实现了begin和end迭代器,同样也有可读可写和可读不可写两种,所以这里有一个iterator(可读可写)和const_iterator(可读不可写)
测试一下:
cpp
void test_string3()
{
string s("hello world");
string::iterator it = s.begin();
while (it != s.end())
{
cout << *it << ' ';
it++;
}
cout << endl;
for (char& c : s)
{
c++;
cout << c << ' ';
}
cout << endl;
}
这里范围for我们没有实现就能用,这是因为范围for的底层就是迭代器,所以只要实现了的迭代器,范围for就可以使用。
4.string类对象的修改操作接口
4.1 push_back()
尾插一个字符
cpp
void string::push_back(char c)
{
if (_size == _capacity)
{
reserve(_capacity == 0 ? 4 : 2 * _capacity);
}
_str[_size] = c;
_size++;
_str[_size] = '\0';
}
先判断是否需要扩容,然后再插入数据,最后不要忘记\0
测试一下:
cpp
void test_string4()
{
string s("hello world");
cout << s.capacity() << endl;
s.push_back('x');
s.push_back('x');
s.push_back('x');
s.push_back('x');
s.push_back('x');
s.push_back('x');
cout << s.c_str() << endl;
cout << s.capacity() << endl;
}
4.2 append()
尾插一个字符串
cpp
void string::append(const char* str)
{
size_t len = strlen(str);
if (_size + len > _capacity)
{
reserve(_size + len > 2 * _capacity ? _size + len : 2 * _capacity);
}
strcpy(_str + _size, str);
_size = _size + len;
}
和push_back的步骤是一样的。
测试一下:
cpp
string s("hello world");
cout << s.capacity() << endl;
s.append("xxxxxxxxxxx");
cout << s.c_str() << endl;
cout << s.capacity() << endl;
4.3 operator+=
我们不需要去实现,直接复用push_back和append
cpp
string& string::operator+=(char c)
{
push_back(c);
return *this;
}
string& string::operator+=(const char* str)
{
append(str);
return *this;
}
这里就不测试了。
4.4 insert()
在pos位置插入一个字符
cpp
string& string::insert(size_t pos, char c)
{
assert(pos <= _size);
if (_size == _capacity)
{
reserve(_capacity == 0 ? 4 : 2 * _capacity);
}
size_t end = _size;
while (end >= pos)
{
_str[end + 1] = _str[end];
end--;
}
_str[pos] = c;
++_size;
return *this;
}
操作和上面类似,只不过需要挪动数据。
其实这里是有bug的,我们可以来测试一下看看
cpp
void test_string5()
{
string s1("hello world");
s1.insert(5, 'c');
cout << s1.c_str() << endl;
s1.insert(0, 'c');
cout << s1.c_str() << endl;
}
我们可以看到第二个测试崩掉了,说明在边界情况是有问题的
其实是因为pos为0时,由于end是size_t(无符号整型),end为0之后再--的话就是整型的最大值,不会比0小,那么发现问题后应该怎么修改呢?将end改为整型吗?我们来试试看
还是崩了,为什么呢?这是由于C语言遗留的问题,一个整型end和无符号整型pos比较的话,会发生什么?没错就是类型提升,整型会提升为无符号整型,这样一来就又变成了和上面一样的问题。
那应该怎么做呢?将pos强制转换为int吗?试一下
确实可以,但是我们这里推荐另一种方法。
cpp
size_t end = _size + 1;
while (end > pos)
{
_str[end] = _str[end - 1];
end--;
}
运行也没问题。
再来实现一个在pos位置插入一个字符串
cpp
string& string::insert(size_t pos, const char* s)
{
assert(pos <= _size);
size_t len = strlen(s);
if (_size + len > _capacity)
{
reserve(_size + len > 2 * _capacity ? _size + len : 2 * _capacity);
}
size_t end = _size + len;
while (end > pos + len - 1)
{
_str[end] = _str[end - len];
end--;
}
for (size_t i = 0; i < len; i++)
{
_str[pos + i] = s[i];
}
_size += len;
return *this;
}
和pos位置插入字符一样的操作,不过要注意将字符串s拷贝过来的时候注意不能将\0也拷过来,所以这里如果要使用拷贝函数的话需要注意不能使用strcpy,而是使用strncpy。
测试一下:
4.5 erase()
我们来实现一下库里面的第一个,删除pos位置len个字符,不给参数的话,默认删除全部有效字符,只给第一个参数的话,默认删除pos位置后的所有字符
cpp
string& erase(size_t pos = 0, size_t len = npos);
在成员变量中给可以直接给静态常量npos初始化
cpp
private:
char* _str;
size_t _size;
size_t _capacity;
static const size_t npos = -1;
还记得之前讲到静态成员变量的时候,有说过静态成员要在类外初始化,那为什么这里可以在类里面初始化呢?
在 C++中, static const 成员变量可以在类的内部声明并初始化,尤其是当类型为整数类型且初始化值为常量表达式时。
对于 static const size_t npos = -1 , size_t 通常是无符号整数类型,而 -1 在这种情况下会被自动转换为该无符号类型的最大值。这样定义的目的通常是为了表示一个特殊的、无效的位置或状态。
这样定义在成员变量里可以方便在整个类的范围内使用这个特殊的值,并且由于是 static const ,它在内存中只有一份实例,不会因为多个类对象的存在而重复占用空间。同时,在编译期间就可以确定其值,提高了程序的效率。
不过也可以在类外初始化,这里只是提到一下。
cpp
string& string::erase(size_t pos, size_t len)
{
assert(pos < _size);
if (len >= _size - pos)
{
_str[pos] = '\0';
_size = pos;
}
else
{
strcpy(_str + pos, _str + pos + len);
_size -= len;
}
return *this;
}
如果len >= _size-pos的话,说明pos位置后的字符都要删除,那我们直接将\0放在pos位置上就可以了,否则就是删除pos位置后len个字符,但后面还有字符,这个时候需要挪动字符。
测试一下:
cpp
void test_string6()
{
string s1("hello world");
s1.erase();
cout << s1.c_str() << endl;
string s2("hello world");
s2.erase(0, 5);
cout << s2.c_str() << endl;
string s3("hello world");
s3.erase(5);
cout << s3.c_str() << endl;
}
没有问题
4.6 find()
这里来模拟实现(2)(4)接口
cpp
size_t find(char c, size_t pos = 0) const;
size_t find(const char* s, size_t pos = 0) const;
注意:find是找第一次出现的位置
cpp
size_t string::find(char c, size_t pos) const
{
assert(pos < _size);
for (size_t i = 0; i < _size; i++)
{
if (_str[i] == c)
{
return i;
}
}
return npos;
}
找到了返回下标,没找到返回npos。
找字符串的话我们这里可以用到一个函数
返回str2在str1中第一次出现的地址,否则就返回空指针,这样可以直接达成我们想要完成的步骤
cpp
size_t string::find(const char* s, size_t pos = 0) const
{
assert(pos < _size);
const char* ptr = strstr(_str + pos, s);
if (ptr)
{
return ptr - _str;
}
return npos;
}
如果ptr不为空指针,说明找到了,直接将ptr-_str就是它此时所在的下标,为空说明没找到,就返回npos。
这里我们就不测试了
5.relational operators
cpp
bool operator<(const string& s)
{
return strcmp(_str, s._str) < 0;
}
bool operator>(const string& s)
{
return strcmp(_str, s._str) > 0;
}
bool operator<=(const string& s)
{
return !operator>(s);
}
bool operator>=(const string& s)
{
return !operator<(s);
}
bool operator==(const string& s)
{
return strcmp(_str, s._str) == 0;
}
bool operator!=(const string& s)
{
return !operator==(s);
}
直接利用字符串比较函数strcmp,然后其他的复用。
非常简单,就不一一说明了。
6.传统写法和现代写法
这里我们来介绍一下拷贝构造和赋值重载的传统写法和现代写法
传统写法就是我们之前的写法
cpp
string(const string& s)
{
_size = s._size;
_capacity = s._capacity;
_str = new char[_capacity + 1];
strcpy(_str, s._str);
}
string& operator=(const string& s)
{
if (this != &s)
{
char* tmp = new char[s._capacity + 1];
strcpy(tmp, s._str);
delete[] _str;
_str = tmp;
_size = s._size;
_capacity = s._capacity;
}
return *this;
}
老老实实的自己去深拷贝
但是在现代写法中我们可以利用一个工具人来给我们打工
拷贝构造的现代写法
cpp
string(const string& s)
:_str(nullptr)
{
string tmp(s._str);
swap(_str, tmp._str);
swap(_size, tmp._size);
swap(_capacity, tmp._capacity);
}
这里利用tmp来调用构造函数,构造一个拥有和s对象一样内容的对象(注意这里使用s对象的字符串去构造,但他们不是指向同一块空间,他们两个指向不同的空间,不过存放的数据是一样的),这时让tmp成为我们的工具人,把tmp刚构造好的东西占为己有(利用swap交换给我们自己)。
不过我们自己的_str需要初始化为空指针,不然不初始化的话就是一个随机值,把随机值换给tmp后,拷贝构造结束后,tmp的生命周期也结束了,调用析构函数销毁时,你是一个随机值,指向的是一个随机的地址,但是这个随机地址我们并没有开辟空间,此时我们去给它释放空间,就会崩溃
既然我们需要交换,不如直接写一个交换函数
cpp
void Swap(string& s)
{
swap(_str, s._str);
swap(_size, s._size);
swap(_capacity, s._capacity);
}
再把拷贝构造也改一下
cpp
string(const string& s)
:_str(nullptr)
{
string tmp(s._str);
Swap(tmp);
}
赋值构造的现代写法
这里也是一样的利用swap来达到我们想要的效果
cpp
string& operator=(const string& s)
{
string tmp(s._str);
Swap(tmp);
return *this;
}
这样一看,swap用起来更加简洁
7.流插入和流提取
流插入
cpp
ostream& operator<<(ostream& _cout, const string& s)
{
for (auto c : s)
{
_cout << c;
}
return _cout;
}
使用范围for一个一个的输入到流中
测试一下
cpp
void test_string7()
{
string s("hello world");
cout << s << endl;
}
流提取
cpp
istream& operator>>(istream& _cin, string& s)
{
s.clear();
char c = _cin.get();
while (c != '\n')
{
s += c;
c = _cin.get();
}
return _cin;
}
我们先要将s对象中的有效数据清除,我们知道库里面的流提取是会覆盖之前的数据的,如果这里不清除之前的有效数据的话,会造成s中原来的数据加上我们输入的数据,这就与库里面的不一样了。
这里我们使用get函数从输入流中读取单个字符,然后让s += c来实现
但是我们仔细看一下会发现,每次让s += c的话效率是不是会很低,为什么呢?如果这是一个刚定义的string类对象s,我们在实现构造函数的时候是将_capacity初始化为0的,那我们每次让s += c的话都需要扩容,扩容的效率很低,所以效率整体有点低。
那我们可以改进一下,为了减少扩容,那应该怎么做?是不是可以给一个适当大小的数组,每次从流中读取到的字符存入到数组中,当数组存满时再让s += 数组,这样就可以减少扩容的频率了。
cpp
istream& operator>>(istream& _cin, string& s)
{
s.clear();
const int N = 256;
char buff[N];
int i = 0;
char c = _cin.get();
while (c != '\n')
{
buff[i++] = c;
if (i == N - 1)
{
buff[i] = '\0';
s += buff;
i = 0;
}
c = _cin.get();
}
if (i > 0)
{
buff[i] = '\0';
s += buff;
}
return _cin;
}
测试一下:
没有问题,这样的话效率也能的到提升
今天的内容就到这里了