【C++】string类模拟实现上篇(附完整源码）

- - 前言
  - [1. string的基本结构](#1. string的基本结构)
  - [2. 构造函数、析构函数](#2. 构造函数、析构函数)
  - - [2.1 构造函数的实现](#2.1 构造函数的实现)
    - - 2.1.1带参构造函数
    - 2.2析构函数
    - 2.3无参构造函数
    - 2.4无参和带参构造函数合并
  - [3. string的遍历](#3. string的遍历)
  - - [3.1 operator](#3.1 operator[ ])
    - [3.2迭代器模拟实现 (简单实现）](#3.2迭代器模拟实现 (简单实现）)
    - [3.3 const迭代器模拟实现](#3.3 const迭代器模拟实现)
  - [4. 数据的增删查改](#4. 数据的增删查改)
  - - [4.1 reserve](#4.1 reserve)
    - [4.2 push_back和append](#4.2 push_back和append)
    - [4.3 +=](#4.3 +=)
    - [4.4 insert](#4.4 insert)
    - [4.5 erase](#4.5 erase)
  - [4.6 find](#4.6 find)
  - - [4.7 substr](#4.7 substr)
  - [5. 拷贝构造](#5. 拷贝构造)
  - - [5.1 浅拷贝默认拷贝构造](#5.1 浅拷贝默认拷贝构造)
    - [5.2 深拷贝拷贝构造函数](#5.2 深拷贝拷贝构造函数)
  - [6. 源码(上部分)](#6. 源码(上部分))
  - - [6.1 string.h](#6.1 string.h)
    - [6.2 test.cpp](#6.2 test.cpp)
  - [7. 总结](#7. 总结)

前言

在上一篇文章中，我们详细介绍了string类一些常用接口的使用，那这篇文章，我们将对string进行一个模拟实现，帮助大家理解的更加深刻。

1. string的基本结构

在上篇文章中我们了解：

string的底层其实就是一个支持动态增长的字符数组。那确定它的结构，接下来我们就开始模拟实现它。

首先新建一个头文件string.h，定义一个string类：

cpp 复制代码

class string
{
    public :
    //成员函数
    private :
        char*  _str;
        size_t _size;
        size_t _capacity;
};

这里string类的三个成员变量，一个字符指针_str指向开辟的动态数组，_size标识有效数据个数，_capacity记录容量的大小（不包含'\0'）。
但是因为标准库里已经有string类，为了避免冲突，我们需要定义一个命名空间，把我们自己实现的string类放到自己的命名空间里面。

cpp 复制代码

namespace w
{
    class string
{
    public :
    //成员函数
    private :
        char*  _str;
        size_t _size;
        size_t _capacity;

};
    
}

2. 构造函数、析构函数

2.1 构造函数的实现

2.1.1带参构造函数

首先我们来模拟实现一个带参构造函数：

我们知道标准库里string类的构造函数有很多，这里我们只模拟实现最常用的：

在之前的文章中我们提到尽量使用初始化列表进行初始化，我们可以这样写：

但是这里你会发现程序报错了，因为如果像上图一样初始化，首先涉及到权限放大的问题（之前文章有讲过）char* str被const修饰，不能被修改，但是赋给_str，_str是char* 类型的，可以修改。其次用常量字符串去初始化也不能被修改。
那怎么办呢？我们这里不直接传参而是开空间，用strcpy去进行拷贝：

cpp 复制代码

      string(const char* str)
	        :_str(new char[strlen(str)+1])
		    ,_size(strlen(str))
		    ,_capacity(strlen(str))
	    {
            strcpy(_str, str);
        }

顺便这里我们提供一个接口用来返回字符串：

cpp 复制代码

 const char* c_str()
        {
            return _str;
        }

我们在创建一个test.cpp文件用来测试我们写的接口：

2.2析构函数

这里我们直接顺便给出析构函数：

cpp 复制代码

~string()
        {
            delete[] _str;
            _str = nullptr;
            _size = _capacity = 0;
        }

2.3无参构造函数

我们有的时候还会遇到这样的场景：

所以这里需要我们去实现一个无参的构造函数。
假设这里的无参构造函数我们这样实现：

那这样真的可行吗？
如果这里_str传空指针那么在刚刚实现的c_str函数就会返回空程序，程序会崩溃。并且在标准库里的c_str接口即使传空也是会有返回值的。

那这里应该怎么办呢？我们可以这样写：

cpp 复制代码

  string()
	        :_str(new char[1])
		    ,_size(0)
		    ,_capacity(0)
	    {
            _str[0] = '\0';
        }

这里我们给_str开辟一个空间，然后给这块空间给上'\0'。这样就不会出现上面的问题了。

2.4无参和带参构造函数合并

我们之前讲过无参和带参的可以用全缺省。
我们来看几种写法：

能这样写吗？答案是肯定不能这样写类型就不匹配，一个是字符一个是字符串。

能这样写吗？答案是肯定不能。这样写strlen里的str就是空串了。
其实应该这样写：

这里我们直接给一个空串，常量字符串末尾是默认有"\0"的

3. string的遍历

3.1 operator

我们知道在标准库中可以通过下标去访问字符串中的某一个字符，下面我们来实现对[]的重载。
首先我们需要实现size()接口：

接下来我们来实现一下[]的重载：

这里我们实现了两个版本普通版本对应普通对象，const版本对应const对象，且这两个函数构成函数重载。
下面我们来验证一下：

3.2迭代器模拟实现 (简单实现）

除了[]可以遍历访问string对象，我们还可以用迭代器进行访问。
那迭代器我们说了大家可以理解成一个像指针一样的东西，但是不一定是指针。

我们最开始介绍了STL有好几个版本，不同的版本实现可能是不一样的。

那其实vs下string的迭代器呢就不是使用指针实现的，而G++下使用的SGI版本是指针实现的。

那这里我们模拟实现就使用指针来实现:

下面我们来验证一下：

同样的我们还可以使用范围for进行遍历：

范围for的底层就是用的迭代器。
大家可以理解成范围for的语法其实就跟我们之前学过的宏有点类似，它会被替换成迭代器，相当于把*it赋值给ch。范围for的底层就是无脑替换。

3.3 const迭代器模拟实现

这里我们再实现const版本给const对象使用：

4. 数据的增删查改

首先我们来实现一下push_back()和append().这两个都是插入数据，既然插入数据那我们就必须考虑扩容的问题。

那这里如果扩容的话，我们一次扩多少呢？
对于push_back来说一次扩二倍没问题，但是append一次扩二倍有可能是不行的。

为什么？

如果当前的容量是10，现在追加一个长度为25的字符串，扩容到原来的两倍才

20，也是不够用的。
那这里我们通过string的另一个接口reserve，它可以改变容量为我们指定的大小，帮助我们扩容。

下面我们就先来实现一下reserve。

4.1 reserve

我们先来看一下reserve怎么实现：

这里当参数n的值小于_capacity，如果不加这个if判断这里就会缩容。但是我们知道，库里的接口是不会缩容的。所以需要加上这个条件判断。

4.2 push_back和append

那接下来有了reserve我们继续来实现push_back和append。

push_back这里我们直接选择两倍扩。

这里append最少扩容到_size + len.
下面我们来实现一下：

4.3 +=

我们虽然有push_back和append但是我们更喜欢用重载的+=。当然+=的底层也是可以用push_back和append实现的。

下面我们来实现一下：

4.4 insert

对于insert我们主要实现库里的这两个版本：

首先我们来实现一下在pos位置插入n个字符：

逻辑其实是比较简单的。首先判断一下，是否需要扩容，然后就插入数据，如果往中间插就需要挪动数据。

这样写有没有问题呢？我们来测试一下：

好像没什么问题啊。真的没问题吗？
我们来看一种特殊情况：当pos = 0 时插入数据：

程序这里挂了。那为什么呢？
这里当pos = 0时，end等于0时还会进入循环,end再- -会变成多少？是-1吗？

这里end的类型是szie_t，无符号整型，所以end为0后再- -并不是-1，而是整型最大值，发生越界，循环也没正常结束，所以程序崩了。

那怎么解决呢？把end改成int可行吗？

这里也是不可行的。end和pos比较，end变成int，但是pos是size_t类型，这里是会发生整型提升(C语言知识）。那我们应该如何解决呢？
这里解决方法有很多，我们采用其中一种利用我们之前文章中提到的npos 解决：

我们再来测试一下：

刚才是插入一个字符，现在我们再来实现插入字符串的。那么逻辑和上面其实是一样的。只不过上面我们只需要挪出n个空间就可以了，那这里我们需要挪动数据腾出strlen(str)个空间。

下面我们来测试一下：

4.5 erase

那么接下来我们来实现一下erase，从pos位置删除len个字符：

对于erase首先第一种情况就是pos+len小于字符串的长度，那我们需要把pos位置开始的后len个字符删掉，但是仍然保留后续字符。那这里就是挪动后面的数据，把需要删除的覆盖掉就行。
那其它情况就是len比较大，pos+len直接大于等于字符串的长度，那就把pos后面的全部删掉。或者没有传pos这个参数，缺省值npos，那也要把后面的全删，所以这两种情况可以统一处理。这里只需要把pos位置给成"\0"就行了。

我们来测试一下：

当然为了和标准库里的一致我们这里也使用引用返回：

4.6 find

下面我们来实现一下find。find的实现其实很简单，遍历去找，找到了就返回下标，找不到就返回npos。

当然find还支持从pos位置开始查找一个字符串：在这里我们复用C语言中的strstr去查找。
下面我们来测试一下：

4.7 substr

下面我们再来实现一下substr。它的逻辑也是很简单的。
这里稍微需要注意的是我们需要条件判断当截取的字串足够长，我们截取的长度就是pos位置一直到字符串的末尾。

5. 拷贝构造

我们现在先来写一段这样的代码：

这里有一个拷贝构造，s2是s1拷贝构造而来的。

5.1 浅拷贝默认拷贝构造

在之前类和对象的文章中，我们知道，拷贝构造函数我们自己不写编译器是会默认生成的，这里我们直接运行上面的代码：

这里程序出错发生了一个经典的浅拷贝的问题。在之前的文章中我们也有讲过若未显式定义，编译器会生成默认的拷贝构造函数。默认的拷贝构造函数拷贝对象按内存存储字节序完成拷贝，这种拷贝叫做浅拷贝，或者值拷贝。一旦涉及到资源申请时，则拷贝构造函数是一定要写的，否则就是浅拷贝，就会出现问题。

5.2 深拷贝拷贝构造函数

这里就需要我们自己去实现拷贝构造函数，完成深拷贝：

下面我们来测试一下：

6. 源码(上部分)

6.1 string.h

cpp 复制代码

#include <iostream>
using namespace std;
namespace w
{
    class string
{
    public :
        typedef char* iterator;
        typedef const char* const_iterator;
       iterator begin()
		{
			return _str;
		}

		iterator end()
		{
			return _str + _size;
		}

        const_iterator begin() const
		{
			return _str;
		}

		const_iterator end() const
		{
			return _str + _size;
		}

        string(const char* str = "")
	        :_str(new char[strlen(str)+1])
		    ,_size(strlen(str))
		    ,_capacity(strlen(str))
	    {
            strcpy(_str, str);
        }

        
		string(const string& s)
		{
			_str = new char[s._capacity + 1];
			strcpy(_str, s._str);
			_size = s._size;
			_capacity = s._capacity;
		}


        ~string()
        {
            delete[] _str;
            _str = nullptr;
            _size = _capacity = 0;
        }

        const char* c_str() const
        {
            return _str;
        }

        size_t size() const
        {
            return _size;
        }

        char& operator[](size_t pos)
       {
	        assert(pos < _size);
	        return _str[pos];
       }

         const char& operator[](size_t pos) const
       {
	        assert(pos < _size);
	        return _str[pos];
       }

          void reserve(size_t n)
		{
			if (n > _capacity)
			{
				char* tmp = new char[n + 1];
				strcpy(tmp, _str);
				delete[] _str;
				_str = tmp;
				_capacity = n;
			}
		}
		void push_back(char ch)
		{
			if (_size == _capacity)
			{
				// 2倍扩容
				reserve(_capacity == 0 ? 4 : _capacity * 2);
			}

			_str[_size] = ch;

			++_size;
			_str[_size] = '\0';
		}

		void append(const char* str)
		{
			size_t len = strlen(str);
			if (_size + len > _capacity)
			{
				// 至少扩容到_size + len
				reserve(_size+len);
			}

			strcpy(_str + _size, str);
			_size += len;
		}

        string& operator+=(char ch)
		{
			push_back(ch);
			return *this;
		}

		string& operator+=(const char* str)
		{
			append(str);
			return *this;
		}

        	void insert(size_t pos, size_t n, char ch)
		{
			assert(pos <= _size);

			if (_size +n > _capacity)
			{
				// 至少扩容到_size + len
				reserve(_size + n);
			}

			// 添加注释最好
			size_t end = _size;
			while (end >= pos && end != npos)
			{
				_str[end + n] = _str[end];
				--end;
			}

			for (size_t i = 0; i < n; i++)
			{
				_str[pos + i] = ch;
			}

			_size += n;
		}

        	void insert(size_t pos, const char* str)
		{
			assert(pos <= _size);

			size_t len = strlen(str);
			if (_size + len > _capacity)
			{
				// 至少扩容到_size + len
				reserve(_size + len);
			}

			// 添加注释最好
			size_t end = _size;
			while (end >= pos && end != npos)
			{
				_str[end + len] = _str[end];
				--end;
			}

			for (size_t i = 0; i < len; i++)
			{
				_str[pos + i] = str[i];
			}

			_size += len;
		}

        string& erase(size_t pos, size_t len = npos)
		{
			assert(pos <= _size);

			if (len == npos || pos + len >= _size)
			{
				_str[pos] = '\0';
				_size = pos;

				_str[_size] = '\0';
			}
			else
			{
				size_t end = pos + len;
				while (end <= _size)
				{
					_str[pos++] = _str[end++];
				}
				_size -= len;
			}

            return *this;
		}

        size_t find(char ch, size_t pos = 0)
		{
			assert(pos < _size);

			for (size_t i = pos; i < _size; i++)
			{
				if (_str[i] == ch)
				{
					return i;
				}
			}

			return npos;
		}

		size_t find(const char* str , size_t pos = 0)
		{
			assert(pos < _size);

			const char* ptr = strstr(_str + pos, str);
			if (ptr)
			{
				return ptr - _str;
			}
			else
			{
				return npos;
			}
		}

        string substr(size_t pos = 0, size_t len = npos)
		{
			assert(pos < _size);

			size_t n = len;
			if (len == npos || pos + len > _size)
			{
				n = _size - pos;
			}

			string tmp;
			tmp.reserve(n);
			for (size_t i = pos; i < pos + n; i++)
			{
				tmp += _str[i];
			}

			return tmp;
		}

    private :
        char*  _str;
        size_t _size;
        size_t _capacity;

    public:
		const static size_t npos;

};
    
	const size_t string::npos = -1;
}

6.2 test.cpp

cpp 复制代码

#include "Mystring.h"

void test_string1()
{
    w ::string s1("hello world");
    cout << s1.c_str() << endl;

    for (size_t i = 0; i < s1.size(); i++)
    {
        cout << s1[i] << " ";
    }
    cout << endl;

    w ::string::iterator it = s1.begin();
    while (it != s1.end())
    {
        cout << *it << " ";
        ++it;
    }
    cout <<endl;
    
    for (auto ch : s1)
    {
        cout << ch <<" ";
    }
    cout <<endl;
}

void test_string2()
{

	w::string s1("hello world");
	cout << s1.c_str() << endl;

	s1.push_back(' ');
	s1.push_back('#');
	s1.append("hello");
	cout << s1.c_str() << endl;

    w::string s2("hello world");
	cout << s2.c_str() << endl;

	s2 += ' ';
	s2 += '#';
	s2 += "hello code";
	cout << s2.c_str() << endl;

}

void test_string3()
{
	w::string s1("helloworld");
	cout << s1.c_str() << endl;

	s1.insert(5, 3, '#');
	cout << s1.c_str() << endl;

	s1.insert(0, 3, '#');
	cout << s1.c_str() << endl;

    w::string s2("helloworld");
	s2.insert(5, "%%%%%");
	cout << s2.c_str() << endl;
	
}

void test_string4()
{
	w::string s1("helloworld");
	cout << s1.c_str() << endl;

	s1.erase(5, 3);
	cout << s1.c_str() << endl;

	s1.erase(5, 30);
	cout << s1.c_str() << endl;

	s1.erase(2);
	cout << s1.c_str() << endl;
}

void test_string5()
{
	w::string s1("helloworld");
	cout << s1.find('w',2) << endl;

	
}

void test_string6()
{
	w::string s1("hello world");
	w::string s2(s1);

	cout << s1.c_str() << endl;
	cout << s2.c_str() << endl;

}




int main()
{
    test_string6();
    return 0;
}

7. 总结

文章篇幅有限，剩余内容将在下篇进行讲解。

【C++】string类模拟实现上篇(附完整源码）

目录

前言

1. string的基本结构

2. 构造函数、析构函数

2.1 构造函数的实现

2.1.1带参构造函数

2.2析构函数

2.3无参构造函数

2.4无参和带参构造函数合并

3. string的遍历

3.1 operator

3.2迭代器模拟实现 (简单实现）

3.3 const迭代器模拟实现

4. 数据的增删查改

4.1 reserve

4.2 push_back和append

4.3 +=

4.4 insert

4.5 erase

4.6 find

4.7 substr

5. 拷贝构造

5.1 浅拷贝默认拷贝构造

5.2 深拷贝拷贝构造函数

6. 源码(上部分)

6.1 string.h

6.2 test.cpp

7. 总结