C++之string类的实现代码及其详解(下)

我们在使用C++STL库里面的string的时候,我们可以直接通过运算符来进行大于,小于或者各类运算,这个便是我们在string这个类里面对运算符进行了重载,使它有了新的意思。

1. operator[]

以下这个代码是类的下标运算符重载。这个函数允许对象像数组一样使用方括号[]来访问其内部字符元素,并返回指定位置字符的引用。

就比如说pos等于3,就是把这个_str里面第三个给取出来。举个例子,现在有一个string s1,

然后s1[3]就是把s1里面从前往后数第三个字符给return。我们可以把重载后的[]当做一个函数。

cpp 复制代码
char& operator[](size_t pos)
{
	assert(pos < _size);
	return _str[pos];
}

2. operator=

这个运算符重载的作用就是实现赋值。

在这里面,这个this叫做this指针,是指向被赋值的对象。举个例子,现在有一个string a,我们对他进行a=b的操作,那么这个this就是指向a的。

我们通过this指针来判断被赋值的对象(a)和赋值对象(b)是否相等,如果已经相等那就没有判断的必要,如果进入if里面的话就先开辟一个b大小的空间,然后把b里面的东西复制进入这个空间里面并销毁a里面原先空间的内容,然后把新开辟的内存全部叫给a,从而实现赋值。

PS:各位看到这里不知道有没有去想一想为什么不可以直接让a指向b不就好了吗?这是因为这种方法叫做浅拷贝,而浅拷贝会触发两个问题。第一就是我们在改变a或b的时候会让另一个也被改变。第二就是我们在delete的时候会对同一个空间析构两次。

cpp 复制代码
string& operator=(const string& s)
{
	if (this != &s)
	{
		char* tmp = new char[s._capacity + 1];
		memcpy(tmp, s._str, s._size + 1);
		delete[] _str;
		_str = tmp;
		_size = s._size;
		_capacity = s._capacity;
	}
	return *this;
}

3. operator+=

这个加等我们可以把他理解为push_back。可能有人会想明明有push_back了为什么还要这个+=呢?其实就是为了更方便的去编写代码。

这个没什么好说的,就是先push_back然后返回被添加对象的开头位置。

cpp 复制代码
string& operator+=(char ch)
{
	push_back(ch);
	return *this;
}

这个的话就是添加字符串的时候用的,加上const是因为const char* str表示指针指向的字符串内容不能被修改。因为operator+=的功能是"把str追加到当前字符串后",而不是修改str本身,加const可以防止函数内部意外修改str的内容,也能接收const类型的字符串(比如字面量"abc",它本身就是const char*类型)。

如果参数不带const(即char* str),那么当传入一个常量字符串(如"test")时,会因为类型不匹配(const char*无法隐式转换为char*)而编译报错。所以带const是更通用、更安全的设计。

cpp 复制代码
string& operator+=(const char* str)
{
	append(str);
	return *this;
}

4. operator<

这个的话就是比较两个string类的大小,如果是符合小于的话就会返回true,否则返回false。

PS:string大小是按字符的ASCII值逐个比较

  1. 从两个字符串的第一个字符开始,依次对比对应位置的字符。

  2. 当遇到第一对不相等的字符时,直接根据这两个字符的ASCII值判断大小:ASCII值小的字符所在的字符串更小。

  3. 如果所有字符都相同,则较短的字符串更小;若长度也相同,则两个字符串相等(返回false)。

例如:

• "apple" < "banana":第一个字符'a'(ASCII 97) < 'b'(ASCII 98),所以前者更小。

• "app" < "apple":前3个字符相同,前者长度更短,所以更小。

这个函数逐字符比较当前字符串(this)与参数字符串s:首先同步遍历两个字符串的每个字符,若发现不同字符,则根据该字符的 ASCII 值判断大小并立即返回结果;若所有已遍历字符均相同,则在循环结束后比较剩余长度,若当前字符串先结束(更短)则返回true,否则返回false。例如,比较"abc""abd"时,会在第三个字符处因'c' < 'd'返回true;比较"abc""abcd"时,循环结束后因当前字符串更短而返回true

cpp 复制代码
bool operator<(const string& s) const
{
	size_t i1 = 0;
	size_t i2 = 0;
	while (i1 < _size && i2 < s._size)
	{
		if (_str[i1] < s._str[i2])
		{
			return true;
		}
		else if (_str[i1] > s._str[i2])
		{
			return false;
		}
		else
		{
			++i1;
			++i2;
		}
	}
    if (i1 == _size && i2 != s._size)
	{
	    return true;
	}
	else
	{
		return false;
	}
}	

5. operator==

这个函数就是判断两个string类是否是否相等,如果相等就返回true,否则返回false。

我们在这里通过逻辑运算符,比较两个size是否相等和memcpy是否成功(成功返回0)来直接判断。

cpp 复制代码
bool operator==(const string& s) const
{
	return _size == s._size &&
	memcmp(_str, s._str, _size) == 0;
}

6. operator<=

这个的话就是比较两个string类的大小,如果是符合小于等于的话就会返回true,否则返回false。

因为我们已经实现了<和==,所以我们在这里直接

7. operator>

这个的话就是比较两个string类的大小,如果是符合大于的话就会返回true,否则返回false。

这边也是,因为不是小于等于就是大于。

cpp 复制代码
bool operator>(const string& s) const
{
	return !(*this <= s);
}

8. operator>=

这个的话就是比较两个string类的大小,如果是符合大于的话就会返回true,否则返回false。

这个也是一样的道理,对小于取反就可以了。

cpp 复制代码
bool operator >=(const string& s) const
{
	return !(*this < s);
}

9. operator<<

这段代码定义了一个针对 struggle::string 类型的输出流运算符重载函数。它允许使用 << 运算符将 struggle::string 对象直接输出到标准输出流(如 cout)或其他输出流中。

函数遍历 s 中的每个字符,依次将其写入输出流 out,最后返回流的引用以支持链式输出(如 cout << s1 << s2)。这种实现方式假设 struggle::string 是一个类似标准库 std::string 的自定义字符串类,支持范围 - based for 循环(即提供了迭代器接口)。

PS:std是因为ostreamoperator<<的输出流相关功能属于 C++ 标准库的命名空间stdostream是所有输出流类型的基类,所以在这里写的是这个。

cpp 复制代码
std::ostream& operator<<(std::ostream& out, const struggle::string& s)
{
	for (auto ch : s)
	{
		out << ch;
	}
	return out;
}

10. operator>>

这个的话就是模拟string的流输入,把内容流入所创建的string类中。

当然我们在一开始要清空原先在里面的内容,然后在读入的同时去掉空格,接着开始重复读入(如果读入满了那就先放入新的string里面然后接着读入)。最后那个if(i != 0)的作用是处理最后一批未填满缓冲区的字符。

cpp 复制代码
std::istream& operator>>(std::istream& in, struggle::string& s)
{
	s.clear();

	char ch = in.get();
	while (ch == ' ' || ch == '\n')
	{
		ch = in.get();
	}
	char buff[256];
	int i = 0;

	while (ch != ' ' && ch != '\n')
	{
		buff[i++] = ch;
		if (i == 255)
		{
			buff[i] = '\0';
			s += buff;
			i = 0;
		}
		ch = in.get();
	}
	if (i != 0)
	{
		buff[i] = '\0';
		s += buff;
	}
	return in;

}

11. 总结

到这里我们的string就基本上讲完了,运算符重载让字符串操作更直观;而push_back等接口函数则从底层支撑起字符添加、长度管理等基础功能。两者结合,既保证了使用的便捷性,又通过内存安全处理,实现了一个可靠的字符串类,也深化了对类封装与内存管理的理解。以下是string的完整代码。

cpp 复制代码
#pragma once
#define _CRT_SECURE_NO_WARNINGS 1
#include<assert.h>
#include<string.h>
#include<iostream>
namespace struggle
{
	class string
	{
	public:
		typedef char* iterator;
		typedef const char* const_iterator;

		iterator begin()
		{
			return _str;
		}

		iterator end()
		{
			return _str + _size;
		}

		const_iterator begin() const
		{
			return _str;
		}

		const_iterator end() const
		{
			return _str + _size;
		}

		string(const char* str = "")
		{
			_size = strlen(str);
			_capacity = _size;
			_str = new char[_capacity + 2];
			memcpy(_str, str, _size+1);
		}

		string(const string& s)
		{
			_str = new char[s._capacity + 2];
			memcpy(_str, s._str,s._size+1);
			_size = s._size;
			_capacity = s._capacity;
		}

		~string()
		{
			delete[]_str;
			_str = nullptr;
			_size = _capacity = 0;
		}

		const char* c_str() const
		{
			return _str;
		}

		size_t size() const
		{
			return _size;
		}

		size_t capacity() const
		{
			return _capacity;
		}

		char& operator[](size_t pos)
		{
			assert(pos < _size);
			return _str[pos];
		}

		void reserve(size_t n)
		{
			if (n > _capacity)
			{
				char* tmp = new char[n + 2];
				memcpy(tmp, _str, _size+1);
				delete[] _str;
				_str = tmp;
				_capacity = n;
			}
		}

		void push_back(char ch)
		{
			if (_size == _capacity)
			{
				reserve(_capacity == 0 ? 4 : _capacity * 2);
			}
			_str[_size] = ch;
			++_size;
			_str[_size] = '\0';
		}

		void append(const char* str)
		{
			size_t len = strlen(str);
			if (_size + len > _capacity)
			{
				reserve(_size+len+2);
			}
			memcpy(_str + _size, str, len+1);
			_size += len;
		}

		string& operator=(const string& s)
		{
			if (this != &s)
			{
				char* tmp = new char[s._capacity + 1];
				memcpy(tmp, s._str, s._size + 1);
				delete[] _str;
				_str = tmp;
				_size = s._size;
				_capacity = s._capacity;
			}
			return *this;
		}

		string& operator+=(char ch)
		{
			push_back(ch);
			return *this;
		}

		string& operator+=(const char* str)
		{
			append(str);
			return *this;
		}

		
		void insert(size_t pos, size_t n, char ch)
		{
			assert(pos <= _size);
			if (_size + n > _capacity)
			{
				reserve(_size + n + 2);
			}
			size_t end = _size;
			while (end >= pos && end != npos)
			{
				_str[end + n] = _str[end];
				--end;
			}
			for (size_t i = 0; i < n; ++i)
			{
				_str[pos+i] = ch;
			}
			_size += n;
		}

		void insert(size_t pos, const char* str)
		{
			assert(pos <= _size);
			size_t len = strlen(str);
			if (len + _size >= _capacity)
			{
				reserve(len + _size + 2);
			}
			size_t end = _size;
			while (end >= pos && end != npos)
			{
				_str[end + len] = _str[end];
				--end;
			}
			for (size_t i = 0; i < len; ++i)
			{
				_str[pos + i] = str[i];
			}
			_size += len;
		}

		void erase(size_t pos, size_t len = npos)
		{
			assert(pos <= _size);
			if (len == npos || pos + len >= _size)
			{
				_str[pos] = '\0';
				_size = pos;
				//_str[_size] = '\0';
			}
			else
			{
				size_t end = pos + len;
				while (end <= _size)
				{
					_str[pos++] = _str[end++];
				}
				_size -= len;
			}
		}

		size_t find(char ch, size_t pos = 0)
		{
			assert(pos <= _size);
			for (size_t i = pos; i <= _size; ++i)
			{
				if (_str[i] == ch)
				{
					return i;
				}
			}
			return npos;
		}

		/*size_t find(const char* str, size_t pos = 0)
		{
			assert(pos <= _size);
			for (size_t i = pos; i <= _size; ++i)
			{
				if (_str[i] == str)
				{
					return i;
				}
			}
			return npos;
		}
		}*/

		string substr1(size_t pos = 0, size_t len = npos)
		{
			assert(pos < _size);
			size_t n = len;
			if (len == npos || pos + len > _size)
			{
				n = _size - pos;
			}
			string tmp;
			tmp.reserve(n);
			for (size_t i = pos; i < pos + n; ++i)
			{
				tmp += _str[i];
			}
			return tmp;
		}

		string substr2(size_t pos = 0, size_t len = npos)
		{
			assert(pos < _size);
			size_t n = len;
			if (len == npos || pos + len > _size)
			{
				n = _size - pos;
			}
			string tmp;
			tmp.reserve(n);
			for (size_t i = pos; i < pos + n; ++i)
			{
				for (size_t x = 0; x < n; ++x)
				{
					tmp[x] = _str[i];
				}
			}
			return tmp;
		}

		void resize(size_t n, char ch = '\0')
		{
			if (n < _size)
			{
				_size = n;
				_str[_size] = '\0';
			}
			else
			{
				reserve(n);
				for (size_t i = _size; i < n; i++)
				{
					_str[i] = ch;
				}
				_size = n;
				_str[_size] = '\0';
			}
		}

		bool operator<(const string& s) const
		{
			size_t i1 = 0;
			size_t i2 = 0;
			while (i1 < _size && i2 < s._size)
			{
				if (_str[i1] < s._str[i2])
				{
					return true;
				}
				else if (_str[i1] > s._str[i2])
				{
					return false;
				}
				else
				{
					++i1;
					++i2;
				}
				if (i1 == _size && i2 != s._size)
				{
					return true;
				}
				else
				{
					return false;
				}
			}
		}
		bool operator==(const string& s) const
		{
			return _size == s._size &&
				memcmp(_str, s._str, _size) == 0;
		}

		bool operator<=(const string& s) const
		{
			return *this < s || *this == s;
		}

		bool operator>(const string& s) const
		{
			return !(*this <= s);
		}

		bool operator >=(const string& s) const
		{
			return !(*this < s);
		}

		bool operator !=(const string& s) const
		{
			return !(*this == s);
		}

		void clear()
		{
			_size = 0;
			_str[_size] = '\0';
		}
		
	private:
		size_t _size;
		size_t _capacity;
		char* _str;
	public:
		const static size_t npos;
	};
	const size_t string::npos = -1;
}

std::ostream& operator<<(std::ostream& out, const struggle::string& s)
{
	for (auto ch : s)
	{
		out << ch;
	}
	return out;
}

std::istream& operator>>(std::istream& in, struggle::string& s)
{
	s.clear();

	char ch = in.get();
	while (ch == ' ' || ch == '\n')
	{
		ch = in.get();
	}
	char buff[256];
	int i = 0;

	while (ch != ' ' && ch != '\n')
	{
		buff[i++] = ch;
		if (i == 255)
		{
			buff[i] = '\0';
			s += buff;
			i = 0;
		}
		ch = in.get();
	}
	if (i != 0)
	{
		buff[i] = '\0';
		s += buff;
	}
	return in;

}