【STL实现原理与源码探析】

1. 函数对象与pair类型初探

前言

在STL容器中有一种集合容器set,set容器内部元素唯一并按照一定规则顺序排列。下面将通过set容器装入基本数据类型和类对象的实例,在程序中一步步分析函数对象的本质和使用方法,并延伸出自己在学习STL时的一些心得体会。

1.1 话题引出:set容器自动排序的实现

我们首先定义一个int类型的set容器,并放入int类型数据

cpp 复制代码
#define _CRT_SECURE_NO_WARNINGS
#include <iostream>
using namespace std;

#include <set>

//存入基本数据类型
void FuncTest1()
{
	set<int, less<int>> s1;

	int temp;
	cout << "输入set的值:";
	cin >> temp;
	while (temp != EOF)
	{
		s1.insert(temp);
		cout << "输入set的值:";
		cin >> temp;
	}

	for (set<int, less<int>>::iterator it = s1.begin(); it != s1.end(); it++)
	{
		cout << *it << " ";
	}
	cout << endl;

	cout << "s1长度:" << s1.size() << endl;

	while (!s1.empty())
	{
		cout << *s1.begin() << " ";
		s1.erase(s1.begin());
	}
	cout << endl;

	s1.clear();
	cout << "s1长度:" << s1.size() << endl;
}

int main()
{
	FuncTest1();
	
	system("pause");
	return 0;
}

通过程序运行结果,我们可以初步了解到set容器元素唯一和自动排序的特性。那么有一个问题,set自动排序的规则是怎么确定的,这个规则是否可以由我们自己制定呢?

我们默认情况下定义一个容器

cpp 复制代码
set<int> s;

它实际上是

cpp 复制代码
set<int, less<int>> s;

这里的less就是一个函数对象,它规定了这个set容器内部排序规则为从小到大排序,实际上在set容器种装入元素时,他会首先进入less这个函数,满足规则才放入元素并根据规则存放,不满规则(重复数据)就放入失败,这个在后面会说。

这样,在set容器放入int型数据,实现自动排序的机制我们就了解了,他是采用了一个类似于回调函数的方式实现的。那么新的问题又出现了,当我放入一个int型数据的时候,set默认知道如何排序,那我们放入一个既有int数据又有字符串以及更复杂的数据类型时,set能否自动排序呢?我们通过下面的例子分析。

1.2 set容器装入类对象元素

首先我们定义一个类MyString

cpp 复制代码
class MyString
{
public:
	MyString(const char* str)
	{
		if (str == NULL)
		{
			throw "str == NULL";
		}
		this->len = strlen(str);
		this->str = new char[this->len + 1];
		strcpy(this->str, str);
	}
	MyString(const MyString& s) //必须加const
	{
		this->len = s.len;
		this->str = new char[this->len + 1];
		strcpy(this->str, s.str);
	}
	~MyString()
	{
		if (this->str != NULL)
		{
			delete[] this->str;
			this->str = NULL;
		}
		this->len = 0;
	}
public:
	friend ostream& operator<<(ostream& out, MyString s);
public:
	int		len;
	char*	str;
};

ostream& operator<<(ostream& out, MyString s)
{
	out << "string: " << s.str << "\t" << "strlen: " << s.len << endl;
	return out;
}

这个类中包含两个成员,长度和字符串内容。这里需要注意一点,因为容器执行的是值拷贝,也就是把一个对象元素拷贝到容器中,所以在类中必须自定义一个拷贝构造函数,以免出现浅拷贝问题,并且装入set容器中的数据必须可以被拷贝(含有拷贝构造函数)。

定义好类后,我们在测试函数中放入类对象

cpp 复制代码
void FuncTest2()
{
    set<MyString> s; 	

	MyString s1("ccc");

	s.insert(s1);
}

int main()
{
    system("pause");
    return 0;
}

编译程序,发现编译器报错

我们双击错误提示定义到错误位置

我们发现错误被定位到了xstddef文件的第127行,这根本就不是我们自己的cpp文件,我们仔细看这段代码可以发现,原来这就是我们上面提到的

cpp 复制代码
set<int, less<int>> s;

中的函数对象less的实现,我们可以猜测这应该STL的源码,分析这段源码可以看到,less函数有两个参数left和right,返回值是一个bool类型,该函数返回两个参数的比较结果,由此可以看出,这个比较规则并不能对我们的MyString类对象进行比较,因为他不知道是比较对象的len成员还是str成员。那么我们就可以自己定义一个函数对象来实现MyString类对象的比较规则,首先介绍函数对象的定义。

1.3 函数对象(仿函数)

在C语言中,我们可以通过函数指针做函数参数来实现C语言风格的回调函数,在回调函数中实现自己需要的回调行为,在C++中还提供了另一种实现回调函数的方法,就是函数对象,也叫仿函数。

函数对象就是一个重载了函数调用操作符的类所定义的对象 ,该类对象表现出类似于函数调用的一个行为,通过函数对象可以实现自定义的回调行为。总之,函数对象类似于函数的功能,其实质就是一个回调函数,会在适当时机进行调用,并执行预定义的规则。下面将通过自定义一个函数对象,一步一步的分析函数对象及调用时机。

1.4 自定义函数对象实现MyString对象的排序规则

STL提供的默认排序机制less并不能对我们的MyString类对象进行排序,也就是函数对象less提供的排序机制不知道我们自定义的数据该如何排序。初次接触,我们可能并不知道如何定义一个函数对象的接口,它的返回值,参数等。这时我们可以通过VS的转到定义功能来查看源码,源码是最好的书籍和实例。less函数对象的源码如下:

cpp 复制代码
/*此为源码*/
// STRUCT TEMPLATE less
template <class _Ty = void>
struct less {
    _CXX17_DEPRECATE_ADAPTOR_TYPEDEFS typedef _Ty first_argument_type;
    _CXX17_DEPRECATE_ADAPTOR_TYPEDEFS typedef _Ty second_argument_type;
    _CXX17_DEPRECATE_ADAPTOR_TYPEDEFS typedef bool result_type;

    constexpr bool operator()(const _Ty& _Left, const _Ty& _Right) const {
        return _Left < _Right;
    }
};

我们可以模仿less实现一个简单的函数对象

cpp 复制代码
struct StringFunc //可参考源码模仿
{
	//重载函数调用操作符,实现string类的排序功能
	constexpr bool operator()(const MyString& s1, const MyString& s2) const
	{
		if (s1.len < s2.len)
		{
			return true;
		}
		else
		{
			return false;
		}
	}
};

我们的规则是按照字符串的长度进行排序,使用我们自定义的函数对象定义一个容器

cpp 复制代码
void FuncTest2()
{
	set<MyString, StringFunc> s;
	
	MyString s1("ccc");
	MyString s2("a");
	MyString s3("dddd");
	MyString s4("bb");
	MyString s5("eeeee");
	MyString s6("e");

	s.insert(s1);
    s.insert(s2);
	s.insert(s3);
	s.insert(s4);
	s.insert(s5);
	s.insert(s6);
	
	for (set<MyString, StringFunc>::iterator it = s.begin(); it != s.end(); it++)
	{
		cout << *it;
	}
}

编译运行

我们看到打印结果,字符串按照长度进行了顺序排列,且长度相同的元素s6没有插入到容器中。这时候,我们又发现一个新问题,s6是没有插入还是插入后被覆盖了,又或者是其他什么情况导致他没有进入容器,那么我们定义的StringFunc是在什么时候调用的呢?

1.5 insert函数返回值、pair类型、以及函数对象调用时机

点击insert,转到定义,可以看到insert函数的原型

cpp 复制代码
/*此为源码*/
template <bool _Multi2 = _Multi, enable_if_t<!_Multi2, int> = 0>
    pair<iterator, bool> insert(const value_type& _Val) {
        const auto _Result = _Emplace(_Val);
        return {iterator(_Result.first, _Get_scary()), _Result.second};
    }

我们看到insert这个函数是有返回值的,它返回一个pair<iterator, bool>。pair是一个对组,它将两个值放在一起当作一个单位使用,两个值可以是相同类型,也可以是不同类型。这里insert函数返回的一个是迭代器,一个是bool类型。我们可以通过pair的第二个值来判断插入是否成功。

我们把代码升级一下,通过一个pair变量来判断插入是否成功

cpp 复制代码
void FuncTest2()
{
	set<MyString, StringFunc> s;

	MyString s1("ccc");
	MyString s2("a");
	MyString s3("dddd");
	MyString s4("bb");
	MyString s5("eeeee");
	MyString s6("e");

	s.insert(s1);
	pair<set<MyString, StringFunc>::iterator, bool> my_pair;
	my_pair = s.insert(s2); 
	if (my_pair.second == true)
	{
		cout << "insert success" << "\t" << *(my_pair.first);
	}
	else
	{
		cout << "insert failed" << endl;
	}
	s.insert(s3);
	s.insert(s4);
	s.insert(s5);
	my_pair = s.insert(s6);
	if (my_pair.second == true)
	{
		cout << "insert success" << "\t" << *(my_pair.first);
	}
	else
	{
		cout << "insert failed" << endl;
	}

	for (set<MyString, StringFunc>::iterator it = s.begin(); it != s.end(); it++)
	{
		cout << *it;
	}
}

我们在

cpp 复制代码
my_pair = s.insert(s2); 

处加一个断点,开始调试。通过单步调试可以看到,在插入元素前会先进入函数对象StringFunc所重载的()操作符函数中,如果插入成功,再去执行MyString的拷贝构造函数,把元素拷贝到容器中;如果返回false即容器中已经有同样长度(不符合规则)的元素,那么就不再执行拷贝构造函数复制元素了。

总结

学习STL遇到不认识的类型,不会的语法,可以通过VS的转到定义功能去查看源码。另外一定要多实践,把程序加断点一步一步的调试,观察程序每一步的行为,这样才能深刻理解C++程序和编译器的每一步行为。学习最重要的不是知识点本身,而是学习的方法和对待问题形成自己的理解。最后贴上完整程序:

cpp 复制代码
#define _CRT_SECURE_NO_WARNINGS
#include <iostream>
using namespace std;

#include <set>

//存入基本数据类型
void FuncTest1()
{
	set<int, less<int>> s1;

	int temp;
	cout << "输入set的值:";
	cin >> temp;
	while (temp != EOF)
	{
		s1.insert(temp);
		cout << "输入set的值:";
		cin >> temp;
	}

	for (set<int, less<int>>::iterator it = s1.begin(); it != s1.end(); it++)
	{
		cout << *it << " ";
	}
	cout << endl;

	cout << "s1长度:" << s1.size() << endl;

	while (!s1.empty())
	{
		cout << *s1.begin() << " ";
		s1.erase(s1.begin());
	}
	cout << endl;

	s1.clear();
	cout << "s1长度:" << s1.size() << endl;
}

class MyString
{
public:
	MyString(const char* str)
	{
		if (str == NULL)
		{
			throw "str == NULL";
		}
		this->len = strlen(str);
		this->str = new char[this->len + 1];
		strcpy(this->str, str);
	}
	MyString(const MyString& s) //必须加const
	{
		this->len = s.len;
		this->str = new char[this->len + 1];
		strcpy(this->str, s.str);
	}
	~MyString()
	{
		if (this->str != NULL)
		{
			delete[] this->str;
			this->str = NULL;
		}
		this->len = 0;
	}
public:
	friend ostream& operator<<(ostream& out, MyString s);
public:
	int		len;
	char*	str;
};

ostream& operator<<(ostream& out, MyString s)
{
	out << "string: " << s.str << "\t" << "strlen: " << s.len << endl;
	return out;
}

//定义一个仿函数
/*
template <class _Ty = void>
struct less {
	_CXX17_DEPRECATE_ADAPTOR_TYPEDEFS typedef _Ty first_argument_type;
	_CXX17_DEPRECATE_ADAPTOR_TYPEDEFS typedef _Ty second_argument_type;
	_CXX17_DEPRECATE_ADAPTOR_TYPEDEFS typedef bool result_type;

	constexpr bool operator()(const _Ty& _Left, const _Ty& _Right) const {
		return _Left < _Right;
	}
};
*/
struct StringFunc //可参考源码模仿
{
	//重载函数调用操作符,实现string类的排序功能
	constexpr bool operator()(const MyString& s1, const MyString& s2) const
	{
		if (s1.len < s2.len)
		{
			return true;
		}
		else
		{
			return false;
		}
	}
};

void FuncTest2()
{
	set<MyString, StringFunc> s;
	//set<MyString> s; //不知道该如何排序
	//错误	C2676	二进制" < ":"const _Ty"不定义该运算符或到预定义运算符可接收的类型的转换	

	MyString s1("ccc");
	MyString s2("a");
	MyString s3("dddd");
	MyString s4("bb");
	MyString s5("eeeee");
	MyString s6("e");

	s.insert(s1);
	/*
	template <bool _Multi2 = _Multi, enable_if_t<!_Multi2, int> = 0>
	pair<iterator, bool> insert(const value_type& _Val) {
		const auto _Result = _Emplace(_Val);
		return {iterator(_Result.first, _Get_scary()), _Result.second};
	}
	*/
	pair<set<MyString, StringFunc>::iterator, bool> my_pair;
	my_pair = s.insert(s2); //先调用(),再调用拷贝构造函数
	if (my_pair.second == true)
	{
		cout << "insert success" << "\t" << *(my_pair.first);
	}
	else
	{
		cout << "insert failed" << endl;
	}
	s.insert(s3);
	s.insert(s4);
	s.insert(s5);
	my_pair = s.insert(s6);
	if (my_pair.second == true)
	{
		cout << "insert success" << "\t" << *(my_pair.first);
	}
	else
	{
		cout << "insert failed" << endl;
	}

	for (set<MyString, StringFunc>::iterator it = s.begin(); it != s.end(); it++)
	{
		cout << *it;
	}
}

int main()
{
	//FuncTest1();
	FuncTest2();
	
	system("pause");
	return 0;
}
相关推荐
小菜日记^_^25 分钟前
Maven高级篇
java·spring boot·后端·spring·maven·intellij-idea·mybatis
小杨4041 小时前
高级并发编程系列七(锁入门)
java·后端·性能优化
计算机毕设指导61 小时前
基于SpringBoot的教学辅助平台系统【附源码】
java·spring boot·后端·mysql·spring·tomcat·mybatis
乄bluefox2 小时前
SpringBoot中使用Sharding-JDBC实战(实战+版本兼容+Bug解决)
java·数据库·spring boot·redis·后端·缓存·bug
往日情怀酿做酒 V17639296382 小时前
Django基础配置
后端·python·django
2401_857600952 小时前
企业OA管理系统:Spring Boot技术实践与案例分析
java·spring boot·后端
潜洋2 小时前
Spring Boot 教程之六:Spring Boot - 架构
java·spring boot·后端·架构
尘浮生4 小时前
Java项目实战II基于SpringBoot的共享单车管理系统开发文档+数据库+源码)
java·开发语言·数据库·spring boot·后端·微信小程序·小程序
huaxiaorong4 小时前
如何将旧的Android手机改造为家用服务器
后端
2401_857439694 小时前
社团管理新工具:SpringBoot框架
java·spring boot·后端