1. 函数对象与pair类型初探
前言
在STL容器中有一种集合容器set,set容器内部元素唯一并按照一定规则顺序排列。下面将通过set容器装入基本数据类型和类对象的实例,在程序中一步步分析函数对象的本质和使用方法,并延伸出自己在学习STL时的一些心得体会。
1.1 话题引出:set容器自动排序的实现
我们首先定义一个int类型的set容器,并放入int类型数据
cpp
#define _CRT_SECURE_NO_WARNINGS
#include <iostream>
using namespace std;
#include <set>
//存入基本数据类型
void FuncTest1()
{
set<int, less<int>> s1;
int temp;
cout << "输入set的值:";
cin >> temp;
while (temp != EOF)
{
s1.insert(temp);
cout << "输入set的值:";
cin >> temp;
}
for (set<int, less<int>>::iterator it = s1.begin(); it != s1.end(); it++)
{
cout << *it << " ";
}
cout << endl;
cout << "s1长度:" << s1.size() << endl;
while (!s1.empty())
{
cout << *s1.begin() << " ";
s1.erase(s1.begin());
}
cout << endl;
s1.clear();
cout << "s1长度:" << s1.size() << endl;
}
int main()
{
FuncTest1();
system("pause");
return 0;
}
通过程序运行结果,我们可以初步了解到set容器元素唯一和自动排序的特性。那么有一个问题,set自动排序的规则是怎么确定的,这个规则是否可以由我们自己制定呢?
我们默认情况下定义一个容器
cpp
set<int> s;
它实际上是
cpp
set<int, less<int>> s;
这里的less就是一个函数对象,它规定了这个set容器内部排序规则为从小到大排序,实际上在set容器种装入元素时,他会首先进入less这个函数,满足规则才放入元素并根据规则存放,不满规则(重复数据)就放入失败,这个在后面会说。
这样,在set容器放入int型数据,实现自动排序的机制我们就了解了,他是采用了一个类似于回调函数的方式实现的。那么新的问题又出现了,当我放入一个int型数据的时候,set默认知道如何排序,那我们放入一个既有int数据又有字符串以及更复杂的数据类型时,set能否自动排序呢?我们通过下面的例子分析。
1.2 set容器装入类对象元素
首先我们定义一个类MyString
cpp
class MyString
{
public:
MyString(const char* str)
{
if (str == NULL)
{
throw "str == NULL";
}
this->len = strlen(str);
this->str = new char[this->len + 1];
strcpy(this->str, str);
}
MyString(const MyString& s) //必须加const
{
this->len = s.len;
this->str = new char[this->len + 1];
strcpy(this->str, s.str);
}
~MyString()
{
if (this->str != NULL)
{
delete[] this->str;
this->str = NULL;
}
this->len = 0;
}
public:
friend ostream& operator<<(ostream& out, MyString s);
public:
int len;
char* str;
};
ostream& operator<<(ostream& out, MyString s)
{
out << "string: " << s.str << "\t" << "strlen: " << s.len << endl;
return out;
}
这个类中包含两个成员,长度和字符串内容。这里需要注意一点,因为容器执行的是值拷贝,也就是把一个对象元素拷贝到容器中,所以在类中必须自定义一个拷贝构造函数,以免出现浅拷贝问题,并且装入set容器中的数据必须可以被拷贝(含有拷贝构造函数)。
定义好类后,我们在测试函数中放入类对象
cpp
void FuncTest2()
{
set<MyString> s;
MyString s1("ccc");
s.insert(s1);
}
int main()
{
system("pause");
return 0;
}
编译程序,发现编译器报错
我们双击错误提示定义到错误位置
我们发现错误被定位到了xstddef文件的第127行,这根本就不是我们自己的cpp文件,我们仔细看这段代码可以发现,原来这就是我们上面提到的
cpp
set<int, less<int>> s;
中的函数对象less的实现,我们可以猜测这应该STL的源码,分析这段源码可以看到,less函数有两个参数left和right,返回值是一个bool类型,该函数返回两个参数的比较结果,由此可以看出,这个比较规则并不能对我们的MyString类对象进行比较,因为他不知道是比较对象的len成员还是str成员。那么我们就可以自己定义一个函数对象来实现MyString类对象的比较规则,首先介绍函数对象的定义。
1.3 函数对象(仿函数)
在C语言中,我们可以通过函数指针做函数参数来实现C语言风格的回调函数,在回调函数中实现自己需要的回调行为,在C++中还提供了另一种实现回调函数的方法,就是函数对象,也叫仿函数。
函数对象就是一个重载了函数调用操作符的类所定义的对象 ,该类对象表现出类似于函数调用的一个行为,通过函数对象可以实现自定义的回调行为。总之,函数对象类似于函数的功能,其实质就是一个回调函数,会在适当时机进行调用,并执行预定义的规则。下面将通过自定义一个函数对象,一步一步的分析函数对象及调用时机。
1.4 自定义函数对象实现MyString对象的排序规则
STL提供的默认排序机制less并不能对我们的MyString类对象进行排序,也就是函数对象less提供的排序机制不知道我们自定义的数据该如何排序。初次接触,我们可能并不知道如何定义一个函数对象的接口,它的返回值,参数等。这时我们可以通过VS的转到定义功能来查看源码,源码是最好的书籍和实例。less函数对象的源码如下:
cpp
/*此为源码*/
// STRUCT TEMPLATE less
template <class _Ty = void>
struct less {
_CXX17_DEPRECATE_ADAPTOR_TYPEDEFS typedef _Ty first_argument_type;
_CXX17_DEPRECATE_ADAPTOR_TYPEDEFS typedef _Ty second_argument_type;
_CXX17_DEPRECATE_ADAPTOR_TYPEDEFS typedef bool result_type;
constexpr bool operator()(const _Ty& _Left, const _Ty& _Right) const {
return _Left < _Right;
}
};
我们可以模仿less实现一个简单的函数对象
cpp
struct StringFunc //可参考源码模仿
{
//重载函数调用操作符,实现string类的排序功能
constexpr bool operator()(const MyString& s1, const MyString& s2) const
{
if (s1.len < s2.len)
{
return true;
}
else
{
return false;
}
}
};
我们的规则是按照字符串的长度进行排序,使用我们自定义的函数对象定义一个容器
cpp
void FuncTest2()
{
set<MyString, StringFunc> s;
MyString s1("ccc");
MyString s2("a");
MyString s3("dddd");
MyString s4("bb");
MyString s5("eeeee");
MyString s6("e");
s.insert(s1);
s.insert(s2);
s.insert(s3);
s.insert(s4);
s.insert(s5);
s.insert(s6);
for (set<MyString, StringFunc>::iterator it = s.begin(); it != s.end(); it++)
{
cout << *it;
}
}
编译运行
我们看到打印结果,字符串按照长度进行了顺序排列,且长度相同的元素s6没有插入到容器中。这时候,我们又发现一个新问题,s6是没有插入还是插入后被覆盖了,又或者是其他什么情况导致他没有进入容器,那么我们定义的StringFunc是在什么时候调用的呢?
1.5 insert函数返回值、pair类型、以及函数对象调用时机
点击insert,转到定义,可以看到insert函数的原型
cpp
/*此为源码*/
template <bool _Multi2 = _Multi, enable_if_t<!_Multi2, int> = 0>
pair<iterator, bool> insert(const value_type& _Val) {
const auto _Result = _Emplace(_Val);
return {iterator(_Result.first, _Get_scary()), _Result.second};
}
我们看到insert这个函数是有返回值的,它返回一个pair<iterator, bool>。pair是一个对组,它将两个值放在一起当作一个单位使用,两个值可以是相同类型,也可以是不同类型。这里insert函数返回的一个是迭代器,一个是bool类型。我们可以通过pair的第二个值来判断插入是否成功。
我们把代码升级一下,通过一个pair变量来判断插入是否成功
cpp
void FuncTest2()
{
set<MyString, StringFunc> s;
MyString s1("ccc");
MyString s2("a");
MyString s3("dddd");
MyString s4("bb");
MyString s5("eeeee");
MyString s6("e");
s.insert(s1);
pair<set<MyString, StringFunc>::iterator, bool> my_pair;
my_pair = s.insert(s2);
if (my_pair.second == true)
{
cout << "insert success" << "\t" << *(my_pair.first);
}
else
{
cout << "insert failed" << endl;
}
s.insert(s3);
s.insert(s4);
s.insert(s5);
my_pair = s.insert(s6);
if (my_pair.second == true)
{
cout << "insert success" << "\t" << *(my_pair.first);
}
else
{
cout << "insert failed" << endl;
}
for (set<MyString, StringFunc>::iterator it = s.begin(); it != s.end(); it++)
{
cout << *it;
}
}
我们在
cpp
my_pair = s.insert(s2);
处加一个断点,开始调试。通过单步调试可以看到,在插入元素前会先进入函数对象StringFunc所重载的()操作符函数中,如果插入成功,再去执行MyString的拷贝构造函数,把元素拷贝到容器中;如果返回false即容器中已经有同样长度(不符合规则)的元素,那么就不再执行拷贝构造函数复制元素了。
总结
学习STL遇到不认识的类型,不会的语法,可以通过VS的转到定义功能去查看源码。另外一定要多实践,把程序加断点一步一步的调试,观察程序每一步的行为,这样才能深刻理解C++程序和编译器的每一步行为。学习最重要的不是知识点本身,而是学习的方法和对待问题形成自己的理解。最后贴上完整程序:
cpp
#define _CRT_SECURE_NO_WARNINGS
#include <iostream>
using namespace std;
#include <set>
//存入基本数据类型
void FuncTest1()
{
set<int, less<int>> s1;
int temp;
cout << "输入set的值:";
cin >> temp;
while (temp != EOF)
{
s1.insert(temp);
cout << "输入set的值:";
cin >> temp;
}
for (set<int, less<int>>::iterator it = s1.begin(); it != s1.end(); it++)
{
cout << *it << " ";
}
cout << endl;
cout << "s1长度:" << s1.size() << endl;
while (!s1.empty())
{
cout << *s1.begin() << " ";
s1.erase(s1.begin());
}
cout << endl;
s1.clear();
cout << "s1长度:" << s1.size() << endl;
}
class MyString
{
public:
MyString(const char* str)
{
if (str == NULL)
{
throw "str == NULL";
}
this->len = strlen(str);
this->str = new char[this->len + 1];
strcpy(this->str, str);
}
MyString(const MyString& s) //必须加const
{
this->len = s.len;
this->str = new char[this->len + 1];
strcpy(this->str, s.str);
}
~MyString()
{
if (this->str != NULL)
{
delete[] this->str;
this->str = NULL;
}
this->len = 0;
}
public:
friend ostream& operator<<(ostream& out, MyString s);
public:
int len;
char* str;
};
ostream& operator<<(ostream& out, MyString s)
{
out << "string: " << s.str << "\t" << "strlen: " << s.len << endl;
return out;
}
//定义一个仿函数
/*
template <class _Ty = void>
struct less {
_CXX17_DEPRECATE_ADAPTOR_TYPEDEFS typedef _Ty first_argument_type;
_CXX17_DEPRECATE_ADAPTOR_TYPEDEFS typedef _Ty second_argument_type;
_CXX17_DEPRECATE_ADAPTOR_TYPEDEFS typedef bool result_type;
constexpr bool operator()(const _Ty& _Left, const _Ty& _Right) const {
return _Left < _Right;
}
};
*/
struct StringFunc //可参考源码模仿
{
//重载函数调用操作符,实现string类的排序功能
constexpr bool operator()(const MyString& s1, const MyString& s2) const
{
if (s1.len < s2.len)
{
return true;
}
else
{
return false;
}
}
};
void FuncTest2()
{
set<MyString, StringFunc> s;
//set<MyString> s; //不知道该如何排序
//错误 C2676 二进制" < ":"const _Ty"不定义该运算符或到预定义运算符可接收的类型的转换
MyString s1("ccc");
MyString s2("a");
MyString s3("dddd");
MyString s4("bb");
MyString s5("eeeee");
MyString s6("e");
s.insert(s1);
/*
template <bool _Multi2 = _Multi, enable_if_t<!_Multi2, int> = 0>
pair<iterator, bool> insert(const value_type& _Val) {
const auto _Result = _Emplace(_Val);
return {iterator(_Result.first, _Get_scary()), _Result.second};
}
*/
pair<set<MyString, StringFunc>::iterator, bool> my_pair;
my_pair = s.insert(s2); //先调用(),再调用拷贝构造函数
if (my_pair.second == true)
{
cout << "insert success" << "\t" << *(my_pair.first);
}
else
{
cout << "insert failed" << endl;
}
s.insert(s3);
s.insert(s4);
s.insert(s5);
my_pair = s.insert(s6);
if (my_pair.second == true)
{
cout << "insert success" << "\t" << *(my_pair.first);
}
else
{
cout << "insert failed" << endl;
}
for (set<MyString, StringFunc>::iterator it = s.begin(); it != s.end(); it++)
{
cout << *it;
}
}
int main()
{
//FuncTest1();
FuncTest2();
system("pause");
return 0;
}