C++-智能指针

1. 为什么需要智能指针?

下面我们先分析一下下面这段程序有没有什么内存方面的问题?提示一下:注意分析MergeSort 函数中的问题。

cpp 复制代码
#include <iostream>
using namespace std;

int div()
{
	int a, b;
	cin >> a >> b;
	if (b == 0)
		throw invalid_argument("除0错误");
	return a / b;
}
void Func()
{
	// 1、如果p1这里new 抛异常会如何?
	// 2、如果p2这里new 抛异常会如何?
	// 3、如果div调用这里又会抛异常会如何?
	int* p1 = new int;
	int* p2 = new int;
	cout << div() << endl;
	delete p1;
	delete p2;
}
int main()
{
	try
	{
		Func();
	}
	catch (exception& e)
	{
		cout << e.what() << endl;
	}
	return 0;
}

问题分析:上面的问题分析出来我们发现有什么问题?

这段代码存在严重的内存泄漏问题,主要出现在Func()函数中:

  1. 如果p1new操作抛出异常(内存不足时可能发生):

    • 程序会直接跳转到catch

    • p1p2都不会被释放

    • 但由于p1分配失败,p2还未分配,所以只有p1的内存会泄漏

  2. 如果p2new操作抛出异常:

    • p1已成功分配但不会被释放

    • p2分配失败

    • 导致p1的内存泄漏

  3. 如果div()函数抛出异常(如除0错误):

    • p1p2都已成功分配

    • 但异常会跳过delete语句

    • 导致p1p2的内存都泄漏

2. 内存泄漏

2.1 什么是内存泄漏,内存泄漏的危害

什么是内存泄漏:内存泄漏指因为疏忽或错误造成程序未能释放已经不再使用的内存的情况。内 存泄漏并不是指内存在物理上的消失,而是应用程序分配某段内存后,因为设计错误,失去了对 该段内存的控制,因而造成了内存的浪费。

内存泄漏的危害:长期运行的程序出现内存泄漏,影响很大,如操作系统、后台服务等等,出现 内存泄漏会导致响应越来越慢,最终卡死。

cpp 复制代码
void MemoryLeaks()
{
   // 1.内存申请了忘记释放
  int* p1 = (int*)malloc(sizeof(int));
  int* p2 = new int;
  
  // 2.异常安全问题
  int* p3 = new int[10];
  
  Func(); // 这里Func函数抛异常导致 delete[] p3未执行,p3没被释放.
  
  delete[] p3;
}

2.2 内存泄漏分类

C/C++程序中一般我们关心两种方面的内存泄漏:

  • 堆内存泄漏(Heap leak) 堆内存指的是程序执行中依据须要分配通过malloc / calloc / realloc / new等从堆中分配的一 块内存,用完后必须通过调用相应的 free或者delete 删掉。假设程序的设计错误导致这部分 内存没有被释放,那么以后这部分空间将无法再被使用,就会产生Heap Leak。
  • 系统资源泄漏 指程序使用系统分配的资源,比方套接字、文件描述符、管道等没有使用对应的函数释放 掉,导致系统资源的浪费,严重可导致系统效能减少,系统执行不稳定。

2.3如何避免内存泄漏

  1. 工程前期良好的设计规范,养成良好的编码规范,申请的内存空间记着匹配的去释放。ps: 这个理想状态。但是如果碰上异常时,就算注意释放了,还是可能会出问题。需要下一条智 能指针来管理才有保证。

  2. 采用RAII思想或者智能指针来管理资源。

  3. 有些公司内部规范使用内部实现的私有内存管理库。这套库自带内存泄漏检测的功能选项。

  4. 出问题了使用内存泄漏工具检测。ps:不过很多工具都不够靠谱,或者收费昂贵。
    总结一下: 内存泄漏非常常见,解决方案分为两种:

1、事前预防型。如智能指针等。

2、事后查错型。如泄 漏检测工具。

3.智能指针的使用及原理

3.1 RAII

RAII(Resource Acquisition Is Initialization)是一种利用对象生命周期来控制程序资源(如内 存、文件句柄、网络连接、互斥量等等)的简单技术。

在对象构造时获取资源,接着控制对资源的访问使之在对象的生命周期内始终保持有效,最后在 对象析构的时候释放资源。借此,我们实际上把管理一份资源的责任托管给了一个对象。这种做 法有两大好处:

  • 不需要显式地释放资源。
  • 采用这种方式,对象所需的资源在其生命期内始终保持有效。
cpp 复制代码
#include <iostream>
#include <memory>
using namespace std;
// 使用RAII思想设计的SmartPtr类
template<class T>
class SmartPtr {
public:
    SmartPtr(T* ptr = nullptr)
        : _ptr(ptr)
    {}
    ~SmartPtr()
    {
        if (_ptr)
            delete _ptr;
    }

private:
    T* _ptr;
};
int div()
{
    int a, b;
    cin >> a >> b;
    if (b == 0)
        throw invalid_argument("除0错误");
    return a / b;
}
void Func()
{
    SmartPtr<int> sp1(new int);
    SmartPtr<int> sp2(new int);
    cout << div() << endl;
}
int main()
{
    try {
        Func();
    }
    catch (const exception& e)
    {
        cout << e.what() << endl;
    }
    return 0;
}

3.2 智能指针的原理

上述的SmartPtr还不能将其称为智能指针,因为它还不具有指针的行为。指针可以解引用,也可 以通过->去访问所指空间中的内容,因此:AutoPtr模板类中还得需要将* 、->重载下,才可让其 像指针一样去使用。

cpp 复制代码
#include <iostream>
#include <memory>
using namespace std;
template<class T>
class SmartPtr {
public:
    SmartPtr(T* ptr = nullptr)
        : _ptr(ptr)
    {}
    ~SmartPtr()
    {
        if (_ptr)
            delete _ptr;
    }
    T& operator*() { return *_ptr; }
    T* operator->() { return _ptr; }
private:
    T* _ptr;
};
struct Date
{
    int _year;
    int _month;
    int _day;
};
int main()
{
    SmartPtr<int> sp1(new int);
    *sp1 = 10;
        cout << *sp1 << endl;
    SmartPtr<Date> sparray(new Date);
    // 需要注意的是这里应该是sparray.operator->()->_year = 2018;
    // 本来应该是sparray->->_year这里语法上为了可读性,省略了一个->
    sparray->_year = 2018;
    sparray->_month = 1;
    sparray->_day = 1;
}

总结一下智能指针的原理:

  1. RAII特性

  2. 重载operator*和opertaor->,具有像指针一样的行为。

3.3 std::auto_ptr

文档:cplusplus.com/reference/memory/auto_ptr/

C++98版本的库中就提供了auto_ptr的智能指针。下面演示的auto_ptr的使用及问题。 auto_ptr的实现原理:管理权转移的思想,下面简化模拟实现了一份bit::auto_ptr来了解它的原理

cpp 复制代码
template<class T>
class auto_ptr
{
public:
    // RAII (资源获取即初始化) 设计模式
    // 构造函数,接管裸指针
    auto_ptr(T* ptr)
        :_ptr(ptr)
    {}

    // 析构函数,自动释放资源
    ~auto_ptr()
    {
        cout << "delete:" << _ptr << endl;
        delete _ptr;
    }

    // 重载*运算符,使对象能像指针一样解引用
    T& operator*()
    {
        return *_ptr;
    }

    // 重载->运算符,使对象能像指针一样访问成员
    T* operator->()
    {
        return _ptr;
    }

    // 拷贝构造函数(管理权转移)
    // 将原auto_ptr的管理权转移给新对象,原对象置空
    auto_ptr(auto_ptr<T>& ap)
        :_ptr(ap._ptr)
    {
        ap._ptr = nullptr;
    }

private:
    T* _ptr;  // 管理的裸指针
};

总结:auto_ptr 的设计违背了 C++ 的"最小意外原则",其隐式所有权转移机制在实际开发中弊大于利。现代 C++ 已提供更完善的智能指针,绝对不要在新代码中使用 auto_ptr

3.4 std::unique_ptr

文档:cplusplus.com/reference/memory/unique_ptr/

unique_ptr的实现原理:简单粗暴的防拷贝,下面简化模拟实现了一份UniquePtr来了解它的原理

cpp 复制代码
template<class T>
class unique_ptr
{
public:
    // RAII设计
    // 构造函数,接管裸指针
    unique_ptr(T* ptr)
        :_ptr(ptr)
    {}

    // 析构函数,自动释放资源
    ~unique_ptr()
    {
        cout << "delete:" << _ptr << endl;
        delete _ptr;
    }

    // 重载*运算符
    T& operator*()
    {
        return *_ptr;
    }

    // 重载->运算符
    T* operator->()
    {
        return _ptr;
    }

    // 禁用拷贝构造(防拷贝)
    unique_ptr(unique_ptr<T>& ap) = delete;
    // 禁用赋值运算符(防拷贝)
    unique_ptr<T>& operator=(unique_ptr<T>& ap) = delete;

private:
    T* _ptr;  // 管理的裸指针
};

3.5 std::shared_ptr

文档:cplusplus.com/reference/memory/shared_ptr/

shared_ptr的原理:**是通过引用计数的方式来实现多个shared_ptr对象之间共享资源。**例如: 比特老师晚上在下班之前都会通知,让最后走的学生记得把门锁下。

  1. shared_ptr在其内部,给每个资源都维护了着一份计数,用来记录该份资源被几个对象共 享。
  2. 在对象被销毁时(也就是析构函数调用),就说明自己不使用该资源了,对象的引用计数减 一。
  3. 如果引用计数是0,就说明自己是最后一个使用该资源的对象,必须释放该资源;
  4. 如果不是0,就说明除了自己还有其他对象在使用该份资源,不能释放该资源,否则其他对 象就成野指针了。
cpp 复制代码
template<class T>
class shared_ptr
{
public:
    // 构造函数,初始化引用计数为1
    shared_ptr(T* ptr = nullptr)
        :_ptr(ptr)
        , _pcount(new int(1))  // 创建引用计数器
    {}

    // 带删除器的构造函数
    template<class D>
    shared_ptr(T* ptr, D del)
        : _ptr(ptr)
        , _pcount(new int(1))
        , _del(del)  // 自定义删除器
    {}

    // 析构函数,引用计数减1,为0时释放资源
    ~shared_ptr()
    {
        if (--(*_pcount) == 0)  // 引用计数减1
        {
            cout << "delete:" << _ptr << endl;
            _del(_ptr);  // 使用删除器释放资源
            delete _pcount;  // 释放引用计数器
        }
    }

    // 重载*运算符
    T& operator*()
    {
        return *_ptr;
    }

    // 重载->运算符
    T* operator->()
    {
        return _ptr;
    }

    // 拷贝构造函数(共享所有权)
    shared_ptr(const shared_ptr<T>& sp)
        :_ptr(sp._ptr)
        , _pcount(sp._pcount)
    {
        ++(*_pcount);  // 引用计数加1
    }

    // 赋值运算符
    shared_ptr<T>& operator=(const shared_ptr<T>& sp)
    {
        if (_ptr == sp._ptr)  // 自我赋值检查
            return *this;

        // 原指针引用计数减1,如果为0则释放
        if (--(*_pcount) == 0)
        {
            delete _ptr;
            delete _pcount;
        }

        // 接管新指针
        _ptr = sp._ptr;
        _pcount = sp._pcount;
        ++(*_pcount);  // 新指针引用计数加1

        return *this;
    }

    // 获取引用计数值
    int use_count() const
    {
        return *_pcount;
    }

    // 获取裸指针
    T* get() const
    {
        return _ptr;
    }

private:
    T* _ptr;           // 管理的裸指针
    int* _pcount;      // 引用计数器
    
    // 删除器,默认使用delete
    function<void(T*)> _del = [](T* ptr) {delete ptr; };
};

template<class T>
class weak_ptr
{
public:
    // 默认构造函数
    weak_ptr()
        :_ptr(nullptr)
    {}

    // 从shared_ptr构造
    weak_ptr(const shared_ptr<T>& sp)
        :_ptr(sp.get())  // 获取shared_ptr的裸指针但不增加引用计数
    {}

    // 从shared_ptr赋值
    weak_ptr<T>& operator=(const shared_ptr<T>& sp)
    {
        _ptr = sp.get();  // 获取shared_ptr的裸指针但不增加引用计数
        return *this;
    }

    // 重载*运算符
    T& operator*()
    {
        return *_ptr;
    }

    // 重载->运算符
    T* operator->()
    {
        return _ptr;
    }

private:
    T* _ptr;  // 观察的裸指针(不拥有所有权)
};

std::shared_ptr的线程安全问题需要注意的是shared_ptr的线程安全分为两方面:

  1. 智能指针对象中引用计数是多个智能指针对象共享的,两个线程中智能指针的引用计数同时 ++或--,这个操作不是原子的,引用计数原来是1,++了两次,可能还是2.这样引用计数就错 乱了。会导致资源未释放或者程序崩溃的问题。所以只能指针中引用计数++、--是需要加锁的,也就是说引用计数的操作是线程安全的。

  2. 智能指针管理的对象存放在堆上,两个线程中同时去访问,会导致线程安全问题。

3.6 总结

特性 auto_ptr unique_ptr shared_ptr weak_ptr
所有权语义 转移 独占 共享
是否可拷贝
是否可移动
引用计数
自定义删除器 不支持 支持 支持 不支持
数组支持 不支持 支持 需自定义 不支持
线程安全(标准库实现) 不安全 部分安全 部分安全 部分安全
循环引用问题 可能 解决方案

4.C++11和boost中智能指针的关系

  1. C++ 98 中产生了第一个智能指针auto_ptr.

  2. C++ boost给出了更实用的scoped_ptr和shared_ptr和weak_ptr.

  3. C++ TR1,引入了shared_ptr等。不过注意的是TR1并不是标准版。

  4. C++ 11,引入了unique_ptr和shared_ptr和weak_ptr。需要注意的是unique_ptr对应boost 的scoped_ptr。并且这些智能指针的实现原理是参考boost中的实现的。