十、作用域指针、智能指针、共享指针、弱指针
从上篇文章 【C++】如何用C++创建对象,理解作用域、堆栈、内存分配-CSDN博客 中我们知道,你的对象是创建在栈上还是在堆上,最大的区别就是对象的作用域不一样。所以在C++中,一旦程序进入另外一个作用域,那其他作用域的对象就自动销毁了。这种机制有好有坏。我们可以利用这个机制,比如可以自动化我们的代码,像智能指针、作用域锁(scoped_lock)等都是利用了这种机制。
智能指针smart_ptr或者unique_ptr,是一个作用域指针。
作用域指针是一个类,是指针的包装器,在构造时用堆分配指针,然后在析构时删除指针。我们可以使用它自动化new和delete。new是在堆上分配内存,需要手动delete来删除对象,释放内存。作用域指针可以实现这一过程的自动化。意思就是当你用作用域指针new一个对象时,你可以不用delete。
我们可以使用标准库中的unique_ptr,这是一个作用域指针。但是这里我们要先自己写一个最简单的作用域指针,看看它是如何工作的:
1、作用域指针
上图A处是用指针实例化了一个Entity对象,这里用了=号,此时Entity的构造函数就自动进行了一次隐式转换,等价于上图种绿色的代码。
从左图看new的对象,如果你忘记删除了,那是得要等到应用程序结束才被操作系统清除的。但是从右图看,我也是new的对象,但是代码所在的{}运行结束,对象就被清除了。为什么呢?因为虽然Entity是创建在堆内存上的,但是指向Entity的指针e可是创建在栈内存上的,e的作用域是它所在的花括号{},所以当{}指向完毕,e就销毁了,那指向Entity的指针都销毁了,就是相当于delete e;就是删除Entity了,所以自动执行了Entity的析构函数了。
当我们通过打断点看时,代码从19行跳到21行时,开始执行21行,就跳到第6行执行Entity构造函数,执行完毕跳回21行,再跳到第15行执行ScopePtr构造函数,执行完毕跳回21行。 继续往下执行,就是22行的后花括号},就从第22行跳到第16行,再从第16行跳到第7行,第7行执行完毕后跳回第16行,执行16行,16行执行完毕后才跳回22行,算是22行执行完毕了,此时所有对象的值都没有了。后面继续跳到23行执行。
从这个例子也可以看出我们自动化了delete,以后使用作用域指针就可以不用考虑delete了。
这个例子是我们利用了栈变量的作用域,利用栈变量离开其作用域就会被销毁的特点,把堆变量给自动销毁了。类似这样的例子还有很多,比如计时器,计算你在基准测试范围内的时间。比如你就可以写一个timer类,在对象构造时启动timer,在打印对象时停止timer,也就是计时器被销毁时,这样你就有一个自动计时器了。你只需要在函数开头写一行代码,整个作用域就开始⏲,你永远不需要手动调用计时器停止。因为一旦超过作用域就自动调用停止了。除此之外,还比如互斥锁(nutex locking),如果你想锁定一个函数,以便多个线程可以同时访问它而不会爆炸,此时你就可以用一个自动作用域锁定。在函数的开头锁住它,在函数结束时解锁它,就不会出现爆炸。
2、智能指针unique_ptr
上面的作用域指针就是智能指针的一种,只是它是我们自己手写的,太简陋,仅仅是包装了delete。我们甚至可以用智能指针把new也包装了,以后你甚至可以不用new也不用delete,用智能指针就可以在堆上创建和销毁一个对象。现在有些C++程序员都倾向于这种编程风格,他们从来不调用new和delete,就用智能指针。
智能指针本质上是一个原始指针的包装。当你创建一个智能指针,它会自动调用new为你分配内存,然后基于你使用的智能指针的作用域,会自动调用delete释放你的堆内存。也所以,你不能复制一个unique_ptr, 因为如果你复制了unique_ptr,那么这两个指针是指向同一个块内存的。如果其中一个指针被销毁了,那它指向的那块内存就也被销毁了,此时另外一个指针就成了野指针,容易内存泄露。所以你不要复制unique_ptr。而且如果你复制了,编译器就会报错。
下面展示一下如何使用unique_ptr:
上图展示了两种使用unique_ptr智能指针在堆上创建对象的用法。当你创建完毕后,就可以当成正常指针,该怎么用就怎么用了。
这里再强调的是:当你使用方法B创建时,注意不能隐式转换,要规矩写。关于隐式转换参考 【C++】C++中的关键字:const、mutable、auto、new、explicit、this....-CSDN博客 中的explicit关键字,其中罗列了所有的隐式转换情况。
但是我还是推荐使用方法A,因为方法A是调用了make_unique,这样更安全,因为如果此时构造函数碰巧抛出异常,这样你就不会得到一个没有引用的野指针,从而造成内存泄露,而调用make_unique就会避免这种情况。
这就是智能指针,低开销,甚至没有开销,也非常有用。它只是在栈上分配一个指针对象,当指针对象销毁时,它将调用delete释放它指向的堆对象。
3、共享指针shared_ptr
共享指针底层做了更多的事情,所以共享指针更强大。共享指针的实现方式实际上取决于编译器和你在编译器中使用的标准库。然而无论何种系统,它使用的都是引用计数 。引用计数是一种方法,它可以跟踪你的堆对象有多少个shared_ptr引用,一旦引用计数达到0,堆对象就会被删除,内存释放 。可见共享指针解决了unique_ptr不能复制的缺陷。
在unique_ptr中,我建议大家不要直接调用new是为了构造函数异常安全,但在shared_ptr中建议大家直接调用new(上图方法2)是因为:
shared_ptr需要分配一块叫控制块的内存,用来存储应用计数。如果你先创建了一个new Entity,然后将其传递给shared_ptr构造函数,那shared_ptr就必须做2次内存分配。先做一次new Entity的分配,然后是shared_ptr的控制内存块的分配。然而如果你用make_shared,就会把它们组合起来,这样就更有效率。
从上面的例子还可以看出:share_ptr是可以复制的,也意味着堆对象可以超出创建它的指针的作用域而生存,如上图的sp1拷贝给sp0,Entity的生存期就从sp1延长到sp0,直到sp0也消失了,底层的Entity才被释放。就是当所有的引用都消失了、当所有的栈分配对象(追踪shared_ptr的)都消失,就是从内存释放后,才是底层的Entity释放的时候。
shared_ptr由于引入计数系统,是需要一点开销的。但话又说回来,如果你自己编写内存管理,也是要有开销的。所以该用shared_ptr时还是得用,和自己直接使用new和delete其实相差不大。
4、弱指针weak_ptr
C++中的weak_ptr也是一个标准库组件,它用于存储对由shared_ptr标准库指针控制的任何对象的弱引用 。
也就是weak_ptr的诞生是因为share_ptr缺陷(后面会讲shared_ptr的缺陷)。可以看做是shared_ptr的助手 ,它不管理shared_ptr内部的指针、不能操作资源、是用来监视shared_ptr 的 。
所以,weak_ptr没有重载操作符*和->,因为它不能操作资源,所以它的构造不会增加引用计数,析构也不会减少引用计数,它的主要作用就是作为一个旁观者监视shared_ptr中管理的资源是否存在。
(1)实例化一个弱指针:
(2)弱指针的常用方法:
- 通过use_count()获得当前观测资源的引用计数
- 通过expired()判断观测的资源是否已经被释放
- 通过lock()方法获取所检测的当前检测资源
- 通过reset()方法来清空自己,使自己不再监测任何资源
可见,弱指针仅仅是作为共享指针的一个补充而存在。但也不仅仅是补充,它还解决了共享指针的一个重大缺陷,就是共享指针如果循环引用会导致内存泄露,而通过弱指针可以解决这个问题:
(3)弱指针解决循环引用问题
弱指针可以解决上面问题:
理解底层的逻辑后,上面的解决方法就也不太意外了。
你首先要知道:资源A和资源B是通过共享指针spa和spb创建在内存堆上的,而指针spa和spb本身则是创建在内存栈上的,而且资源A和资源B各自里面也有一个共享指针ap和bp。当我们把ap的值赋值为资源B的地址,把bp的值赋值为资源A的地址,此时资源A和资源B就互指了,如下图关系:
所以当{}栈作用域结束时,spa和spb就湮灭了,但是spa和spb指向的资源A和B仍然有别的指针指向,所以资源A和资源B没有湮灭而是继续存在的。因为湮灭就要调用析构函数。也所以只有我们打破pb和pa任意一个共享指针的引用,链条就被打断,一个湮灭另一个也就随着湮灭了。内存泄露问题随之解决了。
本篇小结:
本篇这些智能指针的诞生一切都是因为:C++既可以在栈内存创建对象也可以在堆内存创建对象,而在栈内存创建的对象随着其所在的作用域结束而自动湮灭,但是堆内存的对象,程序员必须要显式的delete才会消失。所以也许是源于有的程序员太懒,懒得delete,也许是源于有的程序员太聪明,利用了栈作用域的特点,自动delete了堆内存的对象,于是本篇的指针,以作用域指针、智能指针、共享指针、弱指针的顺序诞生和演进着:
作用域指针包装了delete;智能指针包装了new和delete;共享指针在智能指针外面包装了copy;弱指针则是为了修正共享指针而诞生的监护人,共享指针太随意了,弱指针适当时候规范规范它。
也可以总结为:凡是用这些指针创建的对象,都是堆内存对象,而且你还不用操心delete,内存泄露啥的(共享指针要注意点),都自动帮你考虑了。
也所以,当你知道了这些底层原理后,你就可以摒弃底层的东西,直接使用这些指针,而再也不需要用new和delete了。
但是话又说回来,能在栈上创建对象就在栈上创建呗,干嘛非得跑到堆内存多此一举呢,虽然也只是多了一点点的开销,也比不过不开销好吧。除非栈内存满足不了你了,再去堆内存。也所以该在哪里创建就在哪里创建,没有谁比谁太高明。也不能因为有了智能指针而丢失了new和delete。共勉。