Rust-借用和生命周期

生命周期

一个变量的生命周期就是它从创建到销毁的整个过程。其实我们在前面已经注意到了这样的现象:

然而,如果一个变量永远只能有唯一一个入口可以访问的话,那就太难使用了。因此,所有权还可以借用。

借用

变量对其管理的内存拥有所有权。这个所有权不仅可以被转移(move),还可以被借用(borrow)。

借用指针的语法使用&符号或者&mut符号表示。前者表示只读借用,后者表示可读写借用。借用指针(borrow pointer)也可以称作"引用"(reference)。借用指针与普通指针的内部数据是一模一样的,唯一的区别是语义层面上的。它的作用是告诉编译器,它对指向的这块内存区域没有所有权。

这里会出现编译错误,信息为"cannot borrow immutable borrowed content'*v'as mutable"。原因在于Vec::push函数。它的作用是对动态数组添加元素,它的签名是

rust 复制代码
pub fn push(&mut self,value:T)

它要求self参数是一个&mut Self类型。而我们给foo传递的参数是&Vec类型,因此会报错。修复方式如下:

对于&mut型指针,请大家注意不要混淆它与变量绑定之间的语法。

如果mut修饰的是变量名,那么它代表这个变量可以被重新绑定;如果mut修饰的是"借用指针&",那么它代表的是被指向的对象可以被修改。示例如下:

借用规则

关于借用指针,有以下几个规则:

  • 借用指针不能比它指向的变量存在的时间更长。
  • &mut型借用只能指向本身具有mut修饰的变量,对于只读变量,不可以有&mut型借用。
  • &mut型借用指针存在的时候,被借用的变量本身会处于"冻结"状态。
  • 如果只有&型借用指针,那么能同时存在多个;如果存在&mut型借用指针,那么只能存在一个;如果同时有其他的&或者&mut型借用指针存在,那么会出现编译错误。

借用指针只能临时地拥有对这个变量读或写的权限,没有义务管理这个变量的生命周期。因此,借用指针的生命周期绝对不能大于它所引用的原来变量的生命周期,否则就是悬空指针,会导致内存不安全。示例如下:

在这里给大家提个醒:一般情况下,函数参数使用引用传递的时候,不仅在函数声明这里要写上类型参数,在函数调用这里也要显式地使用引用运算符。

但是,有一个例外,那就是当参数为self &self &mut self等时,若使用小数点语法调用成员方法,在函数调用这里不能显式写出借用运算符。以常见的String类型来举例:

在这个示例中,所有的函数调用都是同样的语法,比如x.len()、x.push('!')、x.into_bytes()等,但它们背后对self参数的传递类型完全不同,因此也就出现了不同的语义。

这是需要提醒大家注意的地方。当然,如果我们使用统一的完整函数调用语法,那么所有的参数传递类型在调用端都是显式写出来的。

任何借用指针的存在,都会导致原来的变量被"冻结"(Frozen)。示例如下:

编译结果为:

error:cannot assign to `x^because it is borrowed

因为p的存在,此时对x的改变被认为是非法的。

生命周期标记

对一个函数内部的生命周期进行分析,Rust编译器可以很好地解决。但是,当生命周期跨函数的时候,就需要一种特殊的生命周期标记符号了。

函数的生命周期标记

生命周期符号使用单引号开头,后面跟一个合法的名字。生命周期标记和泛型类型参数是一样的,都需要先声明后使用。在上面这段代码中,尖括号里面的'a是声明一个生命周期参数,它在后面的参数和返回值中被使用。

前面提到的借用指针类型都有一个生命周期泛型参数,它们的完整写法应该是&'a T &'a mut T,只不过在做局部变量的时候,生命周期参数是可以省略的。

生命周期之间有重要的包含关系。如果生命周期'a比'b更长或相等,则记为'a : 'b,意思是'a至少不会比'b短,英语读做"lifetime a outlives lifetime b"。对于借用指针类型来说,如果&'a是合法的,那么'b作为'a的一部分,&'b也一定是合法的。

另外,'static是一个特殊的生命周期,它代表的是这个程序从开始到结束的整个阶段,所以它比其他任何生命周期都长。这意味着,任意一个生命周期'a都满足'static : 'a。

在上面这个例子中,如果我们把变量t的真实生命周期记为't,那么这个生命周期't实际上是变量t从"出生"到"死亡"的区间。在函数被调用的时候,它传人的实际参数是&t,它是指向t的引用。那么可以说,在调用的时候,这个泛型参数'a被实例化为了't。根据函数签名,基于返回类型的生命周期与参数是一致的,可以推理出test函数的返回类型是&'t i32。

如果我们把x的生命周期记为'x。这条let x =text(&t);语句实际上是把&'t i32类型的变量赋值给&'x i32类型的变量。这个赋值是否合理呢?它应该是合理的。因为这两个生命周期的关系是't: 'x。test返回的那个指针在't这个生命周期范围内都是合法的,在一个被't包围的更小范围的生命周期内,它当然也是合法的。所以,上面这个例子可以编译通过。

接下来,我们把上面这个例子稍作修改,让test函数有两个生命周期参数,其中一个给函数参数使用,另外一个给返回值使用:

编译时果然出了问题,在&arg.member这一行,报了生命周期错误。这是为什么呢?因为这一行代码是把&'a i32类型赋值给&'b i32类型。

'a和'b有什么关系?答案是什么关系都没有。所以编译器觉得这个赋值是错误的。

怎么修复呢?指定'a:'b就可以了。'a比'b"活"得长,自然,&'a i32类型赋值给&'b i32类型是没问题的。

验证如下:

经过这样的改写后,我们可以认为,在test函数被调用的时候,生命周期参数'a和'b被分别实例化为了't和'x。

它们刚好满足了where条件中的't:'x约束。而&arg.member这条表达式的类型是&'t i32,返回值要求的是&'x i32类型,可见这也是合法的。

所以test函数的生命周期检查可以通过。

上述示例是读者比较难理解的地方。以下两种写法都是可行的:

这里的关键是,Rust的引用类型是支持"协变"的。

在编译器眼里,生命周期就是一个区间,生命周期参数就是一个普通的泛型参数,它可以被特化为某个具体的生命周期。

我们再看一个例子。它有两个引用参数,共享同一个生命周期标记:

上述示例中,select这个函数引入了一个生命周期标记,两个参数以及返回值都是用的这个生命周期标记。同时我们注意到,在调用的时候,传递的实参其实是具备不同的生命周期的。

x的生命周期明显大于y的生命周期,&x可存活的范围要大于&y可存活的范围,我们把它们的实际生命周期分别记录为'x和'y。

select函数的形式参数要求的是同样的生命周期,而实际参数是两个不同生命周期的引用,这个类型之所以可以匹配成功,就是因为生命周期的协变特性。

编译器可以把&x和&y的生命周期都缩小到某个生命周期'a以内,且满足'x:'a,'y:'a。返回的selected变量具备'a生命周期,也并没有超过'x和'y的范围。所以,最终的生命周期检查可以通过。

类型的生命周期标记

如果自定义类型中有成员包含生命周期参数,那么这个自定义类型也必须有生命周期参数。示例如下:

在使用impl的时候,也需要先声明再使用:

impl后面的那个't是用于声明生命周期参数的,后面的Test<'t>是在类型中使用这个参数。

如果有必要的话,方法中还能继续引入新的泛型参数。

如果在泛型约束中有where T:'a之类的条件,其意思是,类型T的所有生命周期参数必须大于等于'a。

要特别说明的是,若是有where T:'static的约束,意思则是,类型T里面不包含任何指向短生命周期的借用指针,意思是要么完全不包含任何借用,要么可以有指向'static的借用指针。

省略生命周期标记

在某些情况下,Rust允许我们在写函数的时候省略掉显式生命周期标记。

在这种时候,编译器会通过一定的固定规则为参数和返回值指定合适的生命周期,从而省略一些显而易见的生命周期标记。比如我们可以写这样的代码:

实际上,它等同于下面这样的代码,只是把显式的生命周期标记省略掉了而已:

相关推荐
漫漫进阶路1 小时前
VS C++ 配置OPENCV环境
开发语言·c++·opencv
安的列斯凯奇2 小时前
SpringBoot篇 单元测试 理论篇
spring boot·后端·单元测试
架构文摘JGWZ2 小时前
FastJson很快,有什么用?
后端·学习
BinaryBardC2 小时前
Swift语言的网络编程
开发语言·后端·golang
code_shenbing2 小时前
基于 WPF 平台使用纯 C# 制作流体动画
开发语言·c#·wpf
邓熙榆2 小时前
Haskell语言的正则表达式
开发语言·后端·golang
ac-er88883 小时前
Yii框架中的队列:如何实现异步操作
android·开发语言·php
马船长3 小时前
青少年CTF练习平台 PHP的后门
开发语言·php
hefaxiang4 小时前
【C++】函数重载
开发语言·c++·算法
落幕5 小时前
C语言-构造数据类型
c语言·开发语言