【Rust自学】4.2. 所有权规则、内存与分配

4.2.0 写在正文之前

在学习了Rust的通用编程概念后,就来到了整个Rust的重中之重------所有权,它跟其他语言都不太一样,很多初学者觉得学起来很难。这个章节就旨在让初学者能够完全掌握这个特性。

本章有三小节:

  • 所有权:栈内存 vs. 堆内存
  • 所有权规则、内存与分配(本文)
  • 所有权与函数

说句题外话,这一篇文章是截止目前为止笔者所写的最长的文章,花了我整整一个下午,看在我这么努力的份上,能点赞收藏加关注 吗?谢谢喵,我用营业式的表情说道。

4.2.1. 所有权规则

所有权有三条规则:

  • 每个值都有一个变量,这个变量是该值的所有者
  • 每个值同时只能有一个所有者
  • 当所有者超出作用域(scope)后,这个值将会被删除

4.2.2. 变量作用域

作用域(scope)就是程序中一个项目的有效范围

rust 复制代码
fn main(){
	//machine不可用
	let machine = 6657;//machine可用
	//可以对machine进行操作
}//machine的作用域到此结束,machine不再可用

在示例代码第三行声明了变量machine,而在第二行还没有声明变量所以在第二行它是不可用的。在第三行由于进行了声明所以它可用了。而在第四行就可以对machine进行相关操作了。在第五行machine的作用域就结束了,从第五行及以后,machine就不再可用了。

这个例子就涉及两个重点:

  • machine在进入作用域后就变得有效了
  • machine会保持自己的有效性直到离开作用域为止。
    这两点和其他语言都类似,所以就不多说了。

4.2.3. String类型

为了演示所有权的一些相关规则,需要一个稍微复杂一点的数据类型,String类型就满足需求。

String类型比那些标量类型更复杂:之前的基础数据类型它们的数据都是存放在栈内存上的,它们在离开作用域时数据就会弹出栈;而String类型是存储在堆内存上的。

这章讲String类型主要是讲与所有权相关的部分,如果想要深入了解String类型本身就得等到后面了

字符串字面值(&'static str类型)是代码里手写的那些字符串值。但是它不能满足所有的需求,一是因为它们是不可变的;二是因为不是所有的字符串值都能在编写时确定(比如要获取输入)

对于这些情况,Rust提供了第二种字符串类型StringString类型能在堆上分配,它能够存储在编译时未知大小的文本。

4.2.4. 创建String类型的值

使用from函数从字符串字面值创建出String类型,例如:

rust 复制代码
let machine = String::from("6657");
  • ::表示fromString类型下的函数。可以理解为其他语言中的静态方法

这样声明的String类型就是可以修改的,例如:

rust 复制代码
fn main(){
	let mut machine = String::from("6657");
	machine.push_str(" up up!");
	println!("{}", machine);
}
  • let后加上mut关键字代表这个变量machine是可以修改的
  • .push_str()是这个变量上的一个方法,来向这个值的后边添加一个字符串字面值,示例中就是" up up!"

其输出效果为:

6657 up up!

为什么String类型是可以修改的,而&'static str(字符串字面值)不能:

  • String是一个堆分配的可变字符串类型,可以动态增长或缩小其内容。
  • 字符串字面值是&'static str类型,存储在程序的静态内存中(只读区域)。

4.2.5. 内存和分配

对于字符串字面值,因为它是写在源代码中的,所以在编译时就知道它的内容。其文本内容直接被硬编码到最终的可执行文件。它速度快、高效是得益于它的不可变性。

String类型为了支持可变形,需要在堆内存上分配内存老保存编译时未知的文本内容。这使得操作系统必须在运行时来请求内存(这步通过调用String::from来实现)。

当用完String之后,需要使用某种方式将内存返回给操作系统:

  • 在有GC(垃圾回收器)的语言中,比如C#,GC会跟踪并清理不再使用的内存

  • 在没有GC的语言中,比如C/C++,就需要程序员去识别内存何时不再使用,并调用代码将它返回。

    • 如果忘了,那就浪费内存
    • 如果提前做了,那变量就会变为非法
    • 如果做了两次,那就会出现非常严重的Bug------二次释放(Double free),这可能导致某些正在使用的数据发生损坏,产生潜在的安全隐患。必须一次分配对应一次释放。
  • Rust采用了不同的机制:对于某个值来说,当拥有它的变量走出作用范围时,Rust会调用一个特殊的函数------drop函数,内存会立即自动交还给操作系统,也就是内存会立即释放。

4.2.6. 变量与数据的交互方式

1.移动(Move)

多个变量可以与同一个数据使用一种独特的方式来交互。

rust 复制代码
let x = 5;
let y = x;

在这个例子中,5被绑定到x这个变量上边;在下一行相当于创建了x的副本,把x的副本绑定到y上。由于整数是已知且固定大小的简单的值,所以这两个5被压到了栈内存中。

但如果情况更加复杂,比如说是String类型时,情况又会有所不同。

rust 复制代码
let machine = String::from("Niko");
let wjq = machine;

在这个例子中,第一行通过String下的from函数从字符串字面值得到一个String类型的值叫machine。然后第二行把machine绑到wjq上。

虽然代码很相似,但两者的运行方式是完全不一样的

首先我们得了解,一个String类型由三个部分组成(如下图所示):

  • 一个指向存放字符串内容的内存的指针(pointer)
  • 一个长度
  • 一个容量

这部分数据被压到了栈内存中,而存放字符串内容的部分在堆内存中,长度(len)就是存放字符串内容所需的字节数,容量(capacity)是指String从操作系统总共获得内存的总字节数。

当把machine的值赋给wjq时,是把栈内存上的数据复制给了wjq,而并没有复制指针所指向的堆内存上的数据。

当变量离开作用域时,Rust会自动调用drop函数,并将变量使用的堆内存释放,这是上文就说过的事,但当machinewjq同时离开作用域时,它们都会尝试释放相同的内存,引发非常严重的bug,也就是二次释放(Double free),其危害在上文就有解释,这里不做阐述。

为了保证内存安全,Rust会直接弃用第一个变量machine使其失效,把值移动到wjq上。当machine离开作用域时,Rust不需要释放任何有关变量machine的内存(当然wjq还是要释放的,因为它是有效的),因为machine已经失效。

如果在machine被弃用后还调用它就会报错(代码和运行效果如下):

代码:

rust 复制代码
fn main(){
	let machine = String::from("Niko");
	let wjq = machine;
	println!("{}", machine);
}

运行效果:

error[E0382]: borrow of moved value: 'machine'

学习过其他语言的人可能接触过浅拷贝(shallow copy)和深拷贝(deep copy)。有些人会把这种复制指针、长度和容量视为浅拷贝,但由于Rust让machine失效了,所以这里使用新的术语:移动(Move)

这里隐藏了一个设计原则:Rust不会自动创建数据的深拷贝。也就是说,就运行时的性能而言,任何自动赋值的操作都是廉价的。

2. 克隆(Clone)

如果真想对堆内存上的String数据进行深度拷贝,而不仅仅是栈内存上的数据,那么可以使用clone方法。

rust 复制代码
let machine = String::from("Niko");
let wjq = machine.clone();

通过这种方法,无论是栈内存还是堆内存都被完整的复制了一份

但是克隆这种操作是比较消耗资源的,所以要谨慎使用。

3. Stack上的数据:复制

对于Stack上的数据,克隆是不需要的,复制就可以。

rust 复制代码
let x = 5;
let y = x;
println!("{},{}", x, y)

在这个例子中,xy都是有效的 ,因为x是整数类型。整数类型是Rust中的基本类型(如i32u32等),它们的大小在编译时就已经确定,并且它们的值完全存储在栈内存中。由于这些类型实现了Copy trait(可以把trait简单理解为接口),赋值操作实际上是对值的直接拷贝,而不是对所有权的转移。

对于实现了Copy trait的类型,创建一个新的变量(如y)时会发生位拷贝操作,这种拷贝非常高效。同时,原变量(如x)仍然保持有效。因此,在这种情况下,调用clone方法与直接赋值没有任何区别,因为这两者的拷贝行为本质相同。

如果一个类型实现了Copy trait,那么旧的变量在赋值之后仍然可用。如果一个类型或者该类型的一部分实现了Drop trait ,那么Rust就不会允许它实现Copy trait

一些拥有Copy trait的类型

  • 任何简单的标量的组合类型都是可以实现Copy trait的
  • 任何需要分配内存或某种资源的都不能实现Copy trait

对于元组(Tuple),如果其中所有的元素都是能实现Copy trait的,那么这个元组就可以的;如果其中但凡有一个不能实现Copy trait,那整个元组就不能。

  • (i32, u32)可以实现Copy trait
  • (i32, String)不能实现Copy trait,因为String不能实现Copy trait
相关推荐
黑客-雨2 分钟前
从零开始:如何用Python训练一个AI模型(超详细教程)非常详细收藏我这一篇就够了!
开发语言·人工智能·python·大模型·ai产品经理·大模型学习·大模型入门
Pandaconda7 分钟前
【Golang 面试题】每日 3 题(三十九)
开发语言·经验分享·笔记·后端·面试·golang·go
加油,旭杏11 分钟前
【go语言】变量和常量
服务器·开发语言·golang
行路见知11 分钟前
3.3 Go 返回值详解
开发语言·golang
xcLeigh14 分钟前
WPF实战案例 | C# WPF实现大学选课系统
开发语言·c#·wpf
NoneCoder25 分钟前
JavaScript系列(38)-- WebRTC技术详解
开发语言·javascript·webrtc
关关钧36 分钟前
【R语言】数学运算
开发语言·r语言
十二同学啊38 分钟前
JSqlParser:Java SQL 解析利器
java·开发语言·sql
编程小筑41 分钟前
R语言的编程范式
开发语言·后端·golang
技术的探险家44 分钟前
Elixir语言的文件操作
开发语言·后端·golang