1.Rust 语法总结
数值类型
- 有符号整数 :
i8
,i16
,i32
,i64
- 无符号整数 :
u8
,u16
,u32
,u64
变量声明
-
声明变量:
rustlet i = 0; // 类型推断 let n: i32 = 1; // 显式类型声明
-
可变变量:
rustlet mut n =0; n = n + 1;
字符串
注意,let s: str = "Hello world";
是不正确的,因为 str
类型不能单独使用。它必须通过引用(&str
)来使用。
集合
-
动态数组(向量):
rustlet mut v: Vec<i32> = Vec::new(); v.push(1); v.push(0);
-
固定大小数组:
-
在 Rust 中,所有变量在使用之前必须初始化。这是为了防止未初始化变量引起的未定义行为。因此,您不能声明一个未初始化的数组或变量。
rust
// 创建一个可变数组 `arr`,包含4个 `i32` 类型的元素,将所有元素初始化为0
let mut arr: [i32; 4] = [0; 4];
// 或者,可以逐个初始化每个元素
let mut arr: [i32; 4] = [0, 0, 0, 0];
// 修改数组的元素
arr[0] = 0;
arr[1] = 1;
arr[2] = 2;
arr[3] = 3;
循环
-
迭代器循环:
rust// 使用 for 循环迭代向量中的元素 for i in v.iter() { println!("{}", i); // 打印每个元素 }
-
while
循环:rustwhile i < 9 { i += 1; println!("i = {}", i); // 打印每次递增后的值 }
-
无限循环:
rustfn main() { let mut i = 0; // 初始化一个可变变量 i,初始值为 0 loop { i += 1; // 每次循环迭代将 i 的值增加 1 if i > 10 { // 检查 i 是否大于 10 break; // 如果 i 大于 10,则退出循环 } } println!("Final value of i: {}", i); // 打印 i 的最终值 }
函数
rust
fn sum(a: i32, b: i32) -> i32 {
a + b
}
-
声明函数:
rustfn sum(a: i32, b: i32) -> i32 { a + b }
表达式
-
三元表达式:
rustlet x = if someBool { 2 } else { 4 }
输入输出
(1)确保所有缓冲区中的数据都被写入到标准输出(通常是终端或控制台)中
rust
io::stdout().flush().unwrap();
(2)read_line
方法从标准输入读取用户输入并将其存储到 guess
中。如果读取失败,程序会崩溃并显示错误信息 "读取输入失败."。
rust
let mut guess = String::new();
io::stdin().read_line(&mut guess).expect("读取输入失败.");
操作符
(1)?
操作符
当一个函数返回 Result
或 Option
类型时,可以使用 ?
操作符来自动处理这些结果。如果结果是 Ok
,则返回其中的值;如果是 Err
,则返回错误并退出当前函数。
rust
fn read_file_lines(filename: &str) -> Result<Vec<String>, io::Error> {
// 尝试打开文件
let file = File::open(filename)?;
// 如果成功打开文件,继续执行;如果失败,返回错误并退出函数
}
定义结构体
在 Rust 中,定义结构体类型时,我们声明了结构体的字段及其类型,而不是创建具体的实例。因此,不需要使用 let 或 let mut 这样的关键字。let 和 let mut关键字用于创建变量,而不是定义类型。
在这段代码中,我们定义了一个名为 Node
的泛型结构体类型,它包含三个字段:
elem
:类型为T
,表示节点存储的值。next
:类型为Link<T>
,表示下一个节点的引用。prev
:类型为Link<T>
,表示前一个节点的引用。
这个定义仅仅是声明了 Node
结构体的形状,并没有创建任何实际的 Node
实例。
impl
块
Rust 中的 impl
块类似于其他编程语言中的 class
定义,但有一些关键的不同之处。
类似点
-
方法定义:
- 在
impl
块中定义的方法类似于在类中定义的方法。 - 你可以定义实例方法和静态方法(Rust 中称为关联函数)。
- 在
-
封装:
- Rust 的
impl
块可以用于封装数据和行为,类似于类。
- Rust 的
不同点
-
数据和行为的分离:
- 在 Rust 中,数据(通过结构体或枚举)和行为(通过
impl
块)是分开的。 - 在类中,数据和行为通常是在一个定义中。
- 在 Rust 中,数据(通过结构体或枚举)和行为(通过
-
没有继承:
- Rust 没有类的继承。相反,它使用特性(traits)来实现多态性。
- 类系统通常有继承和多态性机制。
-
所有权和借用:
- Rust 强调所有权和借用,确保内存安全。
- 类系统通常使用垃圾回收(如 Java)或手动内存管理(如 C++)。
struct Rectangle {
width: u32,
height: u32,
}impl Rectangle {
fn new(width: u32, height: u32) -> Rectangle {
Rectangle { width, height }
}fn area(&self) -> u32 { self.width * self.height }
}
fn main() {
let rect = Rectangle::new(30, 50);
println!("The area of the rectangle is {} square pixels.", rect.area());
}
2.进阶用法
闭包
闭包是一种匿名函数,它允许捕获调用者作用域中的值,可以赋值给变量,也可以作为参数传递给其他函数。闭包在许多现代编程语言中作为核心特性被广泛使用。
示例代码:
fn main() {
let x = 1;
let sum = |y| x + y;
assert_eq!(3, sum(2));
}
闭包 sum
捕获了变量 x
并对其进行了操作。
使用闭包简化代码
传统函数实现:
fn muuuuu(intensity: u32) -> u32 {
println!("muuuu.....");
thread::sleep(Duration::from_secs(2));
intensity
}
fn workout(intensity: u32, random_number: u32) {
// 根据 intensity 调整健身动作
}
函数变量实现:
fn muuuuu(intensity: u32) -> u32 {
println!("muuuu.....");
thread::sleep(Duration::from_secs(2));
intensity
}
fn workout(intensity: u32, random_number: u32) {
let action = muuuuu;
// 根据 intensity 调整健身动作
}
闭包实现:
fn workout(intensity: u32, random_number: u32) {
let action = || {
println!("muuuu.....");
thread::sleep(Duration::from_secs(2));
intensity
};
// 根据 intensity 调整健身动作
}
通过闭包可以简化代码,并捕获外部变量,使得代码更具灵活性。
闭包的语法和类型推导
闭包的定义形式如下:
|param1, param2| {
语句1;
语句2;
返回表达式
}
类型推导示例:
let sum = |x: i32, y: i32| -> i32 {
x + y
};
不标注类型的闭包声明更简洁:
let sum = |x, y| x + y;
结构体中的闭包
在 Rust 中,实现一个简易缓存的设计可以通过使用结构体和闭包来实现。(闭包应该作为一个变量传递,并且使用泛型和特征约束来指定它的类型。
struct Cacher<T>
where
T: Fn(u32) -> u32,
{
query: T,
value: Option<u32>,
}
核心概念
-
闭包与特征约束:
T: Fn(u32) -> u32
表示T
是一个实现了Fn(u32) -> u32
特征的类型,这意味着query
是一个闭包或函数,接受一个u32
类型的参数并返回一个u32
类型的值。- 每个闭包都有其唯一的类型,即使它们的签名相同。
-
结构体设计:
query
字段是一个闭包,用于获取值。value
字段用于存储缓存的值,初始为None
。
实现方法
为 Cacher
结构体实现方法:
impl<T> Cacher<T>
where
T: Fn(u32) -> u32,
{
fn new(query: T) -> Cacher<T> {
Cacher {
query,
value: None,
}
}
fn value(&mut self, arg: u32) -> u32 {
match self.value {
Some(v) => v,
None => {
let v = (self.query)(arg);
self.value = Some(v);
v
}
}
}
}
主要步骤
-
创建缓存实例:
- 使用
Cacher::new
创建新的缓存实例,传入一个闭包或函数作为query
。
- 使用
-
查询缓存值:
value
方法首先检查self.value
是否已有缓存值。- 如果没有,调用
query
获取新值,并将其存储在self.value
中。
泛型扩展
为了支持其他类型(如 &str
),可以将 u32
替换为泛型类型 E
。
struct Cacher<T, E>
where
T: Fn(E) -> E,
{
query: T,
value: Option<E>,
}
impl<T, E> Cacher<T, E>
where
T: Fn(E) -> E,
E: Copy,
{
fn new(query: T) -> Cacher<T, E> {
Cacher {
query,
value: None,
}
}
fn value(&mut self, arg: E) -> E {
match self.value {
Some(v) => v,
None => {
let v = (self.query)(arg);
self.value = Some(v);
v
}
}
}
}
闭包的特征(Traits)
闭包捕获变量有三种途径,分别对应三种特征:
- FnOnce:转移所有权,闭包只能执行一次。
- FnMut:可变借用,允许修改捕获的值。
- Fn:不可变借用,仅仅访问值。
示例代码:
fn fn_once<F>(func: F)
where
F: FnOnce(usize) -> bool,
{
println!("{}", func(3));
}
let x = vec![1, 2, 3];
fn_once(|z| z == x.len());
闭包的应用场景
闭包可以用于多种场景,包括缓存、异步操作、事件处理等。
缓存实现示例:
rust
Copy code
struct Cacher<T> where T: Fn(u32) -> u32, { query: T, value: Option<u32>, } impl<T> Cacher<T> where T: Fn(u32) -> u32, { fn new(query: T) -> Cacher<T> { Cacher { query, value: None } } fn value(&mut self, arg: u32) -> u32 { match self.value { Some(v) => v, None => { let v = (self.query)(arg); self.value = Some(v); v } } } }
闭包的生命周期
闭包的生命周期与其捕获的变量的生命周期相关。通常,闭包的生命周期应不超过其捕获变量的生命周期。
示例代码:
rust
Copy code
fn main() { let x = 4; let equal_to_x = |z| z == x; let y = 4; assert!(equal_to_x(y)); }
总结
闭包在 Rust 中是强大且灵活的工具,允许捕获外部变量,简化代码逻辑,且在多种场景下表现出色。通过熟练使用闭包,可以提高代码的可读性和维护性。
(2)all
方法
rust
fn all<F>(&mut self, f: F) -> bool
where
F: FnMut(Self::Item) -> bool,
它接受一个闭包 f
作为参数,并对迭代器中的每个元素应用这个闭包。all
方法会返回一个布尔值:
- 如果所有元素都满足闭包
f
的条件,则返回true
。 - 如果任何一个元素不满足闭包
f
的条件,则返回false
。
(3)迭代器
rust
let chars_left = vec![false, true, false, true];
原理:
创建迭代器:
rust
let iter = chars_left.iter();
迭代示例:
rust
let first = iter.next(); // Some(&false)
let second = iter.next(); // Some(&true)
let third = iter.next(); // Some(&false)
let fourth = iter.next(); // Some(&true)
let none = iter.next(); // None
用法:
- 创建迭代器 :通过调用集合的
iter
、iter_mut
或into_iter
方法创建迭代器。- 遍历 :使用
for
循环或while let
语句。- 常用方法 :
- 转换 :
map
、filter
、enumerate
、zip
- 收集 :
collect
、fold
- 检查 :
all
、any
- 链式调用:将多个迭代器方法链式调用以实现复杂的数据处理。
(1)转换:
map()
:对每个元素应用一个函数,返回一个新的迭代器。filter()
:过滤符合条件的元素,返回一个新的迭代器。enumerate()
:为迭代器中的每个元素生成一个索引,返回(索引, 元素)
对。zip()
:将两个迭代器合并为一个新的迭代器,生成(元素1, 元素2)
对。
(2)收集:
collect()
:将迭代器的所有元素收集到一个集合类型中,通常是一个向量(Vec<T>
)。fold()
:将迭代器的所有元素通过一个累积函数聚合为一个值。
(3)检查:
all()
:检查是否所有元素都满足一个条件。any()
:检查是否有任意元素满足一个条件。
(4)链式调用:
将多个迭代器方法链式调用,以实现复杂的数据处理。例如:过滤、映射和收集的组合。
例子:
rust
fn main() {
let vec = vec![1, 2, 3, 4, 5];
// 使用迭代器遍历元素
for val in vec.iter() {
println!("{}", val);
}
// 使用链式调用过滤和映射元素,然后收集结果
let processed: Vec<i32> = vec.iter()
.filter(|&&x| x % 2 == 0) // 过滤出偶数
.map(|&x| x * 2) // 将每个偶数乘以 2
.collect(); // 收集结果到一个向量
println!("{:?}", processed); // 输出: [4, 8]
}
(4)枚举类型
(1)Option类型
在 Rust 中,Option
类型是一种枚举,用于表示一个值可能存在(Some
)或者不存在(None
)
rust
fn main() {
let numbers = vec![1, 2, 3];
let empty: Vec<i32> = Vec::new();
match get_first_element(&numbers) {
Some(value) => println!("第一个元素是: {}", value),
None => println!("数组为空"),
}
match get_first_element(&empty) {
Some(value) => println!("第一个元素是: {}", value),
None => println!("数组为空"),
}
}
(2)Result类型
Result<T, E>:
-
用于表示一个操作的成功或失败。
-
在 Rust 中,
Result
枚举类型需要两个类型参数: -
Result<T, E>
:表示操作的结果。Ok(T)
:表示操作成功,包含类型T
的值。Err(E)
:表示操作失败,包含类型E
的错误信息。
rust
fn read_file_lines(filename: &str) -> Result<Vec<String>, io::Error> {
let file = File::open(filename)?;
let reader = BufReader::new(file);
let mut lines = Vec::new();
for line in reader.lines() {
let line = line?;
lines.push(line);
}
Ok(lines)
}
使用 Ok
包装一个值时,你实际上是在创建一个 Result
类型的实例,表示操作成功,并返回该值作为 Result
的成功变体。
(5)match
表达式
match
表达式是 Rust 中用于模式匹配的强大工具。它可以根据不同的模式执行不同的代码分支。
rust
match value {
pattern1 => expr1,
pattern2 => expr2,
_ => expr3, // 通配模式,匹配所有其他情况
}
(6)读取文件
在 Rust 中读取文件的流程通常包括以下步骤:
- 导入必要的模块:包括文件系统和 I/O 操作的模块。
- 打开文件 :使用
std::fs::File::open
方法打开文件,并处理可能的错误。 - 创建缓冲读取器 (可选):如果逐行读取文件内容,可以使用
std::io::BufReader
创建一个缓冲读取器。 - 读取文件内容:根据需要选择读取文件内容的方法,例如逐行读取、一次性读取到字符串、一次性读取到字节数组等。
- 处理文件内容:对读取到的文件内容进行处理。
- 错误处理:在读取和处理文件内容的过程中,处理可能的错误。
方法一:逐行读取文件内容
关键点:使用 BufReader
和 lines
方法逐行读取文件
rust
use std::fs::File;
use std::io::{self, BufRead, BufReader};
fn read_file_lines(filename: &str) -> Result<Vec<String>, io::Error> {
let file = File::open(filename)?; // 打开文件
let reader = BufReader::new(file); // 创建缓冲读取器
reader.lines().collect() // 逐行读取并收集结果
}
fn main() {
match read_file_lines("example.txt") {
Ok(lines) => lines.iter().for_each(|line| println!("{}", line)),
Err(e) => eprintln!("Error reading file: {}", e),
}
}
方法二:一次性读取整个文件内容到字符串
关键点:使用 read_to_string
方法一次性读取整个文件内容
rust
use std::fs::File;
use std::io::{self, Read};
fn read_file_to_string(filename: &str) -> Result<String, io::Error> {
let mut file = File::open(filename)?; // 打开文件
let mut contents = String::new();
file.read_to_string(&mut contents)?; // 读取文件内容到字符串
Ok(contents)
}
fn main() {
match read_file_to_string("example.txt") {
Ok(contents) => println!("{}", contents),
Err(e) => eprintln!("Error reading file: {}", e),
}
}
方法三:一次性读取整个文件内容到字节数组
关键点:使用 read_to_end
方法一次性读取整个文件内容到字节数组
rust
use std::fs::File;
use std::io::{self, Read};
fn read_file_to_bytes(filename: &str) -> Result<Vec<u8>, io::Error> {
let mut file = File::open(filename)?; // 打开文件
let mut contents = Vec::new();
file.read_to_end(&mut contents)?; // 读取文件内容到字节数组
Ok(contents)
}
fn main() {
match read_file_to_bytes("example.txt") {
Ok(contents) => println!("{:?}", contents),
Err(e) => eprintln!("Error reading file: {}", e),
}
}
方法四:使用 std::fs::read_to_string
直接读取整个文件到字符串
关键点:使用 fs::read_to_string
直接读取文件内容到字符串
rust
use std::fs;
fn read_file_to_string(filename: &str) -> Result<String, std::io::Error> {
fs::read_to_string(filename) // 直接读取文件内容到字符串
}
fn main() {
match read_file_to_string("example.txt") {
Ok(contents) => println!("{}", contents),
Err(e) => eprintln!("Error reading file: {}", e),
}
}
方法五:使用 std::fs::read
直接读取整个文件到字节数组
关键点:使用 fs::read
直接读取文件内容到字节数组
rust
use std::fs;
fn read_file_to_bytes(filename: &str) -> Result<Vec<u8>, std::io::Error> {
fs::read(filename) // 直接读取文件内容到字节数组
}
fn main() {
match read_file_to_bytes("example.txt") {
Ok(contents) => println!("{:?}", contents),
Err(e) => eprintln!("Error reading file: {}", e),
}
}
总结
- 逐行读取文件内容 :使用
BufReader
和lines
方法。 - 一次性读取整个文件内容到字符串 :使用
read_to_string
方法。 - 一次性读取整个文件内容到字节数组 :使用
read_to_end
方法。 - 直接读取整个文件到字符串 :使用
fs::read_to_string
方法。 - 直接读取整个文件到字节数组 :使用
fs::read
方法。
RefCell
概括
RefCell
是 Rust 提供的一种类型,用于在不可变的上下文中实现内部可变性。它允许你在运行时执行借用检查,以确保安全地修改数据。这在某些数据结构(如链表)和特定场景(如闭包或异步编程)中非常有用。
核心特点
-
内部可变性:
- 允许在不可变的上下文中修改数据。
- 使用
borrow()
获取不可变引用。 - 使用
borrow_mut()
获取可变引用。
-
运行时借用检查:
- 在借用时进行运行时检查,确保借用规则不被违反。
- 如果在借用过程中违反规则,会导致运行时错误。
-
典型用法:
- 适用于实现复杂数据结构,如链表、图等需要相互引用的结构。
- 适用于跨越函数的借用,尤其在闭包和异步编程中。
示例代码
use std::cell::RefCell;
let x = RefCell::new(5);
{
let y = x.borrow();
println!("y: {}", *y); // 输出: y: 5
}
{
let mut z = x.borrow_mut();
*z = 10;
println!("x: {}", x.borrow()); // 输出: x: 10
}
Rc
的核心作用概括
Rc
(Reference Counted)是 Rust 提供的一种智能指针,允许多个所有者共享同一个数据。
核心特点
-
共享所有权:
- 允许多个变量同时拥有同一个数据。
- 适用于需要在多个地方访问和使用同一个数据的场景。
-
自动管理内存:
- 通过引用计数管理数据的生命周期。
- 当最后一个引用被删除时,数据会自动释放。
-
单线程环境:
- 只能在单线程环境中使用。
- 如果需要在多线程环境中共享数据,使用
Arc
(Atomic Reference Counted)。
使用场景
-
数据共享:
- 例如,在树或图数据结构中,多个节点可以共享同一个子节点。
-
不可变数据:
- 通常用于共享不可变数据,因为
Rc
默认不允许多个可变引用。 - 如果需要修改数据,可以结合
RefCell
使用。
- 通常用于共享不可变数据,因为
示例代码
use std::rc::Rc;
fn main() {
let data = Rc::new(5); // 创建一个 Rc 指针,包含数据 5
let data1 = Rc::clone(&data); // 创建 data 的克隆引用
let data2 = Rc::clone(&data); // 创建 data 的另一个克隆引用
println!("Reference count: {}", Rc::strong_count(&data)); // 输出: 3
println!("data: {}", data);
println!("data1: {}", data1);
println!("data2: {}", data2);
}
Rc
的销毁时机
对于 Rc
(Reference Counted)智能指针,当一个 Rc
实例超出其作用域时,引用计数会自动减少。如果引用计数减少到零,Rc
管理的数据将被释放。
use std::cell::RefCell;
use std::rc::Rc;
fn main() {
{
let data = Rc::new(RefCell::new(5)); // 创建一个包含 RefCell 的 Rc 指针
println!("Initial reference count: {}", Rc::strong_count(&data)); // 输出: 1
{
let data1 = Rc::clone(&data); // 克隆 Rc 指针,引用计数增加到 2
println!("Reference count after creating data1: {}", Rc::strong_count(&data)); // 输出: 2
{
let data2 = Rc::clone(&data); // 再次克隆 Rc 指针,引用计数增加到 3
println!("Reference count after creating data2: {}", Rc::strong_count(&data)); // 输出: 3
*data2.borrow_mut() = 10; // 修改数据
println!("Modified data through data2: {}", data.borrow()); // 输出: 10
} // data2 超出作用域,引用计数减少到 2
println!("Reference count after data2 goes out of scope: {}", Rc::strong_count(&data)); // 输出: 2
} // data1 超出作用域,引用计数减少到 1
println!("Reference count after data1 goes out of scope: {}", Rc::strong_count(&data)); // 输出: 1
} // data 超出作用域,引用计数减少到 0,数据被释放
// 由于 data 已经被释放,不能再访问它
}
字符串操作
字符串替换
1. replace
- 适用类型 :
String
和&str
- 参数 :
- 第一个参数是要被替换的字符串。
- 第二个参数是新的字符串。
- 功能: 替换所有匹配的字符串,返回一个新的字符串。
示例代码:
fn main() {
let string_replace = String::from("I like rust. Learning rust is my favorite!");
let new_string_replace = string_replace.replace("rust", "RUST");
dbg!(new_string_replace);
}
运行结果:
new_string_replace = "I like RUST. Learning RUST is my favorite!"
2. replacen
- 适用类型 :
String
和&str
- 参数 :
- 前两个参数与
replace
方法相同。 - 第三个参数表示替换的次数。
- 前两个参数与
- 功能: 替换指定次数的匹配字符串,返回一个新的字符串。
示例代码:
fn main() {
let string_replace = "I like rust. Learning rust is my favorite!";
let new_string_replacen = string_replace.replacen("rust", "RUST", 1);
dbg!(new_string_replacen);
}
运行结果:
new_string_replacen = "I like RUST. Learning rust is my favorite!"
3. replace_range
- 适用类型 : 仅适用于
String
- 参数 :
- 第一个参数是要替换的字符串范围(
Range
)。 - 第二个参数是新的字符串。
- 第一个参数是要替换的字符串范围(
- 功能: 直接在原字符串上替换指定范围内的内容,不返回新的字符串。
示例代码:
fn main() {
let mut string_replace_range = String::from("I like rust!");
string_replace_range.replace_range(7..8, "R");
dbg!(string_replace_range);
}
运行结果:
string_replace_range = "I like Rust!"
字符串删除方法
1. truncate
- 功能: 从指定位置开始删除字符串中从该位置到结尾的全部字符。
- 特性: 直接操作原字符串,无返回值。如果指定位置不在字符边界上,则会发生错误。
示例代码:
fn main() {
let mut string_truncate = String::from("测试truncate");
string_truncate.truncate(3);
dbg!(string_truncate);
}
运行结果:
string_truncate = "测"
2. clear
- 功能: 清空字符串,删除字符串中的所有字符。
- 特性 : 直接操作原字符串,相当于
truncate()
方法参数为 0。
示例代码:
fn main() {
let mut string_clear = String::from("string clear");
string_clear.clear();
dbg!(string_clear);
}
运行结果:
string_clear = ""
字符串连接
1. 使用 +
或 +=
操作符
-
要求:
- 右边的参数必须为字符串切片引用(
&str
)。 - 调用
+
操作符相当于调用了标准库中的add
方法。
- 右边的参数必须为字符串切片引用(
-
特性:
- 返回一个新的字符串。
- 变量声明可以不需要
mut
关键字修饰。 - 左边的字符串所有权会被转移。
示例代码:
fn main() {
let string_append = String::from("hello ");
let string_rust = String::from("rust");
let result = string_append + &string_rust; // string_append 的所有权被转移
let mut result = result + "!"; // `result + "!"` 中的 `result` 是不可变的
result += "!!!";
println!("连接字符串 + -> {}", result);
}
运行结果:
连接字符串 + -> hello rust!!!!
-
所有权转移示例:
fn main() { let s1 = String::from("hello,"); let s2 = String::from("world!"); let s3 = s1 + &s2; // s1 的所有权被转移 assert_eq!(s3, "hello,world!"); // println!("{}", s1); // 这行代码会报错,因为 s1 的所有权已被转移 }
-
连续连接示例:
let s1 = String::from("tic"); let s2 = String::from("tac"); let s3 = String::from("toe"); // String = String + &str + &str + &str + &str let s = s1 + "-" + &s2 + "-" + &s3;
s1
这个变量通过调用 add()
方法后,所有权被转移到 add()
方法里面, add()
方法调用后就被释放了,同时 s1
也被释放了。再使用 s1
就会发生错误。
2. 使用 format!
宏
- 适用 :
String
和&str
- 特性 : 类似于
print!
的用法,生成一个新的字符串。
示例代码:
fn main() {
let s1 = "hello";
let s2 = String::from("rust");
let s = format!("{} {}!", s1, s2);
println!("{}", s);
}
运行结果:
hello rust!
3.Rust特性
(1)所有权
所有权机制是Rust用来管理内存的一种系统,它确保了内存安全性并防止了许多常见的编程错误。以下是所有权机制的核心概念和规则:
1. 所有权规则
-
每个值在Rust中都有一个所有者:
- 所有者是一个变量,只有一个变量可以是某个值的所有者。
-
值在任一时刻只能有一个所有者:
- 当所有者变量超出作用域时,该值将被自动清理。
-
当所有者离开作用域时,该值将被丢弃:
- Rust在所有者超出作用域时自动调用
drop
函数来释放内存。
- Rust在所有者超出作用域时自动调用
2. 所有权转移(Move)
(1)非 Copy
trait 的类型赋值
rust
let s = String::from("hello");
let s1 = s;
- 在这个例子中,
s
的栈上的数据所有权被转移给s1(堆上数据仍然不变,移动语义)
,因此在之后使用s1
会导致编译错误。
(2)self 作为参数:
方法或函数以 self
作为参数时,会获取调用者的所有权,调用后原变量失效。
(3) 非引用参数:
类似地,函数以非引用类型参数接收变量时,也会获取其所有权。
(4)克隆
rust
let s = String::from("hello");
let s1 = s.clone();
在Rust中,使用clone
方法可以进行深拷贝。深拷贝会复制堆上的数据,并在栈上创建一个新的所有权指向这块堆内存。结果是栈上和堆上都有独立的拷贝,因此两个变量互不影响。
(5) Copy
trait 的类型
- 整数类型 (
i32
,u32
, 等) - 浮点数类型 (
f32
,f64
) - 布尔类型 (
bool
) - 字符类型 (
char
) - 元组(如果元组内的所有元素都实现了
Copy
trait)
(6)无法copy的类型
-
非Copy类型:
- 复杂类型如
String
不实现Copy
特性,因为它们涉及更复杂的内存管理。 - 不能对不实现
Copy
的类型进行直接赋值拷贝。
- 复杂类型如
-
解决方案:
- 使用引用 :对于无法实现
Copy
的类型,可以通过引用来解决所有权冲突。
fn main() { let x = (1, 2, (), "hello".to_string()); let y = (&x.0, &x.1, &x.2, &x.3); println!("{:?}, {:?}", x, y); }
- 使用引用 :对于无法实现
3. 借用(Borrowing)
引用的可变性决定了你是否可以通过引用来修改所引用的值。
(1)不可变借用:
- 可以有多个不可变引用,但不能同时有可变引用。
rust
let s = String::from("hello");
let r1 = &s; // 不可变引用 r1
let r2 = &s; // 不可变引用 r2
println!("r1: {}, r2: {}", r1, r2); // 可以同时使用多个不可变引用
(2)可变借用:
- 同一时间只能有一个可变引用,且不能同时存在不可变引用。
rust
let mut s = String::from("hello");
let r1 = &mut s; // 可变引用 r1
r1.push_str(", world");
println!("{}", r1); // r1 修改了 s 的内容
- 唯一的可变引用 :在任何给定的时间点,一个变量只能有一个可变引用(
&mut
)。 - 不可变引用与可变引用互斥 :在有可变引用存在时,不允许同时存在不可变引用(
&
)。反之,在存在不可变引用时,不允许存在可变引用。
这些规则确保了在访问和修改数据时不会出现竞争条件。
(3)注意:
1.不允许在存在不可变引用时修改原始变量
rust
fn main() {
let mut s = String::from("hello"); // 可变变量 `s` 被创建
let ref1 = &s; // 创建对 `s` 的不可变引用 `ref1`
s = String::from("goodbye"); // 尝试修改 `s` 的值
println!("{}", ref3.to_uppercase()); // 使用 `ref3` 打印 `s` 的值
}
一种修复方法是将 println!
语句移动到修改 s
之前,确保在修改 s
之前,所有的不可变引用都已经被使用完毕。例如:
rust
fn main() {
let mut s = String::from("hello");
let ref1 = &s;
let ref2 = &ref1;
let ref3 = &ref2;
println!("{}", ref3.to_uppercase()); // 在修改 `s` 之前使用 `ref3`
s = String::from("goodbye"); // 现在可以安全地修改 `s`
}
2. 悬垂引用
返回的是一个局部变量的引用,函数作用域结束后,变量销毁
rust
fn drip_drop() -> &String {
let s = String::from("hello world!");
return &s;
}
修改方法:直接返回所有权
rust
fn drip_drop() -> String {
let s = String::from("hello world!");
return s;
}
3.借用检查器错误
v[0]返回一个引用,试图将向量中元素的引用赋值给一个所有权变量
rust
fn main() {
let s1 = String::from("hello");
let mut v = Vec::new();
v.push(s1);
let s2: String = v[0]; // 试图移动元素的所有权
println!("{}", s2);
}
解决方法:(仅读取)
rust
fn main() {
let s1 = String::from("hello");
let mut v = Vec::new();
v.push(s1);
let s2: &String = &v[0];
println!("{}", s2);
}
4.切片
切片(slice)是Rust中对数组、字符串等集合部分数据的引用。它具有以下核心特性:
- 引用类型:不拥有数据所有权,只是借用数据的一部分。
- 不可变和可变 :支持不可变切片(
&[T]
)和可变切片(&mut [T]
)。 - 高效:避免数据拷贝,直接引用原数据。
- 安全:编译时和运行时边界检查,防止越界访问和数据竞争。
(1)不可变切片
rust
fn main() {
let arr = [1, 2, 3, 4, 5];
let slice = &arr[1..4]; // 引用数组的部分数据
println!("{:?}", slice); // 输出 [2, 3, 4]
}
(2)可变切片
rust
fn main() {
let mut arr = [1, 2, 3, 4, 5];
let slice = &mut arr[1..3]; // 可变切片,引用数组的部分数据
slice[0] = 10;
println!("{:?}", arr); // 输出 [1, 10, 3, 4, 5]
}
(3)字符串切片
rust
fn main() {
let s = String::from("hello, world");
let hello = &s[0..5]; // 引用字符串的部分数据
println!("{}", hello); // 输出 "hello"
}
(4)切片操作
rust
fn main() {
let arr = [1, 2, 3, 4, 5];
let slice = &arr[1..4];
println!("Length: {}", slice.len()); // 输出 "Length: 3"
println!("First element: {:?}", slice.first()); // 输出 "First element: Some(2)"
}
5. 数据竞争的避免
- Rust的借用检查器在编译时强制执行借用规则,以确保在任何给定时间只有一个可变引用或多个不可变引用,从而避免数据竞争。
5. 生命周期
-
Rust通过生命周期标注来确保引用的有效性,防止悬空引用。
(2)显式使用引用操作符
常见情况
-
创建引用:
- 当你需要创建一个变量的引用时,需要显式地使用
&
。
rustlet x = 5; let y = &x; // 创建对 x 的不可变引用 let z = &mut x; // 创建对 x 的可变引用(需要 x 是可变的)
- 当你需要创建一个变量的引用时,需要显式地使用
-
函数参数传递引用:
- 当你定义一个函数,并希望它接收一个引用作为参数时,需要显式地使用
&
。
rustfn print_value(value: &i32) { println!("{}", value); } let x = 10; print_value(&x); // 传递 x 的引用
- 当你定义一个函数,并希望它接收一个引用作为参数时,需要显式地使用
-
解引用:
- 当你需要从一个引用中获取实际值时,需要显式地使用
*
。
rustlet x = 5; let y = &x; println!("{}", *y); // 解引用 y 获取 x 的值
- 当你需要从一个引用中获取实际值时,需要显式地使用
注意和习惯
基本类型
为什么要手动设置变量可变性
- Rust支持可变和不可变变量,提供了灵活性和安全性,性能优化
- 将无需改变的变量声明为不可变,可以提升运行性能,避免多余的运行时检查。
变量命名
- 使用下划线开头的变量名,可以忽略未使用变量的警告。
let
表达式可以用于变量解构,从复杂变量中匹配出部分内容。
整形溢出处理
-
Rust提供了多种方法显式处理整型溢出,如
wrapping_*
、checked_*
、overflowing_*
和saturating_*
。 -
wrapping_*
方法:-
描述:当发生溢出时,值会按照二进制补码环绕(wrap around)。这意味着溢出后的结果将从最低有效位开始重新计算。
-
用法 :
wrapping_add
、wrapping_sub
、wrapping_mul
等。 -
示例 :
let x: u8 = 255; let y = x.wrapping_add(1); // y == 0
-
核心:溢出后环绕,继续计算,不会引发程序错误。
-
-
checked_*
方法:-
描述 :当发生溢出时,返回一个
None
,否则返回Some(结果)
。适合需要检测并处理溢出的情况。 -
用法 :
checked_add
、checked_sub
、checked_mul
等。 -
示例 :
let x: u8 = 255; if let Some(y) = x.checked_add(1) { // 不会执行 } else { println!("溢出检测到"); }
-
核心 :通过返回
Option
类型来检测和处理溢出。
-
-
overflowing_*
方法:-
描述:返回一个包含计算结果和布尔值的元组,布尔值指示是否发生溢出。
-
用法 :
overflowing_add
、overflowing_sub
、overflowing_mul
等。 -
示例 :
let x: u8 = 255; let (y, overflowed) = x.overflowing_add(1); // y == 0, overflowed == true
-
核心:提供溢出后的结果,并显式指示溢出是否发生。
-
-
saturating_*
方法:-
描述:当发生溢出时,值会被夹紧到类型的最大或最小值。适合需要确保结果在一定范围内的情况。
-
用法 :
saturating_add
、saturating_sub
、saturating_mul
等。 -
示例 :
let x: u8 = 255; let y = x.saturating_add(1); // y == 255
-
核心:溢出后结果被限制在合法范围内(最大或最小值)。
-
数字字面量下划线
在Rust中,数字字面量中的下划线(_
)可以用于增加可读性,它们不会影响数值的实际值。
示例:1_000.000_1
表示 1000.0001
。
Rust字符
Rust 的字符不仅仅是 ASCII
,所有的 Unicode
值都可以作为 Rust 字符,包括单个的中文、日文、韩文、emoji 表情符号等等,都是合法的字符类型。Unicode
值的范围从 U+0000 ~ U+D7FF
和 U+E000 ~ U+10FFFF
。
由于 Unicode
都是 4 个字节编码,因此字符类型也是占用 4 个字节:
单元类型()
在Rust中,单元类型 ()
表示空值或空元组,通常用于函数不返回任何值的情况。尽管逻辑上是空的,但它在内存中占用的大小为0字节。使用 std::mem::size_of_val
可以确认这一点,例如 assert!(size_of_val(&unit) == 0);
,这保证了 unit
的内存占用为0,体现了Rust中零大小类型(ZST)的概念和用途。
所有权
永远不会返回的函数(发散函数)
-
发散函数 :返回类型为
!
,表示函数永远不会正常返回控制权。 -
实现方法 :
- 无限循环 :使用
loop {}
创建一个永不退出的循环。 panic!
:触发一个恐慌,使程序中止。std::process::exit
:立即终止程序并返回指定的状态码。
// 方法一:使用无限循环
fn never_return_fn() -> ! {
loop {
// 无限循环,永远不会返回
}
}// 方法二:调用panic!
fn never_return_fn() -> ! {
panic!("This function never returns!");
}// 方法三:使用std::process::exit
use std::process;fn never_return_fn() -> ! {
process::exit(1); // 退出程序并返回状态码1
} - 无限循环 :使用
当所有权转移时,可变性也可以随之改变。
let x = 5; // 不可变变量
let mut y = x; // 所有权转移,y 变为可变
y += 1; // 修改 y 的值
部分移动
-
部分移动:
- 解构时可以同时移动变量的一部分,并借用另一部分。
- 被移动部分的所有权转移,原变量不能再使用该部分。
- 被借用部分仍然可以通过引用使用。
-
原变量状态:
-
整体不能再使用,因为部分所有权已转移。
-
未转移所有权的部分仍可通过引用使用。
fn main() {
let t = (String::from("hello"), String::from("world"));let _s = t.0;
// 仅修改下面这行代码,且不要使用
_s
println!("{:?}", t.1);
}
-
Ref和&的区别
-
使用场景
&
是直接引用,用于创建一个指向某个值的引用,适用于任何需要引用的地方。ref
主要在模式匹配中使用,用于方便地在模式匹配过程中获取某个值的引用。
-
代码简洁性和可读性
- 使用
&
创建引用时,代码逻辑清晰,直接指向某个值,易于理解。 - 使用
ref
在模式匹配中创建引用,可以使模式匹配的代码更加简洁和直观,避免了在模式匹配外部手动创建引用的繁琐。
- 使用
当你在模式匹配中需要创建多个嵌套值的引用时,ref
可以大大简化代码的编写和阅读。例如:
struct Point {
x: i32,
y: i32,
}
let p = Point { x: 10, y: 20 };
match p {
Point { ref x, ref y } => {
// 在这里 x 和 y 都是引用
println!("x: {}, y: {}", x, y);
}
}
在这个例子中,使用 ref
可以直接在模式匹配中创建 x
和 y
的引用。如果不使用 ref
,你需要手动创建引用,这样会使代码变得更复杂:
struct Point {
x: i32,
y: i32,
}
let p = Point { x: 10, y: 20 };
let Point { x, y } = p;
let x_ref = &x;
let y_ref = &y;
println!("x: {}, y: {}", x_ref, y_ref);
借用规则
- 不可变引用与可变引用:Rust 不允许同时存在不可变引用和可变引用,以确保内存安全。
- 生命周期管理:在可变借用之前,必须完成所有对数据的不可变引用。
错误原因
- 调用
s.clear()
时存在对s
的不可变引用ch
,违反借用规则。
修正代码
确保在修改原数据前处理完所有对数据的引用:
fn main() {
let mut s = String::from("hello world");
// 获取第一个字符的不可变引用
let ch = first_character(&s);
println!("the first character is: {}", ch);
// 清空字符串,在使用完不可变引用之后
s.clear();
}
fn first_character(s: &str) -> &str {
&s[..1]
}
字符串
进行切片时需要注意字符边界
UTF-8 编码的字符可能占用多个字节,切片操作必须在字符边界上进行,否则程序会崩溃。
核心要点:
- UTF-8 编码:字符可能占用1至4个字节,汉字通常占3个字节。
- 字符边界:切片索引必须对齐到字符边界。
- 避免崩溃:切片时需确保索引在字符边界,否则会导致程序崩溃。
- 使用工具 :可以使用
.char_indices()
方法获取字符边界,确保切片安全。
示例:
let s = "中国人";
let a = &s[0..3]; // 正确的切片,取第一个汉字 "中"
println!("{}", a); // 输出 "中"
String 与 &str 的转换
-
从 &str 到 String:
String::from("hello, world")
"hello, world".to_string()
-
从 String 到 &str:
&s
&s[..]
s.as_str()
这背后的原理是 Rust 的 Deref
隐式强制转换。
不允许直接通过索引访问字符串中的字符
- 底层存储 :Rust 字符串底层是字节数组
[u8]
。 - UTF-8 编码:字符占用不同字节数,索引必须对齐字符边界。
- 多种表示方式:Rust 提供多种字符串表示方式,适合不同需求。
- 索引限制:为了安全和性能考虑,Rust 不允许直接索引字符串。
- 遍历字符串 :使用
chars
和bytes
方法遍历字符串,确保正确处理字符和字节。
字符串转义与原样字符串
Rust 提供了多种方法来处理字符串中的转义字符和原样字符串。以下是详细说明及核心概括。
1. 转义字符
- ASCII 转义 : 使用
\x
后跟两个十六进制数来表示 ASCII 字符。 - Unicode 转义 : 使用
\u
后跟花括号中的 Unicode 码点来表示 Unicode 字符。
示例代码:
fn main() {
// 通过 \ + 字符的十六进制表示,转义输出一个字符
let byte_escape = "I'm writing \x52\x75\x73\x74!";
println!("What are you doing\x3F (\\x3F means ?) {}", byte_escape);
// \u 可以输出一个 unicode 字符
let unicode_codepoint = "\u{211D}";
let character_name = "\"DOUBLE-STRUCK CAPITAL R\"";
println!(
"Unicode character {} (U+211D) is called {}",
unicode_codepoint, character_name
);
// 换行了也会保持之前的字符串格式
// 使用\忽略换行符
let long_string = "String literals
can span multiple lines.
The linebreak and indentation here ->\
<- can be escaped too!";
println!("{}", long_string);
}
运行结果:
What are you doing? (\x3F means ?) I'm writing Rust!
Unicode character ℝ (U+211D) is called "DOUBLE-STRUCK CAPITAL R"
String literals
can span multiple lines.
The linebreak and indentation here -><- can be escaped too!
2. 原样字符串
- 原样字符串 : 使用
r#
和#
包围字符串,忽略转义字符。 - 带有双引号的字符串 : 使用多个
#
包围字符串,以处理双引号和其他复杂情况。
示例代码:
fn main() {
// 保持字符串的原样输出
println!("{}", "hello \\x52\\x75\\x73\\x74");
// 原样字符串
let raw_str = r"Escapes don't work here: \x3F \u{211D}";
println!("{}", raw_str);
// 包含双引号的原样字符串
let quotes = r#"And then I said: "There is no escape!""#;
println!("{}", quotes);
// 使用多个 # 处理复杂情况
let longer_delimiter = r###"A string with "# in it. And even "##!"###;
println!("{}", longer_delimiter);
}
运行结果:
hello \x52\x75\x73\x74
Escapes don't work here: \x3F \u{211D}
And then I said: "There is no escape!"
A string with "# in it. And even "##!
操作 UTF-8 字符串
1. 遍历字符
如果你想以 Unicode 字符的方式遍历字符串,可以使用 chars
方法:
示例代码:
fn main() {
for c in "中国人".chars() {
println!("{}", c);
}
}
输出:
中
国
人
2. 遍历字节
如果你想查看字符串的底层字节数组,可以使用 bytes
方法:
示例代码:
fn main() {
for b in "中国人".bytes() {
println!("{}", b);
}
}
输出:
228
184
173
229
155
189
228
186
186
3. 获取子串
由于 UTF-8 字符串的变长特性,从中获取子串相对复杂。Rust 标准库无法直接支持按字符边界提取子串。需要使用第三方库(如 utf8_slice
)来实现。
示例代码:
fn main() {
let s = "holla中国人नमस्ते";
// 使用第三方库 utf8_slice 提取子串
let sub = utf8_slice::slice(s, 5, 8);
println!("{}", sub); // 输出: 中国
}
str和&str
-
字符串字面量类型:
- 字符串字面量的类型是
&str
。
- 字符串字面量的类型是
-
str
类型的使用:str
类型表示字符串的不可变视图,通常无法直接使用。- 可以使用
&str
来处理字符串的引用。
-
Box<str>
和&str
的转换:- 使用
Box
将str
类型存储在堆上,通过引用&
将Box<str>
转换为&str
。
- 使用
数组和元组
元组过长错误
-
问题:Rust 默认只支持最多12个元素的元组,超过会导致编译错误。
-
解决方案:
- 使用数组:适用于元素类型相同的情况。
- 使用结构体:适用于元素类型不同的情况。
- 分解元组:将长元组分解成多个短元组。
非基础类型数组的所有权问题
-
基础类型与复杂类型区别:
- 基础类型(如
i32
)支持Copy
特性,可以通过[value; n]
语法初始化。 - 复杂类型(如
String
)不支持Copy
特性,需要逐个创建元素。
- 基础类型(如
-
解决方法 :使用
std::array::from_fn
函数,通过闭包生成每个元素,避免所有权问题。
切片大小
- 切片:是对数组部分的引用,包含一个指针和长度。
- 64 位系统:指针和长度各占 8 字节,因此切片总大小为 16 字节。
错误示例修正
原代码错误是将切片大小误认为 8 字节。应将 assert!
中的值修改为 16。
修正代码
fn main() {
let arr: [char; 3] = ['中', '国', '人'];
let slice = &arr[..2];
// 修改数字 `8` 让代码工作
assert!(std::mem::size_of_val(&slice) == 16);
}
结构体
结构体更新语法
- 结构体更新语法:允许基于现有结构体实例创建新实例,只需指定改变的字段,其余字段自动从现有实例中获取。
- 所有权转移 :结构体更新语法会转移所有权,涉及
Copy
特征的字段会被拷贝,不涉及Copy
特征的字段会发生所有权转移。
示例代码
传统方式:
let user2 = User {
active: user1.active,
username: user1.username,
email: String::from("another@example.com"),
sign_in_count: user1.sign_in_count,
};
结构体更新语法:
let user2 = User {
email: String::from("another@example.com"),
..user1
};
所有权转移与 Copy
特征
Copy
特征 :bool
和u64
等实现了Copy
特征的类型在赋值时会被拷贝,不会转移所有权。- 非
Copy
类型 :如String
等在赋值时会转移所有权,导致原结构体实例中的对应字段不能再被使用。
例子
struct User {
active: bool,
username: String,
email: String,
sign_in_count: u64,
}
fn main() {
let user1 = User {
email: String::from("someone@example.com"),
username: String::from("someusername123"),
active: true,
sign_in_count: 1,
};
let user2 = User {
email: String::from("another@example.com"),
..user1
};
// 使用了 Copy 特征的字段可以继续使用
println!("{}", user1.active); // 依然有效
// 使用了所有权转移的字段将导致错误
// println!("{:?}", user1); // 错误:user1 的 username 字段所有权已被转移
}
结构体内存布局
struct File {
name: String,
data: Vec<u8>,
}
从图中可以清晰地看出 File
结构体两个字段 name
和 data
分别拥有底层两个 [u8]
数组的所有权(String
类型的底层也是 [u8]
数组),通过 ptr
指针指向底层数组的内存地址,这里你可以把 ptr
指针理解为 Rust 中的引用类型。
该图片也侧面印证了:把结构体中具有所有权的字段转移出去后,将无法再访问该字段,但是可以正常访问其它的字段。
Rust 元组结构体
定义
-
语法:
struct 结构体名(字段类型1, 字段类型2, ...);
示例:
struct Color(i32, i32, i32); struct Point(i32, i32, i32);
使用场景
- 当需要一个整体名称,但不关心内部字段的名称时。
- 适用于明确且简单的字段组合,如 3D 坐标点 (x, y, z)。
#[derive(Debug)]
打印结构体
核心概念
#[derive(Debug)]
注解: 使结构体或枚举自动实现Debug
特征,从而能够使用调试格式进行打印。
实现步骤
-
为结构体派生
Debug
特征:#[derive(Debug)] struct Rectangle { width: u32, height: u32, }
-
调试打印:
-
使用
dbg!
宏打印调试信息到标准错误输出stderr
:let rect1 = Rectangle { width: dbg!(30 * scale), height: 50, }; dbg!(&rect1);
-
使用
println!
宏在标准输出stdout
中打印调试信息:println!("{:?}", rect1);
-
高级
函数式编程
捕获作用域中的值
- 闭包特性:闭包可以捕获并使用定义时作用域中的变量,而函数则不能。
- 使用场景:在需要访问定义时作用域内的变量时,闭包比函数更灵活。
- 编译器提示:Rust 编译器会友好地提示将函数替换为闭包,以便捕获动态环境中的值。