【Rust 学习笔记】Rust 基础数据类型介绍——数组、向量和切片

博主未授权任何人或组织机构转载博主任何原创文章,感谢各位对原创的支持!
博主链接

博客内容主要围绕:

5G/6G协议讲解

高级C语言讲解

Rust语言讲解

文章目录

  • [Rust 基础数据类型介绍------数组、向量和切片](#Rust 基础数据类型介绍——数组、向量和切片)
    • 一、数组、向量和切片
      • [1.1 数组](#1.1 数组)
        • [1.1.1 数组的声明方法1](#1.1.1 数组的声明方法1)
        • [1.1.2 数组的声明方法2](#1.1.2 数组的声明方法2)
      • [1.2 向量](#1.2 向量)
        • [1.2.1 向量分配方法1](#1.2.1 向量分配方法1)
        • [1.2.2 向量分配方法2](#1.2.2 向量分配方法2)
        • [1.2.3 向量分配方法3](#1.2.3 向量分配方法3)
        • [1.2.4 向量分配方法4](#1.2.4 向量分配方法4)
        • [1.2.5 向量内部实现介绍](#1.2.5 向量内部实现介绍)
        • [1.2.6 向量的基本操作](#1.2.6 向量的基本操作)
      • [1.3 切片](#1.3 切片)

Rust 基础数据类型介绍------数组、向量和切片

Rust中的数据类型如下所示,我会分多篇博客来介绍,下面先看一个总览:

类型 简要说明
i8、i16、i32、i64、i128、u8、u16、u32、u64、u128 给定位宽的有符号整数和无符号整数
isize、usize 与机器字(32bit、64bit)一样大的有符号整数和无符号整数
f32、f64 单精度IEEE浮点数和双精度IEEE浮点数
bool 布尔值
char Unicode字符,32位宽(4字节)
() 单元元组(空元组)
(char,u8,i32) 元组(允许混合类型)
Box<Attend> 指向堆中值的拥有型指针
&i32、&mut i32 共享引用和可变引用,非拥有型指针,其生命周期不能超出引用目标
String UTF-8字符串,动态分配大小
&str 对str的引用,指向UTF-8文本的非拥有型指针
[f64;4]、[u8;256] 数组,固定长度,其元素类型都相同
Vec[f64] 向量,可变长度,其元素类型都相同
&[u8]、*mut [u8] 对切片(数组或向量某一部分)的引用,包含指针和长度
Option<&str> 可选值,或为None(无值),或者为Some(v)(有值,其值为v)
Result<u64, Error> 可能失败的操作结果,或者为成功值OK(v),或者为错误值Err(e)
struct S { x: f32, y: f32 } 具名字段型结构体
struct T(i32, char); 元组型结构体
struct E; 单元型结构体,无字段
enum Attend { OnTime, Late(u32)} 枚举,或代数数据类型
&dyn Any、&mut dyn Read 特型(trait)对象,是对任何实现了一组给定方法的值的引用
fn(&str)->bool 函数指针
(闭包类型没有显式书写形式) 闭包

一、数组、向量和切片

Rust使用三种类型来表示内存中的值序列:

  • 类型[T; N]表示N个值的数组,其类型为T。数据的大小是在编译期确定的,并且是类型的一部分,不能追加新元素或缩小数组
  • 类型Vec<T>可称为 T的向量 ,它是一个动态分配且可增长的T类型的值序列 。向量元素存在于堆内存中,因此可以随意调整向量的大小;
  • 类型&[T]&mut [T]可称为T的共享切片T的可变切片,它们是对一系列元素的引用,这些元素可以是数据或向量的一部分。共享切片&[T] 允许在多个读者之间共享访问权限,但不允许修改元素;可变切片&mut [T] 允许读取和修改元素,但不能共享;

给定这3种类型中的任意一种类型的值v,表达式v.len()会给出 v 中的元素数,而v[i]引用的是 v 中的第 i 个元素(i 的类型必须是 usize)。v的第一个元素是v[0],最后一个元素是v[v.len()-1]。Rust会检查 i 是否在正确的范围内,如果没有则会出现panic。

1.1 数组

1.1.1 数组的声明方法1

可以在声明变量的同时,通过 方括号 来初始化一个数组。

rust 复制代码
fn main() {
    let array:[i32;3] = [2, 3, 5];
    println!("{:?}", array);
    assert_eq!(array.len(), 3);
}
1.1.2 数组的声明方法2

对于一些较长的数组,需要填充一些值时,可以使用[V; N]方法,其中V是每个元素的值,N是长度。下面的代码声明了一个长度为300的数组,其中每个元素初始值为100。

rust 复制代码
fn main() {
    let mut array = [100; 300];

    for i in 1..array.len() {
        array[0] += array[i];
    }

    println!("array[0]={}", array[0]);
    assert_eq!(array.len(), 300);
}

Rust中没有任何能定义未初始化数组的写法 。且数组的长度是其类型的一部分,并会在编译器固定下来。如果n是变量,则不能写成 [100; n] 以期望得到一个包含 n 个元素的数组。当你需要一个长度在运行期可变的数组时,请使用向量。

数组上看到的那些方法(遍历、查找、排序、填充、过滤等)都是作为切片而非数组的方法提供的 。但Rust在搜索各种方法时会隐式地将对数组的引用转换为切片,因此可以直接在数组上调用任何切片的方法:

rust 复制代码
let mut chaos = [3, 5, 4, 1, 2];
chaos.sort();
assert_eq!(chaos, [1, 2, 3, 4, 5]);

上面的代码中sort()函数是定义在切片上的,但是由于它是通过引用获取的操作目标,因此Rust会隐式地生成一个整数组数的 &mut [i32] 切片,并将其传给 sort 来进行操作。

1.2 向量

向量Vec<T>是一个可调整大小的T类型元素的数组,它是在堆上分配的。我们这里先介绍几种简单的分配向量的方法。

1.2.1 向量分配方法1

使用vec!宏来分配向量,它使用起来感觉特别像数组:

rust 复制代码
fn main() {
    let vector = vec![1,2,30];

    println!("{}", vector.iter().product::<i32>());
}

与数组不同的是,我们可以动态地向它添加元素:

rust 复制代码
fn main() {
    let mut vector = vec![1,2,30];

    println!("{}", vector.iter().product::<i32>());

    vector.push(40);
    println!("{}", vector.iter().product::<i32>());
}
1.2.2 向量分配方法2

还可以通过给定值重复一定次数来构建向量,可以再次使用模仿数组字面量的语法:

rust 复制代码
fn main() {
    let mut vector = vec![2;3];

    println!("{}", vector.iter().product::<i32>());
}
1.2.3 向量分配方法3

vec! 宏相当于调用 Vec::new来创建一个新的空向量,然后将元素压入其中,例如下面的代码:

rust 复制代码
fn main() {
    let mut vector = Vec::new();

    vector.push(3);
    vector.push(7);
    vector.push(9);
    println!("{}", vector.iter().product::<i32>());
}
1.2.4 向量分配方法4

还有一种方法是从迭代器生成的值构建一个向量:

rust 复制代码
fn main() {
    let vector:Vec<i32> = (1..5).collect();
    
    println!("{}", vector.iter().product::<i32>());
}

使用collect时,通常需要指定类型,因为它可以构建出不同种类的集合,而不仅仅是向量。通过指定vector的类型,我们明确表达了自己想要哪种集合。

与数组类型一样,可以对向量使用切片的方法:

rust 复制代码
fn main() {
    let mut palindrome = vec!["a man", "a plan", "a canal", "panama"];
    palindrome.reverse();

    println!("{:?}", palindrome);
}

上面的代码中,reverse方法实际上是在切片上定义的,但是此调用会隐式地从此向量中借用一个 &mut [&str] 切片并在其上调用reverse。

1.2.5 向量内部实现介绍

Vec<T>是由3个值组成的:

  • 指向元素在堆中分配的缓冲区的指针;
  • 缓冲区能够存储的元素数量,即向量容量;
  • 目前实际包含的元素数量,也就是它的长度;

当缓冲区达到其最大容量时,往向量中添加另一个元素需要分配一个更大的缓冲区 ,将当前内容复制到其中 ,更新向量的指针和向量容量以指向新缓冲区,最后释放旧缓冲区

如果事先知道向量元素数量,就可以调用Vec::with_capacity而不是Vec::new来创建一个向量,它的缓冲区足够的大,可以从一开始就容纳所有的元素,然后将所有元素逐个添加到向量中,而不会导致任何重新分配。当然,如果实际的元素数量超出了预估的数量,还是会重新分配缓冲区的。

vec!宏就使用了上面的技巧,因为它知道最终向量将包含多少个元素。

向量的len方法会返回它现在包含的元素数,而capacity方法则会返回在不重新分配的情况下可以容纳的元素数:

rust 复制代码
fn main() {
    let mut vector:Vec<i32> = Vec::with_capacity(2);

    println!("len is {}", vector.len());
    println!("capacity is {}", vector.capacity());

    vector.push(2);
    vector.push(3);

    println!("len is {}", vector.len());
    println!("capacity is {}", vector.capacity());

    vector.push(4);

    println!("len is {}", vector.len());
    println!("capacity is {}", vector.capacity());
}

上面代码的运行结果如下图,最后打印出的容量大小不能保证恰好为4,但至少大于等于3,因为此向量包含3个元素。

1.2.6 向量的基本操作

可以在向量中任意位置插入元素和移除元素,不过这些操作会将受影响位置之后的所有元素向前或向后移动,因此如果向量很长就可能很慢

下面的代码展示在恰当位置插入一个元素的insert方法和删除一个恰当位置元素的remove方法:

rust 复制代码
fn main() {
    let mut v = vec![10, 20, 30, 40, 50];
    println!("{:?}",v);

    // 在索引为3的元素处插入35
    v.insert(3, 35);
    println!("{:?}",v);

    // 移除索引为1的元素
    v.remove(1);
    println!("{:?}",v);
}

下面的代码展示使用push方法在向量末尾添加一个元素,和pop方法移除向量中的最后一个元素并返回其值:

rust 复制代码
fn main() {
    let mut v = vec!["Snow Puff", "Glass Gem"];

    println!("remove {:?}, current value is {:?}",v.pop(),v);
    println!("remove {:?}, current value is {:?}",v.pop(),v);
    println!("remove {:?}, current value is {:?}",v.pop(),v);
}

上面代码运行结果为:

由上面的执行结果可以看到,pop方法返回的值是一个Option<T>类型,如果:

  • 向量为空,则返回None
  • 如果其最后一个值为 v ,则返回Some(v)

1.3 切片

切片是数组和向量中的一个区域,写作[T]。由于切片可以是任意长度的,因此它不能直接存储在变量中或作为函数参数传递。切片总是通过引用传递 。对切片的引用是一个胖指针

  • 双字值;
  • 第一个字是指向切片中第一个元素的指针;
  • 第二个字是切片中元素的数量;

执行下面代码后的内存布局如下图所示。

rust 复制代码
fn main() {
    let v: Vec<f64> = vec![0.0,  0.707,  1.0,  0.707];
    let a: [f64; 4] =     [0.0, -0.707, -1.0, -0.707];

    let sv: &[f64] = &v;
    let sa: &[f64] = &a;
}

上面最后两行代码,将&Vec<f64>&[f64; 4]转换为直接指向数据的切片引用。

普通引用是指向单个值的非拥有型指针 ,而切片的引用是指向内存中一系列连续值的非拥有型指针。如果要写一个对数组和向量进行操作的函数,那么切片引用就是不错的选择。例如下面的代码:

rust 复制代码
fn main() {
    let v: Vec<f64> = vec![0.0,  0.707,  1.0,  0.707];
    let a: [f64; 4] =     [0.0, -0.707, -1.0, -0.707];

    fn print(n: &[f64]) {
        for elt in n {
            println!("{}", elt);
        }
    }

    print(&a);  // 打印数组
    print(&v);  // 打印向量
}

还可以使用范围值对数组或向量进行索引,以获取一个切片的引用,该引用既可以指向数组或向量,也可以指向一个既有切片:

rust 复制代码
print(&v[0..2])	 //打印v的前两个元素
print(&a[2..])   //打印从a[2]开始的元素
print(&sv[1..3]) //打印v[1]和v[2]

与普通数组访问一样,Rust会检查索引是否有效。尝试访问超出数组末尾的切片会导致panic

由于切片几乎总是出现在引用符号之后 ,因此通常只将 &[T] 或 &str 之类的类型称为切片。


相关推荐
臣妾写不来啊2 小时前
了解如何学习自然语言处理技术
人工智能·学习·自然语言处理
敲敲敲-敲代码3 小时前
【机器学习】神经网络(BP算法)含具体计算过程
人工智能·笔记·神经网络·机器学习
IT古董5 小时前
【机器学习】主动学习-增加标签的操作方法-流式选择性采样(Stream-based selective sampling)
人工智能·学习·机器学习
sealaugh326 小时前
aws(学习笔记第二十四课) 使用sam开发step functions
笔记·学习·aws
武昌库里写JAVA6 小时前
React方向:react中5种Dom的操作方式
java·开发语言·spring boot·学习·课程设计
明天好,会的7 小时前
代码的形状:重构的方向
笔记·其他
惟长堤一痕7 小时前
黑马linux入门笔记(01)初始Linux Linux基础命令 用户和权限 实用操作
linux·运维·笔记
Steps-of-time8 小时前
STL之Vector&Map&List针对erase方法踩坑笔记
笔记
linly12198 小时前
MATLAB学习笔记目录
笔记·学习·matlab
罗汉松(山水白河)8 小时前
解除WPS登录限制
windows·经验分享·笔记·学习·wps