25_string - 技术栈

1. 概述

Rust开发者特别是新手经常被字符串所困扰，而困扰的原因主要有三个

Rust倾向于包括可能的错误
字符串数据结构复杂
使用UTF8编码

1.1 字符串是什么？

字符串是 Byte 的集合，并且提供了一些方法，这些方法能够将 byte 解析为文本。

Rust的核心语言层面，只有一个字符串类型：字符串切片 str （或&str）。

字符串切片是存储在其他地方、并且使用UTF8编码的字符串的引用。字符串字面值存储在二进制文件中，也是字符串切片。

1.2 String类型

String类型来自标准库而不是核心语言，它是可增长、可修改、可拥有（可获得所有权）的一种数据类型，采用UTF8编码。

在rust中说的字符是指？

通常指的是 String 或者字符串切片（&str）这两种类型，而不是其中的一种。

Rust标准库中还包含了很多其他的字符串类型，例如：OsString、OsStr、CString、CStr。以String结尾的通常与String相关，通常拥有所有权，以Str结尾通常与str相关，通常可以借用所有权。它们可以存储不同编码的文本或在内存中以不同的形式展现。

2. 创建一个新的字符串（String）

很多Vec<T>的操作都可用于String。使用String::new()函数创建一个空的字符串。但很多时候使用初始值创建String，以下介绍两种方法

2.1 使用 to_string方法

to_string方法可用于实现了Display trait的类型，包括字符串字面值，如下示例代码

Rust 复制代码

fn main() {
    let data = "initial contents";
    let s = data.to_string();

    let s1 = "initial contents".to_string();
}

2.2 使用String::from函数

String::from函数可以从字面值来创建字符串，如下示例代码

Rust 复制代码

fn main() {
    let s = String::from("initial contents");
}

3. 如何更新String

3.1 push_str

push_str()方法，把一个字符串切片附加到String上，如下示例代码

Rust 复制代码

fn main() {
    let mut s = String::from("foo");
    s.push_str("bar");

    println!("{}", s);
}

3.2 push

push()方法，把单个字符添加到String上，如下示例代码

rust 复制代码

fn main() {
    let mut s = String::from("lo");
    s.push('l');
}

3.3 +运算符

+运算符，可以对字符串进行拼接，+号前面的变量是String类型，+后面的变量是字符串切片，如下示例代码

Rust 复制代码

fn main() {
    let s1 = String::from("Hello, ");
    let s2 = String::from("World");

    let s3 = s1 + &s2;

    println!("{}", s3);
}

+运算符实现了类似这个签名的方法fn add(self, s: &str) -> String {...}。上面示例代码中，s2是一个String类型，则&s2是一个String类型的引用。

+运算符之后的希望是一个字符串切片，这里之所以能够编译通过，是因为rust在编译的时候，使用了一种"解引用强制转换"（deref coercion）的技术。它把String的引用转为了字符串切片，所以编译可以顺利通过。

在执行拼接代码之后，s1的所有权被移到add函数，如果在下面的代码中继续使用将会报错；而s2使用了&来标注，add函数只是借用了s2的所有权，在下面的代码仍然可以继续使用。

3.4 format!宏

format!宏可以连接多个字符串，假设我们希望将多个单词使用特定符号进行拼接，使用+运算符的实现如下代码

rust 复制代码

fn main() {
    let s1 = String::from("tic");
    let s2 = String::from("tac");
    let s3 = String::from("toe");

    let s4 = s1 + "-" + &s2 + "-" + &s3;
    println!("{}", s4);
}

如果我们使用format!宏将字符串拼接，如下示例代码

rust 复制代码

let s = format!("{}-{}-{}", s1, s2, s3);
println!("{}", s);

format!不会取得任何参数的所有权，而是将多个参数格式之后返回一个新的字符串。