26_字符串表示形式和切割

1. 概述

如果按索引语法访问String的某个部分,会报错,如下示例代码

Rust 复制代码
fn main() {
    let s1 = String::from("hello");
    // 以下代码将会报错
    let h = s1[0];
}

Rust的字符串不支持索引语法访问

2. String类型的内部表示

string是Vec<u8>的包装。Rust有三种看待字符串的方式,分别是:字节(Bytes)、Scalar Values(Unicode标量值)、Grapheme Cluster(字形簇)。

Rust不允许对String进行索引的最后一个原因:索引操作应消耗一个常量时间 O(1),而String无法保证该时间,因为rust需要遍历所有内容,来确定有多少个合法的字符。

3. 切割string

可以使用[]和一个范围来创建字符串的切片,如下示例代码

Rust 复制代码
fn main() {
    let hello = "小明在学习";
    let s = &hello[0..6];

    print!("{}", s)
}

我们切割了6个字节,此时输出的中文字符串是小明,代表一个中文字符占用了3个字节。在字符串切割时,必须谨慎,比如某种语言的每个字符占用2个字节,那切割的位置索引必须整除2。如果我们切割的位置不在字符的边界,程序运行时将会产生panic。也就是说我们在切割字符串的时候,必须验证字符的边界来切割。

4. 遍历字符串的方法

4.1 获得字节

可以使用bytes()方法将字符串按单个字节的方式进行拆分。如下示例代码

Rust 复制代码
fn main() {
    let w = "小明在学习";
    
    for b in w.bytes() {
        println!("{}", b)
    }
}

4.2 获得标量值

可以使用chars()方法将字符串按单个标量值的方式进行拆分。如下示例代码

rust 复制代码
fn main() {
    let w = "小明在学习";
    
    for c in w.chars() {
        println!("{}", c)
    }
}

4.3 获取字形簇

对于字形簇,很复杂,标准库未提供相关接口,如果想快速获取字符串的字形簇,我们可以通过调用三方crate来实现

相关推荐
枷锁—sha2 分钟前
【DVWA系列】——CSRF——Medium详细教程
android·服务器·前端·web安全·网络安全·csrf
枷锁—sha3 分钟前
跨站请求伪造漏洞(CSRF)详解
运维·服务器·前端·web安全·网络安全·csrf
群联云防护小杜19 分钟前
深度隐匿源IP:高防+群联AI云防护防绕过实战
运维·服务器·前端·网络·人工智能·网络协议·tcp/ip
汉得数字平台37 分钟前
【鲲苍提效】全面洞察用户体验,助力打造高性能前端应用
前端·前端监控
花海如潮淹44 分钟前
前端性能追踪工具:用户体验的毫秒战争
前端·笔记·ux
_丿丨丨_6 小时前
XSS(跨站脚本攻击)
前端·网络·xss
天天进步20156 小时前
前端安全指南:防御XSS与CSRF攻击
前端·安全·xss
拾光拾趣录8 小时前
括号生成算法
前端·算法
拾光拾趣录9 小时前
requestIdleCallback:让你的网页如丝般顺滑
前端·性能优化
前端 贾公子9 小时前
vue-cli 模式下安装 uni-ui
前端·javascript·windows