本文首发于公众号:Hunter后端
原文链接:Golang基础笔记二之字符串及其操作
这一篇笔记主要介绍 Golang 字符串相关处理,以下是本篇笔记目录:
- 字符串的定义和初始化
- 字符
- 字符串操作
1、字符串的定义和初始化
在 Go 里,我们可以使用双引号和反引号来对定义字符串。
1. 双引号
双引号用于创建解释型字符串字面量,这种字符串是支持转义字符的,比如我们在字符串中夹带换行符 \n
,这样在输出的时候,会自动进行换行:
go
s := "this is a test\nthis is another test"
fmt.Print(s)
// this is a test
// this is another test
2. 反引号
反引号用于创建原生字符串字面量,这种字符串中,所有字符都会按原样输出,转移字符不会被解释:
go
s := `this is a test\nthis is another test`
fmt.Print(s)
// this is a test\nthis is another test
2、字符
字符串是由一个个字符组合而成的,前面介绍过,Go 里字符有两种类型 byte 和 rune,但他们实际上分别是 uint8 和 int32 的别名,分别用于表示 ASCII 字符和 Unicode 字符。
每一个 byte 字符用一个字节(8位)来表示,每一个 rune 字符用 1-4 个字节来表示,如果我们想统计一个字符串的长度,首先需要判断我们是想统计其字节长度,还是字符长度。
因为对于一个字符串来说,如果字符串中包含了类似中文这种一个字符包含多个字节的字符,其字节长度和字符长度是不一样的,比如对于下面的字符串:
go
s := "hello世界"
对于前面的 hello
来说,一个字符就包含一个字节,所以它的字符长度是 5,字节长度也是 5。
而对于后面的 世界
来说,一个字符包含三个字节,所以它的字符长度是 2,但是字节长度是 2 * 3 = 6。
所以这个字符串的字节长度和字符串长度分别如下:
go
s := "hello世界"
fmt.Println("s 的字节长度为:", len(s)) // 11
fmt.Println("s 的字符串长度为:", len([]rune(s))) // 7
在统计字符串长度的时候,我们先将其转为了 rune 类型的切片,然后再统计的其长度。
3、字符串操作
1. 字符串拼接
字符串的拼接可以用两种方式,一种是使用 +
,一种是使用 strings.Builder
1) +运算符
go
s1 := "hello"
s2 := " world"
s3 := s1 + s2
fmt.Println(s3)
2) strings.Builder
go
import (
"strings"
"fmt"
)
func main() {
var builder strings.Builder
builder.WriteString("hello")
builder.WriteString(" world")
s := builder.String()
fmt.Println(s)
}
+运算符和 strings.Builder 都可以用于拼接字符串,但是在 Go 语言里,字符串属于不可变类型,每次使用 + 运算符拼接字符串时,都会创建一个新的字符串对象。
如果频繁拼接大量字符串,会产生大量的内存分配和数据复制操作,导致性能较低。
strings.Builder 内部维护了一个字节切片,在拼接字符串时,会先将字符串追加到这个字节切片中,最后再将字节切片转换为字符串。这样可以减少内存分配和数据复制的次数,性能更高。
2. 字符串的访问
如果想访问字符串中的单个字符,可以使用下标来操作:
go
s := "hello"
fmt.Println(s[4]) // 111
我们可以对其进行格式化,使用 %c 来打印:
go
fmt.Printf("%c\n", s[4]) // o
前面介绍字符串长度的时候,字符串是由字符组成的,但是因为这里测试字符串是全英文的,所以访问到的这个字符就是它的字节内容。
如果字符串包含中文,使用 len() 函数获取到的长度实际上是它的字节长度。
比如下面这个例子,我们访问到的就是字符串对应下标的字节内容,而不是对应的字符了:
go
s := "hello世界"
fmt.Println(s[5]) // 228
fmt.Printf("%c\n", s[5]) // ä
若要按字符访问带中文的字符串,可以将字符串转换为 []rune 类型,因为 rune 类型可以表示一个 Unicode 字符:
go
s := "hello世界"
fmt.Printf("%c\n", []rune(s)[5]) // 世
fmt.Printf("%c\n", []rune(s)[6]) // 界
遍历访问字符串
如果要遍历访问字符串,可以按照前面的操作先将其转为 rune 切片,然后再遍历访问 rune 切片:
go
s := "hello世界"
runes := []rune(s)
for _, c := range runes {
fmt.Printf("%c\n", c)
}
还可以使用 for...range 循环,它可以按字符迭代字符串,会自动处理 UTF-8 编码的多字节字符:
go
s := "hello世界"
for _, char := range s {
fmt.Printf("%c\n", char)
}
3. 字符串查找
我们可以引入 strings
模块使用 strings.Index()
来查找指定字符串,返回的是该字符串的字节索引,如果没有找到,则返回 -1。
go
s := "hello世界"
index := strings.Index(s, "界")
fmt.Println(index) // 8
index2 := strings.Index(s, "好")
fmt.Println(index2) // -1
4. 字符串替换
我们可以使用 strings.Replace()
来替换字符串。
go
str := "hello世界"
s2 := strings.Replace(str, "l", "x", 1)
fmt.Println(s2)
在上面的操作中,表示将字符串 str
中的 l
字符串替换为 x
,并且只替换第一个 l
。
如果需要替换多个,则可以将后面的数字 1 改成指定个数。
如果想要将字符串中指定字符串全部替换,可以将最后一个参数设置为 -1。
也可以使用 strings.ReplaceAll()
来替换字符串:
go
str := "hello世界"
s2 := strings.Replace(str, "l", "x", -1)
fmt.Println(s2)
s3 := strings.ReplaceAll(str, "l", "x")
fmt.Println(s3)
5. 字符串分割
我们可以使用 strings.Split()
来进行字符串分割:
go
s := "hello,世界,我来了"
parts := strings.Split(s, ",")
fmt.Println(parts)
返回的 parts
就是一个字符串切片。
还可以使用 strings.SplitN()
对其进行指定长度的切割,比如只需要将其切割成两部分:
go
s := "hello,world"
parts := strings.SplitN(s, "o", 2)
fmt.Println(parts, len(parts)) // [hell ,world] 2
注意:这里的参数 2 指的是最终切割后生成的切片长度,如果 n 超过字符串可以切割的长度,则会根据指定字符串其全部切割并返回结果。
所以如果 n 参数为 1,则不会切割,返回原始结果,如果 n 参数为 0,则会返回 nil,如果 n 是负数,则会全部切割。
6. 字符串是否以字符串开头或结尾
strings.HasPrefix() 表示是否是以某字符串开头,返回 bool 型结果。
strings.HasSuffix() 表示是否是以某字符串结尾,返回 bool 型结果。
go
s := "世界hello,world"
result := strings.HasPrefix(s, "世界")
fmt.Println(result)
result2 := strings.HasSuffix(s, "world")
fmt.Println(result2)
7. 是否包含某字符串
strings.Contains() 用于判断字符串是否包含某个特定字符串,返回结果为布尔型。
go
s := "hello, world"
isContain := strings.Contains(s, "world")
fmt.Println(isContain)
8. 字符串统计包含子字符串个数
strings.Count() 用于统计字符串中包含某个特定字符串的个数。
go
s := "hello, world"
l_count := strings.Count(s, "l")
fmt.Println(l_count)
9. 转大小写
strings.ToUpper() 表示将字符串转为大写
strings.ToLower() 表示将字符串转为小写
go
s := "hello, world"
upperS := strings.ToUpper(s)
fmt.Println(upperS)
lowerS := strings.ToLower(s)
fmt.Println(lowerS)
10. 去除首尾指定字符串
strings.Trim() 去除字符串左右两边指定的字符串
strings.TrimLeft() 去除字符串左边指定的字符串
strings.TrimRight() 去除字符串右边指定的字符串
go
s := "ihello, worldi"
result := strings.Trim(s, "i")
fmt.Println(result) // hello, world
result = strings.TrimLeft(s, "i")
fmt.Println(result) // hello, worldi
result = strings.TrimRight(s, "i")
fmt.Println(result) // ihello, world
如果想获取更多相关文章,可扫码关注阅读: