Golang字符串类型原理及其使用方法

Golang字符串

Go字符串是不可变的字节序列,按照 UTF-8 编码的 Unicode 码点。字符串的内部序列不可改变,这样设计主要是为了减少内存开支,字符串及其子串都可以使用相同的底层内存。

ASCII码、Unicode字符、UFT-8编码

ASCII码: 使用7位表示128个字符串(大小写英文字母、数字、各种标点及设备控制符)。
Unicode字符: 基本包括了世界上所有的文本字符,使用int32位的数据类型保存单个字符。Go中rune 数据类型就对应该类型。
UTF-8编码: 以字节为单位对Unicode码点做变长编码,兼容ASCII码,相当于是将不同字节大小的字符类型组装到一起,使编码更加紧凑。但是UTF-8编码的字符串不能按下表直接访问某一个字符,需要使用特殊的方式进行处理。

字符串数据类型的基本操作

1.字符串长度

len函数: len(str) 该函数能获取字符串所占的字节数,如果字符串是字母或者数字可以表示该字符串的字符个数,如果包含汉字等特殊字符 则无法表示字符个数。此时需要使用utf8.RuneCountInString(str)函数

go 复制代码
package main

import (
	"fmt"
	"unicode/utf8"
)

func main() {
	str1 := "abcd"
	str2 := "abc坎"

	fmt.Printf("len(str1) -> %d\n", len(str1))
	fmt.Printf("len(str2) -> %d\n", len(str2))
	fmt.Printf("字符数(str1) -> %d\n", utf8.RuneCountInString(str1))
	fmt.Printf("字符数(str2) -> %d\n", utf8.RuneCountInString(str2))
}

// 输出
// len(str1) -> 4
// len(str2) -> 6
// 字符数(str1) -> 4
// 字符数(str2) -> 4

2.字符串前缀后缀及子字符串问题

基于utf8的优势,许多字符串的操作无需解码,可以直接判断某个字符串是否为前缀、后缀或者子字符串(判断时采用逐字节比较的方法)

go 复制代码
package main

import (
	"fmt"
	"strings"
)

func main() {
str := "abcd"
	s := "abcd"
	//前缀
	if len(s) <= len(str) && str[:len(s)] == s {
		fmt.Println("Is PreFix!")
	}
	//后缀
	if len(s) <= len(str) && str[len(str)-len(s):] == s {
		fmt.Println("Is SufFix!")
	}
	//子字符串
	if strings.Contains(str, s) {
		fmt.Println("Is Contanins!")
	}

}

// 输出
// Is PreFix!
// Is SufFix!
// Is Contanins!

3.字符串的遍历

range: 该方法遍历的是字符串的字符个数

go 复制代码
package main

import (
	"fmt"
)

func main() {
	str := "abcd爱莲说"
	for i, v := range str {
		fmt.Printf("str[%d] is %c\n", i, v)
	}

}

// 输出
// str[0] is a
// str[1] is b
// str[2] is c
// str[3] is d
// str[4] is 爱
// str[7] is 莲
// str[10] is 说

4.字符串和字节slice的相互转换

利用 [ ]byte 数据类型实现对字符串的操作,使用[]byte先对字符进行编辑然后再将其转换成字符串类型。

go 复制代码
//不可编辑
s := "abcdef"
//可编辑
b := []byte(s)
str = string(b)

byte.Buffer工具: 该工具作为可以不断写入新的字符等byte数据

go 复制代码
func AddByte(str string) string {
	var buf bytes.Buffer
	for _, v := range str {
		//添加原字符
		buf.WriteRune(v)
		//插入空格
		buf.WriteString(" ")
	}
	return buf.String()
}
相关推荐
weixin_440401695 分钟前
Python数据分析(空值、重复值检测删除与设置)
开发语言·python·数据分析
消失的旧时光-194310 分钟前
C++ 多线程与并发系统取向(五)—— std::atomic:原子操作与状态一致性(类比 Java Atomic)
开发语言·jvm·c++·并发
资深web全栈开发15 分钟前
CoI - 组合优于继承:解耦的艺术
android·java·开发语言
低频电磁之道16 分钟前
C++中预定义宏
开发语言·c++
工程师00721 分钟前
MQTT 概念详解与 C# 实战
开发语言·c#·mqtt通信
creator_Li43 分钟前
Golang的切片Slice
golang·slice
小邓睡不饱耶1 小时前
Spring Boot 3 + MyBatis-Plus 高性能持久层开发实战:从入门到调优
spring boot·后端·mybatis
代码改善世界1 小时前
栈和队列的实现与详解(C语言版):从底层原理到代码实战
c语言·开发语言
无名之逆1 小时前
你可能不需要WebSocket-服务器发送事件的简单力量
java·开发语言·前端·后端·计算机·rust·编程
Remember_9931 小时前
一文吃透Java WebSocket:原理、实现与核心特性解析
java·开发语言·网络·websocket·网络协议·http·p2p