go中的rune类型

go语言中 ,rune其实是一种int32的数据类型的别名。

Go 复制代码
// rune is an alias for int32 and is equivalent to int32 in all ways. It is
// used, by convention, to distinguish character values from integer values.
type rune = int32

rune通常用于处理字符串中的单个字符,通常来区分整数值和字符值。

看下面的例子:

Go 复制代码
// 单元测试
func TestRune1(t *testing.T) {
	fmt.Println("The Shy:", len("The Shy"))
	fmt.Println("英雄联盟:", len("英雄联盟"))
}

结果:
=== RUN   TestRune1
The Shy: 7
英雄联盟: 12
--- PASS: TestRune1 (0.00s)
PASS

看上面的结果The Shy: 7,这个好理解,英文的字符串的长度为7,英雄联盟: 12。为什么英雄联盟这个长度是12呢?

这是因为go语言的编码是按照UTF-8编码规则来的。UTF-8是一套以 8 位为一个编码单位的可变长编码。汉字的16进制值得区间在UTF-8的第三区段,那么在go的编码下会占用三个字符。所以在我们对字符串进去处理的时候只需要将字符串通过range去遍历,会按照rune为单位自动去处理。

Go 复制代码
func TestRune1(t *testing.T) {
	fmt.Println("The Shy:", len("The Shy"))
	fmt.Println("英雄联盟:", len("英雄联盟"))

	fmt.Println("-------------------")

	s := "英雄联盟"
	for k, v := range s {
		fmt.Printf("k:%v->v:%v->realValue:%c,", k, v, v)
		fmt.Println()
	}
	fmt.Println(len(s))
}

// 结果:
=== RUN   TestRune1
The Shy: 7
英雄联盟: 12
-------------------
k:0->v:33521->realValue:英,
k:3->v:38596->realValue:雄,
k:6->v:32852->realValue:联,
k:9->v:30431->realValue:盟,
12
--- PASS: TestRune1 (0.00s)
PASS

可以看到,rune已经将字符串中每个字符转换为Unicode码点。

结果打印:打印出字符在字符串中的索引位置 k 和对应的Unicode码点 v 。

那码点怎么转化为汉字呢?

在Go语言中,可以使用 %c

复制代码
fmt.Printf("k:%v->v:%v->realValue:%c,", k, v, v)

将Unicode码点转换为对应的字符(汉字)。其中,%c 是一个占位符,表示将一个Unicode码点格式化为对应的字符。

小结:

rune其实就是int32的数据类型,对于汉字等,将汉字转化为Unicode码点。

可以通过%c来获取码点对应的值。

相关推荐
胖头鱼不吃鱼-1 小时前
Go 原理之 GMP 并发调度模型
java·jvm·golang
研究司马懿1 小时前
【Golang】Go语言函数
开发语言·后端·golang
钟离墨笺3 小时前
Go 语言-->指针
开发语言·后端·golang
岁忧19 小时前
macOS配置 GO语言环境
开发语言·macos·golang
java叶新东老师1 天前
goland编写go语言导入自定义包出现: package xxx is not in GOROOT (/xxx/xxx) 的解决方案
开发语言·后端·golang
五岁小孩1 天前
Go 原理之 GMP 并发调度模型
golang·gmp·并发调度模型
Hello.Reader2 天前
Go-Elasticsearch v9 安装与版本兼容性
elasticsearch·golang·jenkins
五岁小孩2 天前
实操使用 go pprof 对生产环境进行性能分析(问题定位及代码优化)
性能优化·golang·pprof
一杯科技拿铁2 天前
Go 的时间包:理解单调时间与挂钟时间
开发语言·后端·golang
线程A2 天前
Go 语言函数设计原则:避免修改传入参数
golang