go 使用unsafe包实现string和[]byte的转换

目录

直接转换和无类型指针转换的差异

方法一:直接转换

方法二:无类型指针转换

两张方法性能比较


在考核的时候,遇到了一个转换问题:将 string 转换为 []byte 类型。

平常一直用的都是直接转换,这种转换比较方便,但是性能却比较低。然后学习到了用 unsafe 包实现 string 和 []byte 之间的相互转换,这种方法性能高,但是不安全。我们接下来比较一下这两种方法。

直接转换和无类型指针转换的差异

方法一:直接转换

Go 复制代码
str := "Hello, Go!"
bytes := []byte(str)
fmt.Println(bytes)

直接转换性能比较低,因为字符串是只读的字节序列,使用 []byte(str) 的时候会分配一块新的内存,然后将字符串中的数据复制到新的 []byte 中。(内存分配+数据复制)

方法二:无类型指针转换

先将 str 转换为空类型指针,然后再转换为 []byte。

Go 复制代码
str := "Hello, World!"
// unsafe.Pointer(&str):将字符串地址转为通用指针类型。
// *(*[]byte)(   ):将 unsafe.Pointer 转换为 []byte 的指针,并解引用为实际的 []byte 值。
b := *(*[]byte)(unsafe.Pointer(&str))
fmt.Println(b, string(b)) // [72 101 108 108 111 44 32 87 111 114 108 100 33] Hello, World!

优点是高性能,这种方法避免了内存分配和数据复制,直接共享字符串的底层数据。

缺点是不安全,使用了 unsafe 包,如果我们修改返回的 []byte:

Go 复制代码
b[0] = 'a' // 报错

会报错,因为 b 是由 str 的底层数据得来的,如果修改 b 会违背 Go语言字符串的不可变性。

两种方法性能比较

目录结构:

main.go :

Go 复制代码
package main

import (
	"unsafe"
)

// BytesToString []byte 转换为 string
func BytesToString(b []byte) string {
	return *(*string)(unsafe.Pointer(&b))
}

// StringToBytes string 转换为 []byte
func StringToBytes(s string) []byte {
	return *(*[]byte)(unsafe.Pointer(&s))
}

demo_test.go:

Go 复制代码
package main

import "testing"

var (
	strs = []string{
		"hello wrold!!!",
		"jfoewjfilll",
		"jiayou.",
		"12428jg9k",
		"_*^HfewoHF&3",
		"thanks",
		"Regardless of your past, take account your present and future.\n\n",
		"Make the choice to be happy. The biggest part of being happy is to simply make up your mind to be a happy person.",
	}
)

// BenchmarkDirectConvert 直接转换
func BenchmarkDirectConvert(b *testing.B) {
	n := len(strs)
	for i := 0; i < b.N; i++ {
		for j := 0; j < n; j++ {
			demo := []byte(strs[j])
			_ = string(demo)
		}
	}
}

// BenchmarkUnsafeConvert 使用 unsafe 包转换
func BenchmarkUnsafeConvert(b *testing.B) {
	n := len(strs)
	for i := 0; i < b.N; i++ {
		for j := 0; j < n; j++ {
			demo := StringToBytes(strs[j])
			_ = BytesToString(demo)
		}
	}
}

运行:

可以看到使用 unsafe包 的性能比直接转换性能高。

区别总结

|--------|----------------|------------------------|
| 特性 | []byte(str) | 通过无类型指针转换 |
| 内存分配 | 分配新的内存 | 无额外分配,共享底层数据 |
| 数据安全 | 数据独立,修改互不影响 | 修改返回的 []byte 会影响原字符串 |
| 性能 | 较低:需要分配内存和复制数据 | 较高:直接操作底层指针 |
| 易读性和维护 | 简单易读 | 较复杂 |
| 适用场景 | 通常是首选方法,安全易用 | 用于对性能要求极高且可控的场景 |

相关推荐
01漫游者4 分钟前
JavaScript函数与对象增强知识
开发语言·javascript·ecmascript
IGAn CTOU5 分钟前
Java高级开发进阶教程之系列
java·开发语言
csbysj202012 分钟前
SQL NULL 函数详解
开发语言
其实防守也摸鱼14 分钟前
CTF密码学综合教学指南--第三章
开发语言·网络·python·安全·网络安全·密码学
NGSI vimp15 分钟前
Java进阶——如何查看Java字节码
java·开发语言
We་ct1 小时前
深度剖析浏览器跨域问题
开发语言·前端·浏览器·跨域·cors·同源·浏览器跨域
skywalk81631 小时前
在考虑双轨制,即在中文语法的基础上,加上数学公式的支持,这样像很多计算将更加简单方便,就像现在的小学数学课本里面一样,比如:定x=2*x + 1
开发语言
小书房1 小时前
Kotlin的by
android·开发语言·kotlin·委托·by
就叫飞六吧2 小时前
QT写一个桌面程序exe并动态打包基本流程(c++)
开发语言·c++
threelab2 小时前
Three.js 代码云效果 | 三维可视化 / AI 提示词
开发语言·javascript·人工智能