Go 内存分配:结构体中的优化技巧

关注公众号【爱发白日梦的后端】分享技术干货、读书笔记、开源项目、实战经验、高效开发工具等,您的关注将是我的更新动力!

在使用Golang进行内存分配时,我们需要遵循一系列规则。在深入了解这些规则之前,我们需要先了解变量的对齐方式。

Golang的unsafe包中有一个函数Alignof,签名如下:

go 复制代码
func Alignof(x ArbitraryType) uintptr

对于任何类型为v的变量xAlignOf函数会返回该变量的对齐方式。我们将对齐方式记为m。现在,Golang确保m是满足变量x的内存地址 % m == 0的最大可能数,也就是说,变量x的内存地址是m的倍数。

让我们来看看一些数据类型的对齐方式:

  • byte, int8, uint8 -> 1
  • int16, uint16 -> 2
  • int32, uint32, float32, complex64 -> 4
  • int, int64, uint64, float64, complex128 -> 8
  • string, slice -> 8

对于结构体中的字段,行为可能会有所不同,详细信息请参考包的文档。

为了更好地理解结构体内存分配的情况,我们将使用unsafe包中的另一个函数Offsetof。该函数返回字段相对于结构体起始位置的位置,换句话说,它返回字段起始位置与结构体起始位置之间的字节数。

go 复制代码
func Offsetof(x ArbitraryType) uintptr

为了更好地理解结构体内存分配,让我们以一个示例结构体为例:

go 复制代码
type Example struct {
    a int8
    b string
    c int8
    d int32
}

现在,我们将找出类型为Example的变量所占用的总内存,并尝试优化分配。

go 复制代码
var v = Example{
    a: 10,
    b: "Lorem ipsum dolor sit amet, consectetur adipiscing elit. Vivamus rhoncus.",
    c: 20,
    d: 100,
}
fmt.Println("字段a的偏移量:", unsafe.Offsetof(v.a)) // 输出:0
fmt.Println("字段b的偏移量:", unsafe.Offsetof(v.b)) // 输出:8
fmt.Println("字段c的偏移量:", unsafe.Offsetof(v.c)) // 输出:24
fmt.Println("字段d的偏移量:", unsafe.Offsetof(v.d)) // 输出:28

现在,问题出现了:"为什么结构体中字段b的偏移量是8?它应该是1,因为字段a的类型是int8,只占用1个字节。"回到字符串数据类型的对齐方式,它的值为8,这意味着地址需要被8整除,因此在其中插入了7个字节的"填充",以确保这种行为。

为什么字段c的偏移量是24?字段b中的字符串看起来比16个字节要长得多,如果字符串的偏移量是8,那么字段c的偏移量应该更大一些。

上述问题的答案是,在Go中,字符串并不是在结构体内的同一位置分配内存的。有一个单独的数据结构来保存字符串描述符,并且该字符串描述符以原地方式存储在结构体中,用于类型为string的字段,该描述符的大小为16个字节。

现在,让我们来看看unsafe包中的另一个函数Sizeof。正如其名称所示,该函数估计并返回类型为x的变量所占用的字节数。

注意:它是根据结构体中可能存在的不同大小的字段来估计大小的。

go 复制代码
func Sizeof(x ArbitraryType) uintptr

现在,让我们来看看我们的结构体Example的大小。

go 复制代码
fmt.Println("Example的大小:", unsafe.Sizeof(v)) // 输出:32

我们如何优化这个结构体以最小化填充呢?

为了优化这个结构体的内存,我们将查看不同数据类型的对齐方式,并尝试减少填充。让我们尝试将两个int8类型的字段放在一起。

go 复制代码
type y struct {
    a int8
    c int8
    b string
    d int32
}

var v = y{}
fmt.Println("字段a的偏移量:", unsafe.Offsetof(v.a)) // 输出:0
fmt.Println("字段b的偏移量:", unsafe.Offsetof(v.b)) // 输出:8
fmt.Println("字段c的偏移量:", unsafe.Offsetof(v.c)) // 输出:1
fmt.Println("字段d的偏移量:", unsafe.Offsetof(v.d)) // 输出:24
fmt.Println("Example的大小:", unsafe.Sizeof(v)) // 输出:32

太棒了,我们去掉了一些填充,但是为什么大小仍然是32?大小应该是1(a)+ 1(c)+ 6(填充)+ 16(b)+ 4(d)= 28

现在,当结构体的最后一个字段与架构的对齐要求不完全一致时,会在最后一个字段之后添加填充,以确保结构体的整体大小是其字段中最大对齐要求的倍数。因为字符串数据类型的最大对齐方式为8,所以额外添加了填充,使大小成为8的倍数,即在末尾填充了4个字节,使大小为32字节。

我们能否进一步减少填充,使其更加优化?

让我们尝试通过移动字段位置来实现。

go 复制代码
type y struct {
    b string
    d int32
    a int8
    c int8
}

var v = y{}
fmt.Println("字段a的偏移量:", unsafe.Offsetof(v.a)) // 输出:20
fmt.Println("字段b的偏移量:", unsafe.Offsetof(v.b)) // 输出:0
fmt.Println("字段c的偏移量:", unsafe.Offsetof(v.c)) // 输出:21
fmt.Println("字段d的偏移量:", unsafe.Offsetof(v.d)) // 输出:16
fmt.Println("Example的大小:", unsafe.Sizeof(v)) // 输出:24

我们可以看到,通过重新排列字段的位置,使得对齐需要最小化填充,我们已经将结构体的大小从32减小到24,这是内存优化的巨大进步,达到了25%。

当前的内存占用是16(b)+ 4(d)+ 1(a)+ 1(b)+ 2(填充)。

遗憾的是,由于语言和架构的限制,我们无法进一步去除填充。

相关推荐
葫芦和十三4 小时前
图解 MongoDB 05|文档模型设计:内嵌 vs 引用,反范式不是免费午餐
后端·mongodb·agent
不能放弃治疗7 小时前
单 Agent 实现模式
后端
IT_陈寒9 小时前
Redis内存爆了,原来我漏掉了这个致命配置
前端·人工智能·后端
fliter10 小时前
最后一块拼图:用 bitvec 构造 IPv4 包,真正做出自己的 Ping
后端
fliter11 小时前
用 Rust 解析并生成 ICMP 包:checksum、nom 与 cookie-factory
后端
蝎子莱莱爱打怪11 小时前
XZLL-IM干货系列 03|消息 ID 设计:一个 UUID 搞不定的事,我用两个 ID 解决了
后端·面试·开源
fliter11 小时前
从 panic 到 Result:用 Rust 重新整理一个 ping 项目的错误处理
后端
任沫11 小时前
Agent之Function Call
javascript·人工智能·go
森蓝情丶12 小时前
我给 AI 搭了个法庭:一个前端仔的 LangGraph 实战全记录
前端·后端
JensCS猿12 小时前
从 Spring Boot 回看 SSM 框架:手动挡与自动挡的驾驶哲学
后端