深入探索 Go 语言的编译器与垃圾回收机制

Go 编译器

Go 编译器是通过 go 工具执行的,这个工具的功能不仅仅是生成可执行文件。你可以使用 go tool compile 命令来编译一个 Go 源文件。这个操作将生成一个目标文件,也就是 .o 后缀的文件。以下是在 macOS Mojave 系统上执行的命令和结果展示:

bash 复制代码
$ go tool compile unsafe.go
$ ls -l unsafe.o
-rw-r--r--  1 mtsouk  staff  6926 Jan 22 21:39 unsafe.o
$ file unsafe.o
unsafe.o: current ar archive

目标文件是一种包含机器代码的文件,通常是不可直接执行的。它的一个主要优势在于在链接阶段所需的内存更少。如果你使用 -pack 命令行参数,go tool compile 会生成一个归档文件,而不是目标文件:

bash 复制代码
$ go tool compile -pack unsafe.go
$ ls -l unsafe.a
-rw-r--r--  1 mtsouk  staff  6926 Jan 22 21:40 unsafe.a
$ file unsafe.a
unsafe.a: current ar archive

归档文件是一种二进制文件,包含一个或多个文件,主要用于将多个文件合并为一个文件。ar 是其中一种格式,Go 使用的就是这种格式。这个示例中的 unsafe.go 文件不包含任何特殊代码,以上的命令适用于任何有效的 Go 源文件。

查看归档文件内容

你可以使用以下命令查看 .a 归档文件的内容:

bash 复制代码
$ ar t unsafe.a
__.PKGDEF
_go_.o

-race 标志

另一个值得一提的 go tool compile 命令行参数是 -race,它可以检测竞态条件。在并发编程中,竞态条件可能导致意想不到的错误。你可以通过以下命令生成汇编语言的输出:

bash 复制代码
$ go tool compile -S unsafe.go

这个命令会生成大量的输出,虽然它难以理解,但这意味着 Go 编译器很好地隐藏了复杂性,除非你主动要求查看这些细节。

垃圾回收

垃圾回收(GC)是释放未被使用的内存空间的过程,换句话说,GC 会找到那些已经超出作用范围且无法再被引用的对象,并释放它们占用的内存空间。这个过程是在 Go 程序运行时以并发方式执行的,而不是在程序执行前或执行后才开始。Go 垃圾回收的官方文档中提到:

"GC 与变更线程并发运行,精确类型化(也称为精确),允许多个 GC 线程并行运行。它是并发标记-清除,使用写屏障,非代际且非压缩。分配采用大小分离的每 P 分配区,以最小化碎片化,同时在常见情况下消除锁。"

其中涉及到许多术语,接下来我们会逐一解释。首先,我会展示一个查看垃圾回收过程参数的方法。

使用标准库查看垃圾回收参数

幸运的是,Go 标准库提供了一些函数,可以帮助我们了解垃圾回收的运行方式。下面的代码展示了如何获取垃圾回收的相关信息:

go 复制代码
package main

import (
   "fmt"
   "runtime"
   "time"
)

func printStats(mem runtime.MemStats) {
   runtime.ReadMemStats(&mem)
   fmt.Println("当前内存分配:", mem.Alloc)
   fmt.Println("内存总分配:", mem.TotalAlloc)
   fmt.Println("堆内存分配:", mem.HeapAlloc)
   fmt.Println("垃圾回收次数:", mem.NumGC)
   fmt.Println("-----")
}

每当你需要获取最新的垃圾回收统计信息时,你需要调用 runtime.ReadMemStats() 函数。printStats() 函数用于打印这些信息,以避免重复编写相同的代码。

接下来的部分创建了大量的 Go 切片,以分配大量内存并触发垃圾回收:

go 复制代码
func main() {
   var mem runtime.MemStats
   printStats(mem)
   for i := 0; i < 10; i++ {
      s := make([]byte, 50000000)
      if s == nil {
         fmt.Println("操作失败!")
      }
      printStats(mem)
   }
}

最后一部分代码做了更多的内存分配操作:

go 复制代码
for i := 0; i < 10; i++ {
   s := make([]byte, 100000000)
   if s == nil {
      fmt.Println("操作失败!")
   }
   time.Sleep(5 * time.Second)
}
printStats(mem)

运行上述代码的输出如下(以 macOS Mojave 为例):

bash 复制代码
$ go run gColl.go
当前内存分配: 66024
内存总分配: 66024
堆内存分配: 66024
垃圾回收次数: 0
-----
当前内存分配: 50078496
内存总分配: 500117056
堆内存分配: 50078496
垃圾回收次数: 10
-----
当前内存分配: 76712
内存总分配: 1500199904
堆内存分配: 76712
垃圾回收次数: 20
-----

深入理解垃圾回收

观察垃圾回收的行为能够帮助你在性能较慢的应用中发现问题。你可以通过以下命令查看更详细的 GC 信息:

bash 复制代码
$ GODEBUG=gctrace=1 go run gColl.go

输出会显示每次垃圾回收的详细数据。例如:

gc 4 @0.025s 0%: 0.002+0.065+0.018 ms clock, 47->47->0 MB, 48 MB goal

三色标记-清除算法

Go 的垃圾回收基于三色标记-清除算法。这个算法将堆中的对象分为三类:白色、灰色和黑色。白色对象是垃圾回收的候选对象,而灰色对象可能指向白色对象,黑色对象则不会指向白色对象。

当垃圾回收开始时,所有对象最初是白色的,垃圾回收器会将根对象标记为灰色,并继续扫描灰色对象。如果灰色对象指向白色对象,它会将这些白色对象标记为灰色,最终所有不可达的白色对象会被回收。

在程序运行过程中,如果某个对象变得可达,写屏障机制会将其重新标记为灰色,确保其不会被错误回收。

这个三色标记-清除算法不仅适用于 Go,还可以应用于其他编程语言。

相关推荐
懒大王爱吃狼44 分钟前
Python教程:python枚举类定义和使用
开发语言·前端·javascript·python·python基础·python编程·python书籍
秃头佛爷2 小时前
Python学习大纲总结及注意事项
开发语言·python·学习
待磨的钝刨2 小时前
【格式化查看JSON文件】coco的json文件内容都在一行如何按照json格式查看
开发语言·javascript·json
XiaoLeisj4 小时前
【JavaEE初阶 — 多线程】单例模式 & 指令重排序问题
java·开发语言·java-ee
paopaokaka_luck4 小时前
【360】基于springboot的志愿服务管理系统
java·spring boot·后端·spring·毕业设计
励志成为嵌入式工程师5 小时前
c语言简单编程练习9
c语言·开发语言·算法·vim
捕鲸叉5 小时前
创建线程时传递参数给线程
开发语言·c++·算法
A charmer5 小时前
【C++】vector 类深度解析:探索动态数组的奥秘
开发语言·c++·算法
码农小旋风5 小时前
详解K8S--声明式API
后端
Peter_chq5 小时前
【操作系统】基于环形队列的生产消费模型
linux·c语言·开发语言·c++·后端