深入探索 Go 语言的编译器与垃圾回收机制

Go 编译器

Go 编译器是通过 go 工具执行的,这个工具的功能不仅仅是生成可执行文件。你可以使用 go tool compile 命令来编译一个 Go 源文件。这个操作将生成一个目标文件,也就是 .o 后缀的文件。以下是在 macOS Mojave 系统上执行的命令和结果展示:

bash 复制代码
$ go tool compile unsafe.go
$ ls -l unsafe.o
-rw-r--r--  1 mtsouk  staff  6926 Jan 22 21:39 unsafe.o
$ file unsafe.o
unsafe.o: current ar archive

目标文件是一种包含机器代码的文件,通常是不可直接执行的。它的一个主要优势在于在链接阶段所需的内存更少。如果你使用 -pack 命令行参数,go tool compile 会生成一个归档文件,而不是目标文件:

bash 复制代码
$ go tool compile -pack unsafe.go
$ ls -l unsafe.a
-rw-r--r--  1 mtsouk  staff  6926 Jan 22 21:40 unsafe.a
$ file unsafe.a
unsafe.a: current ar archive

归档文件是一种二进制文件,包含一个或多个文件,主要用于将多个文件合并为一个文件。ar 是其中一种格式,Go 使用的就是这种格式。这个示例中的 unsafe.go 文件不包含任何特殊代码,以上的命令适用于任何有效的 Go 源文件。

查看归档文件内容

你可以使用以下命令查看 .a 归档文件的内容:

bash 复制代码
$ ar t unsafe.a
__.PKGDEF
_go_.o

-race 标志

另一个值得一提的 go tool compile 命令行参数是 -race,它可以检测竞态条件。在并发编程中,竞态条件可能导致意想不到的错误。你可以通过以下命令生成汇编语言的输出:

bash 复制代码
$ go tool compile -S unsafe.go

这个命令会生成大量的输出,虽然它难以理解,但这意味着 Go 编译器很好地隐藏了复杂性,除非你主动要求查看这些细节。

垃圾回收

垃圾回收(GC)是释放未被使用的内存空间的过程,换句话说,GC 会找到那些已经超出作用范围且无法再被引用的对象,并释放它们占用的内存空间。这个过程是在 Go 程序运行时以并发方式执行的,而不是在程序执行前或执行后才开始。Go 垃圾回收的官方文档中提到:

"GC 与变更线程并发运行,精确类型化(也称为精确),允许多个 GC 线程并行运行。它是并发标记-清除,使用写屏障,非代际且非压缩。分配采用大小分离的每 P 分配区,以最小化碎片化,同时在常见情况下消除锁。"

其中涉及到许多术语,接下来我们会逐一解释。首先,我会展示一个查看垃圾回收过程参数的方法。

使用标准库查看垃圾回收参数

幸运的是,Go 标准库提供了一些函数,可以帮助我们了解垃圾回收的运行方式。下面的代码展示了如何获取垃圾回收的相关信息:

go 复制代码
package main

import (
   "fmt"
   "runtime"
   "time"
)

func printStats(mem runtime.MemStats) {
   runtime.ReadMemStats(&mem)
   fmt.Println("当前内存分配:", mem.Alloc)
   fmt.Println("内存总分配:", mem.TotalAlloc)
   fmt.Println("堆内存分配:", mem.HeapAlloc)
   fmt.Println("垃圾回收次数:", mem.NumGC)
   fmt.Println("-----")
}

每当你需要获取最新的垃圾回收统计信息时,你需要调用 runtime.ReadMemStats() 函数。printStats() 函数用于打印这些信息,以避免重复编写相同的代码。

接下来的部分创建了大量的 Go 切片,以分配大量内存并触发垃圾回收:

go 复制代码
func main() {
   var mem runtime.MemStats
   printStats(mem)
   for i := 0; i < 10; i++ {
      s := make([]byte, 50000000)
      if s == nil {
         fmt.Println("操作失败!")
      }
      printStats(mem)
   }
}

最后一部分代码做了更多的内存分配操作:

go 复制代码
for i := 0; i < 10; i++ {
   s := make([]byte, 100000000)
   if s == nil {
      fmt.Println("操作失败!")
   }
   time.Sleep(5 * time.Second)
}
printStats(mem)

运行上述代码的输出如下(以 macOS Mojave 为例):

bash 复制代码
$ go run gColl.go
当前内存分配: 66024
内存总分配: 66024
堆内存分配: 66024
垃圾回收次数: 0
-----
当前内存分配: 50078496
内存总分配: 500117056
堆内存分配: 50078496
垃圾回收次数: 10
-----
当前内存分配: 76712
内存总分配: 1500199904
堆内存分配: 76712
垃圾回收次数: 20
-----

深入理解垃圾回收

观察垃圾回收的行为能够帮助你在性能较慢的应用中发现问题。你可以通过以下命令查看更详细的 GC 信息:

bash 复制代码
$ GODEBUG=gctrace=1 go run gColl.go

输出会显示每次垃圾回收的详细数据。例如:

复制代码
gc 4 @0.025s 0%: 0.002+0.065+0.018 ms clock, 47->47->0 MB, 48 MB goal

三色标记-清除算法

Go 的垃圾回收基于三色标记-清除算法。这个算法将堆中的对象分为三类:白色、灰色和黑色。白色对象是垃圾回收的候选对象,而灰色对象可能指向白色对象,黑色对象则不会指向白色对象。

当垃圾回收开始时,所有对象最初是白色的,垃圾回收器会将根对象标记为灰色,并继续扫描灰色对象。如果灰色对象指向白色对象,它会将这些白色对象标记为灰色,最终所有不可达的白色对象会被回收。

在程序运行过程中,如果某个对象变得可达,写屏障机制会将其重新标记为灰色,确保其不会被错误回收。

这个三色标记-清除算法不仅适用于 Go,还可以应用于其他编程语言。

相关推荐
巨龙之路2 小时前
C语言中的assert
c语言·开发语言
2301_776681652 小时前
【用「概率思维」重新理解生活】
开发语言·人工智能·自然语言处理
熊大如如3 小时前
Java 反射
java·开发语言
ll7788113 小时前
C++学习之路,从0到精通的征途:继承
开发语言·数据结构·c++·学习·算法
我不想当小卡拉米4 小时前
【Linux】操作系统入门:冯诺依曼体系结构
linux·开发语言·网络·c++
teacher伟大光荣且正确4 小时前
Qt Creator 配置 Android 编译环境
android·开发语言·qt
炎芯随笔4 小时前
【C++】【设计模式】生产者-消费者模型
开发语言·c++·设计模式
乌鸦9444 小时前
《类和对象(下)》
开发语言·c++·类和对象+
炒空心菜菜4 小时前
SparkSQL 连接 MySQL 并添加新数据:实战指南
大数据·开发语言·数据库·后端·mysql·spark
多多*5 小时前
算法竞赛相关 Java 二分模版
java·开发语言·数据结构·数据库·sql·算法·oracle