Go 编译器
Go 编译器是通过 go 工具执行的,这个工具的功能不仅仅是生成可执行文件。你可以使用 go tool compile
命令来编译一个 Go 源文件。这个操作将生成一个目标文件,也就是 .o
后缀的文件。以下是在 macOS Mojave 系统上执行的命令和结果展示:
bash
$ go tool compile unsafe.go
$ ls -l unsafe.o
-rw-r--r-- 1 mtsouk staff 6926 Jan 22 21:39 unsafe.o
$ file unsafe.o
unsafe.o: current ar archive
目标文件是一种包含机器代码的文件,通常是不可直接执行的。它的一个主要优势在于在链接阶段所需的内存更少。如果你使用 -pack
命令行参数,go tool compile
会生成一个归档文件,而不是目标文件:
bash
$ go tool compile -pack unsafe.go
$ ls -l unsafe.a
-rw-r--r-- 1 mtsouk staff 6926 Jan 22 21:40 unsafe.a
$ file unsafe.a
unsafe.a: current ar archive
归档文件是一种二进制文件,包含一个或多个文件,主要用于将多个文件合并为一个文件。ar
是其中一种格式,Go 使用的就是这种格式。这个示例中的 unsafe.go
文件不包含任何特殊代码,以上的命令适用于任何有效的 Go 源文件。
查看归档文件内容
你可以使用以下命令查看 .a
归档文件的内容:
bash
$ ar t unsafe.a
__.PKGDEF
_go_.o
-race
标志
另一个值得一提的 go tool compile
命令行参数是 -race
,它可以检测竞态条件。在并发编程中,竞态条件可能导致意想不到的错误。你可以通过以下命令生成汇编语言的输出:
bash
$ go tool compile -S unsafe.go
这个命令会生成大量的输出,虽然它难以理解,但这意味着 Go 编译器很好地隐藏了复杂性,除非你主动要求查看这些细节。
垃圾回收
垃圾回收(GC)是释放未被使用的内存空间的过程,换句话说,GC 会找到那些已经超出作用范围且无法再被引用的对象,并释放它们占用的内存空间。这个过程是在 Go 程序运行时以并发方式执行的,而不是在程序执行前或执行后才开始。Go 垃圾回收的官方文档中提到:
"GC 与变更线程并发运行,精确类型化(也称为精确),允许多个 GC 线程并行运行。它是并发标记-清除,使用写屏障,非代际且非压缩。分配采用大小分离的每 P 分配区,以最小化碎片化,同时在常见情况下消除锁。"
其中涉及到许多术语,接下来我们会逐一解释。首先,我会展示一个查看垃圾回收过程参数的方法。
使用标准库查看垃圾回收参数
幸运的是,Go 标准库提供了一些函数,可以帮助我们了解垃圾回收的运行方式。下面的代码展示了如何获取垃圾回收的相关信息:
go
package main
import (
"fmt"
"runtime"
"time"
)
func printStats(mem runtime.MemStats) {
runtime.ReadMemStats(&mem)
fmt.Println("当前内存分配:", mem.Alloc)
fmt.Println("内存总分配:", mem.TotalAlloc)
fmt.Println("堆内存分配:", mem.HeapAlloc)
fmt.Println("垃圾回收次数:", mem.NumGC)
fmt.Println("-----")
}
每当你需要获取最新的垃圾回收统计信息时,你需要调用 runtime.ReadMemStats()
函数。printStats()
函数用于打印这些信息,以避免重复编写相同的代码。
接下来的部分创建了大量的 Go 切片,以分配大量内存并触发垃圾回收:
go
func main() {
var mem runtime.MemStats
printStats(mem)
for i := 0; i < 10; i++ {
s := make([]byte, 50000000)
if s == nil {
fmt.Println("操作失败!")
}
printStats(mem)
}
}
最后一部分代码做了更多的内存分配操作:
go
for i := 0; i < 10; i++ {
s := make([]byte, 100000000)
if s == nil {
fmt.Println("操作失败!")
}
time.Sleep(5 * time.Second)
}
printStats(mem)
运行上述代码的输出如下(以 macOS Mojave 为例):
bash
$ go run gColl.go
当前内存分配: 66024
内存总分配: 66024
堆内存分配: 66024
垃圾回收次数: 0
-----
当前内存分配: 50078496
内存总分配: 500117056
堆内存分配: 50078496
垃圾回收次数: 10
-----
当前内存分配: 76712
内存总分配: 1500199904
堆内存分配: 76712
垃圾回收次数: 20
-----
深入理解垃圾回收
观察垃圾回收的行为能够帮助你在性能较慢的应用中发现问题。你可以通过以下命令查看更详细的 GC 信息:
bash
$ GODEBUG=gctrace=1 go run gColl.go
输出会显示每次垃圾回收的详细数据。例如:
gc 4 @0.025s 0%: 0.002+0.065+0.018 ms clock, 47->47->0 MB, 48 MB goal
三色标记-清除算法
Go 的垃圾回收基于三色标记-清除算法。这个算法将堆中的对象分为三类:白色、灰色和黑色。白色对象是垃圾回收的候选对象,而灰色对象可能指向白色对象,黑色对象则不会指向白色对象。
当垃圾回收开始时,所有对象最初是白色的,垃圾回收器会将根对象标记为灰色,并继续扫描灰色对象。如果灰色对象指向白色对象,它会将这些白色对象标记为灰色,最终所有不可达的白色对象会被回收。
在程序运行过程中,如果某个对象变得可达,写屏障机制会将其重新标记为灰色,确保其不会被错误回收。
这个三色标记-清除算法不仅适用于 Go,还可以应用于其他编程语言。