文章目录
- [Golang GMP 调度模型详解](#Golang GMP 调度模型详解)
- 常见问题
-
- 基础概念
-
- [1. GMP 各组件的作用是什么?](#1. GMP 各组件的作用是什么?)
- [2. 为什么 Go 需要自己的调度器?](#2. 为什么 Go 需要自己的调度器?)
- [3. GOMAXPROCS 的作用是什么?](#3. GOMAXPROCS 的作用是什么?)
- 调度流程
-
- [4. Goroutine 如何被调度到 M 上执行?](#4. Goroutine 如何被调度到 M 上执行?)
- [5. 系统调用会阻塞整个线程吗?](#5. 系统调用会阻塞整个线程吗?)
- [6. 什么是自旋线程(Spinning Thread)?](#6. 什么是自旋线程(Spinning Thread)?)
- 高级特性
-
- [7. Work Stealing 如何提升性能?](#7. Work Stealing 如何提升性能?)
- [8. Go 如何实现抢占式调度?](#8. Go 如何实现抢占式调度?)
- [9. 全局队列 vs. 本地队列的优势?](#9. 全局队列 vs. 本地队列的优势?)
- [10. Goroutine 泄露会导致什么问题?](#10. Goroutine 泄露会导致什么问题?)
- [11. 如何诊断调度器瓶颈?](#11. 如何诊断调度器瓶颈?)
- [12. 为什么 Goroutine 比线程更高效?](#12. 为什么 Goroutine 比线程更高效?)
- 实战场景
-
- [13. GOMAXPROCS 设为 1 会发生什么?](#13. GOMAXPROCS 设为 1 会发生什么?)
- [14. 大量 Goroutine 卡在 channel 会怎样?](#14. 大量 Goroutine 卡在 channel 会怎样?)
- [15. 如何优化高并发下的调度性能?](#15. 如何优化高并发下的调度性能?)
- [csview 中有关 GMP 调度机制的八个问题](#csview 中有关 GMP 调度机制的八个问题)
-
- [1. 简单介绍 GMP 模型?](#1. 简单介绍 GMP 模型?)
- [2. 简述 GMP 的调度流程?](#2. 简述 GMP 的调度流程?)
- [3. P 和 M 的个数?](#3. P 和 M 的个数?)
- [4. P 和 M 何时被创建?](#4. P 和 M 何时被创建?)
- [5. 简述 goroutine 的创建流程?](#5. 简述 goroutine 的创建流程?)
- [6. goroutine 何时会被挂起?](#6. goroutine 何时会被挂起?)
- [7. 同时启动了一万个 goroutine,会如何调度?](#7. 同时启动了一万个 goroutine,会如何调度?)
- [8. goroutine 内存泄露和处理办法?](#8. goroutine 内存泄露和处理办法?)
Golang GMP 调度模型详解
Golang 的 GMP 调度模型是 Go 语言高并发能力的核心设计,由以下三个组件组成:
- G(Goroutine):轻量级用户态线程,所占用的内存更小(初始 2 KB),由 Go 运行时管理。
- M(Machine):操作系统线程(OS Thread),负责执行 Goroutine,与内核线程一一对应。
- P(Processor):逻辑处理器,管理 Goroutine 队列(本地队列),充当 M 和 G 的调度上下文。
核心机制:
- 协作式调度:Goroutine 会主动让出资源(如通过 channel 阻塞或函数调用时);
- 抢占式调度:通过系统信号抢占长时间运行的 G;
- Work Stealing:当 P 的本地队列为空时,从其它 P 或全局窃取 G;
- Hand Off 机制 :当 G 阻塞时,M 释放 P 给其它 M 使用,避免资源浪费。
常见问题
基础概念
1. GMP 各组件的作用是什么?
G 是轻量级的用户态线程,是执行任务的最小单元;M 是操作系统级别的线程,是实际执行 G 的线程;P 是逻辑处理器,用于管理 G 的队列,并负责提供调度上下文。
2. 为什么 Go 需要自己的调度器?
因为传统的操作系统级线程切换成本高(需要由用户态切换到内存态度),GMP 模型通过用户态调度、复用线程并减少锁竞争,支持百万级 Goroutine 并发。
3. GOMAXPROCS 的作用是什么?
设置 P 的数量(默认等于 CPU 核数),决定并行执行的 Goroutine 数量。
调度流程
4. Goroutine 如何被调度到 M 上执行?
P 将本地队列中的 G 绑定到 M,若本地队列为空 ,则 P 从全局队列窃取或创建新的 G。
5. 系统调用会阻塞整个线程吗?
会,但 Go 的 GMP 调度机制会将 M 与 P 解绑,P 将被分配到空闲的 M 或新创建的 M,避免 G 阻塞。
6. 什么是自旋线程(Spinning Thread)?
M 在寻找可用的 G 时不进入休眠,而是循环检查队列,减少唤醒延迟,但会占用 CPU。
高级特性
7. Work Stealing 如何提升性能?
通过分散调度压力,避免单个 P 的队列成为瓶颈,提升多核利用率。
8. Go 如何实现抢占式调度?
通过向 M 发送 SIGURG
信号,触发调度器检查并抢占运行过久的 G。
9. 全局队列 vs. 本地队列的优势?
全局队列公平但加锁,本地队列无锁但可能导致负载不均,Work Stealing 弥补了这一点。
10. Goroutine 泄露会导致什么问题?
M 和 P 资源占用增加,可能导致程序内存耗尽或调度延迟升高。
11. 如何诊断调度器瓶颈?
使用 go tool trace
查看调度延迟,或通过 GODEBUG=schedtrace=1000
输出调度信息。
12. 为什么 Goroutine 比线程更高效?
Goroutine 的栈可动态扩容,线程切换由用户态调度,避免了从用户态陷入到内核态的上下文切换开销。
实战场景
13. GOMAXPROCS 设为 1 会发生什么?
所有 Goroutine 串行执行,无法利用多核,但并发逻辑仍可通过调度正常运行。
14. 大量 Goroutine 卡在 channel 会怎样?
调度器会将阻塞的 G 移出 M,M 继续执行其它 G,但过多的阻塞 G 会增加调度开销。
15. 如何优化高并发下的调度性能?
减少锁竞争(如使用局部变量)、避免过度阻塞操作、调整 GOMAXPROCS 或拆分任务。
csview 中有关 GMP 调度机制的八个问题
1. 简单介绍 GMP 模型?
G(Goroutine):是 Golang 中协程 Goroutine 的缩写,相当于操作系统中的进程控制块。G 当中存放着 goroutine 运行时的栈信息、CPU 的一些寄存器状态以及执行的函数指令等。
M(Machine):代表一个操作系统的主线程,是对内核现成的封装,M 的数量对应于真实的 CPU 数。一个 M 直接关联一个 OS 内核线程,用于执行 G。M 会优先从关联的 P 的本地队列中直接获取待执行的 G。
P(Processor):代表了 M 所需要的上下文环境,保存着 M 运行 G 所需要的全部资源。P 是处理用户级代码逻辑的处理器,可以将其看作一个局部调度器,使得 Golang 代码块可以在操作系统线程上运行。当 P 上有任务时,就需要创建或唤醒一个系统线程来执行其本地队列当中的任务,所以 P 和 M 是相互绑定的。
2. 简述 GMP 的调度流程?
- 每个 P 都有局部队列,局部队列保存待执行的 goroutine,当 M 绑定的 P 的局部队列已满时,新追加的 goroutine 就会被放到全局队列。
- 每一个 P 都和 M 绑定,M 是真正执行 P 中 goroutine 的实体,M 会从其所绑定的 P 当中获取 G 来执行。
- 当 M 绑定的 P 的局部队列为空时,M 会从全局队列获取 goroutine 并转移到本地队列来执行 G,当从全局队列仍然没有可执行的 G 时,M 会从其它 P 的本地队列中偷取(Work Stealing)G 来执行。
- 当 G 因系统调用(syscall)阻塞时,会阻塞 M,此时 P 会和 M 解绑(hand off),并寻找新的空闲的 M,若没有空闲的 M,就会新建一个 M(模糊点:需要注意的是,此时 P 与 M 解绑并与新的 M 绑定,继续执行 P 中其它可执行的 G,因为之前的 G 因系统调用将 M 阻塞了。当之前的 G 系统调用完成并恢复之后,被阻塞的 G 会被直接放回原 P 的本地队列,若原来的 P 已经被占用,则将 G 放入全局队列。位于全局队列当中的 G 可以通过 work stealing 被其它 P 窃取)。
- 当 G 因 channel 或 network I/O 阻塞时,不会阻塞 M,M 会寻找其它可执行的 G。当阻塞的 G 恢复后会重新进行可执行状态并进入 P 队列等待执行。
3. P 和 M 的个数?
- P:由启动时环境变量
GOMAXPROCS
决定。这意味着程序执行的任意时刻都只有GOMAXPROCS
个 goroutine 在同时执行。 - M:Go 程序启动时,会设置 M 的最大数量,默认为 10000,但内核很难支持这么多的线程数,所以这个限制可以忽略;一个 M 阻塞时,会创建新的 M。
总结
M 与 P 的数量没有绝对关系,一个 M 阻塞,P 就会去寻找空闲的 M,如果没有空闲的 M,那么就创建一个新的 M。因此,即使 P 的默认数量为 1,也有可能创建很多个 M 出来。
4. P 和 M 何时被创建?
P:在确定了 P 的最大数量 n
后,运行时系统会创建 n
个 P。
M:在没有足够的 M 来关联 P 并运行其中的 G 时,会创建新的 M 并关联 P。正如上文所提到的,假设当前所有 M 都由于 G 需要系统调用而阻塞了,而 P 当中还有很多就绪的 G,那么就会创建新的 M 来与 P 绑定。
5. 简述 goroutine 的创建流程?
调用 go func()
时,会调用 runtime.newproc
来创建一个 goroutine,这个 goroutine 有自己的栈空间 ,同时在 G 的 sched 中维护栈地址 与程序计数器信息 (即调用 go func()
之后,创建一个 goroutine 并维护 goroutine 运行所需要的状态,比如栈空间以及程序计数器信息)。
创建好的 goroutine 会被放到它对应的内核线程 M 所使用的上下文 P 的 run_queue 中(如果 run_queue 已满,则保存至其它 P 的 run_queue,如果所有 P 的 run_queue 都满了,那么送至全局队列),等待 GMP 调度器决定这个 G 何时取出并执行(又分为两种情况,可能顺序等待自己的 P 调度执行,也可能触发 work stealing 由其它 M 执行)。
6. goroutine 何时会被挂起?
宏观上来说分为两种情况,分别是 goroutine 触发系统调用阻塞,以及 goroutine 等待 channel 或 network I/O。
触发系统调用而阻塞时,G 的 M 会被阻塞,此时与 M 绑定的 P 会寻找一个空闲的 M(无空闲 M 时创建一个新的 M),并取出当前处于就绪态的 G 执行。刚才触发系统调用的 G 在结束系统调用后,被阻塞的 M 会进入休眠状态,等待下一次被唤醒,G 会尝试放入原来 P 的本地队列,如果 P 的本地队列已满,则 G 被放入全局队列。位于全局队列中的 G 会通过 work stealing 机制被其它 P 窃取。
当 goroutine 等待 channel 或 network I/O 而阻塞时,不会阻塞 M,此时 M 会立即取出 P 中其它空闲的 G 执行。当前阻塞的 G 在就绪时会优先放入原来 P 的本地队列当中,否则将 G 放入全局队列。
7. 同时启动了一万个 goroutine,会如何调度?
一万个 G 会按照 P 的设定个数,尽可能平均地分配到每个 P 的本地队列当中。如果所有本地队列都已满,那么就放入 GMP 的全局队列当中。接下来开始执行 GMP 模型的调度策略:
- 本地队列轮转:每一个 P 都维护着一个保存着 G 的本地队列。不考虑 G 进行系统调用和 I/O 情况下的阻塞,P 会周期性地从本地队列中调度 G 到 M 执行,执行一段时间后将 G 的上下文保存起来并插入到队尾,再从队首调度 G 执行;
- 系统调用:P 的个数默认等于 CPU 的核数,每一个 M 必须与 P 绑定才能够运行 P 队列当中的 G。通常来说,运行时 M 的个数会略大于 P 的个数,原因是当 G 触发系统调用时,M 会被阻塞,此时与 M 绑定的 P 会触发 hand off 机制与 M 解绑,并寻找一个新的空闲的 M1 并与之绑定,继续执行这个 P 中就绪的 G。被阻塞的 M 就绪时,会进入休眠状态,等待下一次与 P 绑定。
- 工作量窃取:多个 P 中维护的 G 队列可能是不平衡的,当某个 P 执行完了全部本地队列当中的 G,就会去查询全局队列,如果全局队列在无 G,那么就从另一个 P 的本地队列当中窃取 G 并执行。一般来说每次窃取一半。
8. goroutine 内存泄露和处理办法?
Goroutine 内存泄漏是指程序中启动的 goroutine 由于某些原因无法正常退出,从而长期占用了内存和资源,最终导致程序内存耗尽或性能下降。
预防 Goroutine 泄露的最佳实践
- 始终为阻塞操作设置超时(如 channel、I/O 请求,可以通过 select + time.After 来完成);
- 使用
context
传递取消信号,确保 goroutine 可以及时退出; - 优先使用带 buffer 的 channel,避免无缓存 channel 的意外阻塞;
- 通过
defer
关闭资源; - 定期检查 goroutine 的数量,结合监控工具预警异常增长(比如
pprof
和go tool trace
)