GMP 是怎么来的

系列阅读：GMP由来 -> GMP机制 -> GMP源码1（上）-> GMP源码2（下）

术语口径：G=任务、M=线程、P=运行资源与本地队列、schedt=全局调度中心

Go 的调度器不是一开始就叫 GMP。它是一步步"被问题逼出来"的：

在操作系统里，线程是内核调度单位。它并发能力强，但代价不低，主要有三类成本：

这套模型在高并发场景下会越来越吃力：线程多了，内存和调度开销都上来。

Go 先做的一步，是把"执行任务"拆成两层：

直觉上可以理解为：M 是工人，G 是待办任务。一个 M 在用户态切换不同 G，无需进入内核态，内存开销极小。

为了防止在添加或提取 G 时发生混乱，Go 引入了一把全局锁 （schedlock）。只有拿到锁，M 才能去全局队列里挑选下一个要执行的 G。

在「单枚 M、用户态来回切 G」的阶段，一把全局锁往往还撑得住；为了吃满多核再挂上多枚 M 并行取 G 时，同一把锁和单条全局队列才会迅速变成热点------这就是下一节的出发点。

为了实现真正的并行，利用多核 CPU，Go 从"单线程调度"走向"多线程并行"（多个 M 同时工作），新的问题出现了：

一句话：并行能力提高了，但"交通组织"不够细，导致拥堵。

为了解决上面的拥堵，Go 在 GM 之间加了一个关键角色 P（Processor）。

P 的定位可以理解成"资源管家"：

并行度上还可记一句：「同时跑满几核」主要由 P 的数量（GOMAXPROCS）兜住 ；M（线程）可以多于 P（syscall、阻塞等场景），但 跑用户 G 时仍是 M 必须先绑上 P。

再加上 Work Stealing（工作窃取）：

这样系统整体更均衡，不容易出现"有人忙死、有人闲着"的情况。

还能降低全局热点与锁竞争，热点从「所有人抢一把锁」变成「多数时间在本地无锁/低开销路径上取 G」。

即使有 GMP，如果某个 G 是长循环、长计算，不主动让出 CPU，其他 G 还是会饿。

Go 的抢占演进有两步：

问题是：如果代码是 for {} 这种没有函数调用的死循环，它就不容易被及时抢占。

Go给 M 注册了一个 sighandler
**监控者（sysmon）**发现 M 上的 G 运行超过 10ms 了，且这哥们一直没下台，向 M 发送一个信号：SIGURG。
只要信号一到，操作系统内核会立刻暂停 M1 的当前工作。
M1 会被迫跳转去执行 sighandler。在这个函数里，会直接操作 M1 的寄存器（PC 等），在当前的执行位置强行塞进一个叫 asyncPreempt 的函数调用。
当内核恢复 M1 的执行时，M1 以为自己还在接着刚才的代码跑，结果跑的第一行代码就是被塞进去的 asyncPreempt
asyncPreempt 会通过mcall切换到 g0 栈（这是 Go 调度器的专属后台通道）。在 g0 栈里，它运行 gopreempt_m，正式把 G1 踢走。M1 找 G2 干活去了。

这一步让"公平性"真正可控，不再完全依赖 G 自觉。

综合上面的演进，goroutine 轻量主要来自：