Rust tokio：Task ≠ Thread：Tokio 调度模型中的“假并发”与真实代价

------ 为什么你的轻量级 Task 会拖垮物理线程？

在 Rust 异步生态中，tokio::spawn 经常被误认为是 std::thread::spawn 的廉价替代品。这种类比在功能上行得通，但在资源模型 和调度本质上，两者有着云泥之别。

如果不理解这种差异，你迟早会遇到那种"CPU 占用不高，但请求超时严重"的诡异线上问题。

一、视角的切换：CPU 真的在运行 Task 吗？

从操作系统的视角看，CPU 永远只认识一件事：线程（Thread）。

OS 线程：是内核分配 CPU 时间片的最小单位，拥有独立的寄存器上下文和兆字节（MB）级别的栈空间。
Tokio Task ：是一个由用户态 Runtime 管理的逻辑闭包。

真相是： CPU 永远不会"执行一个 Task"。它始终在执行某个驱动 Runtime 的线程，而这个线程正巧在这一微秒，调用了某个 Task 状态机的 poll 方法。

二、剖析 Task 的身体：它到底是什么？

如果我们把一个正在运行的 Task 拆解开，你会发现它精简得令人发指。

1. 内存中的 Task 结构

一个 Task 在堆上的内存布局大致如下：

Header：存储任务状态（准备就绪、等待中、已完成）、引用计数。
Future ：编译器生成的巨大 enum 状态机。
Waker：一个指向虚拟表（Vtable）的指针，决定了任务如何被重新唤醒。

2. "无栈"的魔法

线程之所以重，是因为每个线程都要预留几 MB 的栈空间以防函数调用溢出。而 Task 是**无栈（Stackless）**的。

Task 的"栈"其实就是其内部生成的 Future 结构体。
所有的局部变量在 .await 跨越期间，都会被"持久化"到这个结构体的成员变量里。

三、协作式调度的"暗约"

这是 Tokio 系统的核心假设，也是最容易崩塌的地方：Task 必须自觉。

1. 抢占式（Thread） vs 协作式（Task）

OS 内核是霸道的：它会通过时钟中断，强行剥夺一个运行过久的线程的执行权。
Tokio 调度器 是温柔的：它只能等 Task 运行到下一个 .await 点，主动交还控制权。

2. "不让位"的后果

如果你在 Task 里写了一个死循环或者调用了阻塞的 std::fs::read：

该线程（Worker Thread）被完全霸占。
挂在该线程本地队列（Local Queue）里的几百个 Task 即使已经 Ready，也永远等不到 poll。
这就是典型的"一粒老鼠屎坏了一锅粥"。

四、 M:N 调度模型：Tokio 的并发流水线

Tokio 采用的是经典的 M:N 调度（M 个 Task 跑在 N 个 OS 线程上）。

1. 任务窃取（Work-Stealing）

为了防止"能者多劳"导致的线程负载不均，Tokio 引入了窃取机制：

当线程 A 发现自己的任务队列空了，它会去线程 B 的队列里**"偷"**一半任务过来。
这保证了所有物理核心都在满负荷空转，而不是有的累死，有的闲死。

2. LIFO 槽位优化

这是一个极致的性能细节：为了缓存友好性，刚刚被唤醒的 Task 会绕过长长的队列，直接进入一个专属的 LIFO Slot。这意味着它能立刻在当前 CPU 缓存还"热乎"的时候被执行。

五、真正的代价：.await 的隐形成本

很多人认为 .await 是免费的。事实上，它是异步系统中最昂贵的动作：

状态保存：将寄存器里的局部变量搬运回堆上的 Future 结构体。
注册通知：在 I/O 驱动或 Timer 里挂个号。
重新排队：任务回到队列尾部（或 LIFO 槽），等待下一次被取出。

如果你的业务逻辑非常碎，到处都是 .await，你会发现调度开销甚至超过了业务本身的计算开销。

六、什么时候该 spawn Task？什么时候该用 Thread？

适合 Task 的： 网络请求、数据库查询、定时器、高并发且 IO 密集的逻辑。
不适合 Task 的（必须用 spawn_blocking 或独立线程）：
- bcrypt 加密、大规模 JSON 解析、图像处理。
- 任何同步的磁盘 IO 调用。
- 任何会阻塞线程的操作。

七、总结：程序员与 Runtime 的交易

使用 Tokio，意味着你接受了一场关于执行权的交易：

Tokio 承诺：给你极致的单机并发能力，单机支撑百万 Task 不是梦。
你必须承诺 ：绝不阻塞，永远在 .await 处优雅地让座。

如果你破坏了规则，Task 就不再是"轻量级线程"，而是系统崩溃的"导火索"。