Nano-vLLM 源码解读 - 7. Continuous Batchingnano-vllm 用千行代码拆解 vLLM 核心,是读懂大模型推理最快的捷径。L02 把请求生命周期讲完了:一条序列从 add_request 进 WAITING、被调度后状态切到 RUNNING、生成结束转为 FINISHED。L02 还给出每个 step 的内部时间线——schedule 写入 num_scheduled_tokens,run 算 KV 与 logits,postprocess 把 num_scheduled_tokens 累加到 num_cached_tokens 上并将 num_