Linux 调度类(sched_class)

Linux 调度类(sched_class)

总览与优先级顺序

Linux 内核把不同调度策略的实现抽象为若干调度类(sched_class),系统按固定顺序遍历这些类来选择下一个运行任务。常见的类及顺序是:

  • stop_sched_class(最高优先级,用于内核"停止/停机"场景)
  • dl_sched_class (SCHED_DEADLINE,基于 EDF/CBS 的实时到期调度)
  • rt_sched_class (SCHED_FIFO / SCHED_RR,基于优先级的实时调度)
  • fair_sched_class (CFS,普通任务/批处理的公平调度)
  • idle_sched_class(最低优先级,CPU 空闲线程)

内核中对应的声明示例:

c 复制代码
extern const struct sched_class stop_sched_class;
extern const struct sched_class dl_sched_class;
extern const struct sched_class rt_sched_class;
extern const struct sched_class fair_sched_class;
extern const struct sched_class idle_sched_class;

sched_class 抽象(接口与职责)

每个调度类通过 struct sched_class 提供一组回调函数,常见接口包括:

enqueue_task / dequeue_task:把任务放入/移出该类的就绪结构。

pick_next_task:从该类中选择下一个要运行的 task_struct*(scheduler 调度时首要调用)。

task_tick:tick 时类特有的处理(如 RR 换位、CFS 更新 vruntime)。

get_rr_interval:只对带时间片的实时轮转(SCHED_RR)有意义。

balance / select_task_rq / migrate_task_rq / task_woken / set_cpus_allowed:仅在 SMP 下由类实现与负载均衡和迁移相关的策略。

switched_from / switched_to / prio_changed:切换或优先级变化时的处理(注意 switched_from 可能释放 rq->lock,pair 是由 p->pi_lock 串行化)。

uclamp_enabled(条件编译项):类是否支持 uclamp。

enqueue_task / dequeue_task:把任务放入/移出该类的就绪结构。

pick_next_task:从该类中选择下一个要运行的 task_struct*(scheduler 调度时首要调用)。

task_tick:tick 时类特有的处理(如 RR 换位、CFS 更新 vruntime)。

get_rr_interval:只对带时间片的实时轮转(SCHED_RR)有意义。

balance / select_task_rq / migrate_task_rq / task_woken / set_cpus_allowed:仅在 SMP 下由类实现与负载均衡和迁移相关的策略。

switched_from / switched_to / prio_changed:切换或优先级变化时的处理(注意 switched_from 可能释放 rq->lock,pair 是由 p->pi_lock 串行化)。

uclamp_enabled(条件编译项):类是否支持 uclamp。

各调度类详解

1) stop_sched_class

  • 用途:处理内核的 stop/停止样例(如 stop_machine、CPU 热插拔相关的短期"阻塞/停止"任务)。
  • 特点:优先级最高,短期任务,确保内核关键工作能抢占其他用户任务。

2) dl_sched_class(SCHED_DEADLINE)

  • 用途:实现 SCHED_DEADLINE 策略,支持实时任务的最早截止优先(EDF)与带宽保护(Capacity / CBS)。
  • 数据结构:dl_entity、dl_rq,记录 runtime、deadline、period。
  • 行为:选取最早 deadline 的可运行任务;调度时需保证任务不超出其 runtime(会拒绝或回退调度申请以保护其它任务)。
  • 适用场景:严格实时任务、需要签订带宽的场景(多媒体、控制系统等)。

3) rt_sched_class(SCHED_FIFO / SCHED_RR)

  • 用途:传统实时策略,基于静态优先级(0--99)。SCHED_FIFO:先到先运行直到阻塞/自愿让出;SCHED_RR:同优先级轮转时间片。
  • 数据结构:按优先级分队列 + 优先级位图(bitmap)以快速找到最高优先级任务。
  • 特点:优先级高于 CFS,被 RT 任务占满时会阻塞普通任务;对响应性要求高,但可导致优先级反转问题(需使用优先级继承等机制)。
  • 调度与抢占:RT 任务一旦就绪通常会抢占低优先级任务。rr 使用 timeslice(sched_rr_timeslice_ms)进行轮转。

4) fair_sched_class(CFS:完全公平调度器)

  • 用途:Linux 默认普通进程/线程的调度(SCHED_OTHER、SCHED_BATCH 等)。
  • 核心思想:以虚拟运行时间(vruntime)衡量"占用份额",把 CPU 时间尽可能公平地分配给 runnable 实体。
  • 关键数据结构:
    • struct sched_entity:表示可调度实体(任务或任务组)。
    • struct cfs_rq:维护红黑树(rb_tree)按 vruntime 排序;跟踪 min_vruntime、load weight、runnable sum。
  • 时钟与片段:通过 sched_latency、min_granularity、nice 权重影响时间片大小(较重的进程获得更多 CPU 时间)。
  • 负载均衡:有复杂的跨 CPU 平衡策略(pull/push、负载递归域 balance_domains),支持 cgroup/V2 的层级公平调度(hierarchical scheduling)。
  • 优点:整体公平与可伸缩;缺点:复杂度高,调优点多(如响应短任务的最小粒度)。

5) idle_sched_class

  • 用途:当无其他任务可运行时,运行每个 CPU 的 idle 线程。
  • 特点:最低优先级,通常进入节能/空闲循环。

调度决策流程要点(高层)

  1. 就绪/唤醒:唤醒时会调用相应调度类的 enqueue_task,并可能触发 check_preempt_curr 来判断是否立刻抢占。
  2. 选择任务:调度器(pick_next_task_fair 等)会按调度类顺序调用每个类的 pick_next_task,第一类返回非 NULL 的任务即被选中(即高优先级类优先)。
  3. 切换与时钟片:调用 put_prev_task / set_curr_task / task_tick 等维护数据与切片逻辑。
  4. 迁移/均衡:负载均衡逻辑会在必要时移动任务或调整 runqueue(不同类有不同的均衡策略)。

策略与系统调用

  • 政策设置:sched_setscheduler(SCHED_FIFO / SCHED_RR / SCHED_OTHER 等)、sched_setattr(包含 SCHED_DEADLINE 参数)。
  • 查看/调试:/proc//sched、/proc/sched_debug、chrt、schedtool;可以用 ps -o pid,comm,policy,rtprio。
相关推荐
日更嵌入式的打工仔2 小时前
实用:嵌入式执行时间测量常用方法
笔记·单片机
林义满2 小时前
运维转型让产线 “少掉链”:上海义满汽车零部件借智能运维降本增效,年减损失超 200 万
运维·汽车
VekiSon3 小时前
Linux系统编程——IPC进程间通信:信号通信与共享内存
linux·运维·服务器
南山nash3 小时前
CentOs7 安装 Docker 详细步骤
linux·运维·docker·容器
徐先生 @_@|||3 小时前
Conda最基础使用命令
linux·windows·conda
美狐美颜SDK开放平台3 小时前
直播美颜sdk源码解析:动态贴纸功能开发与性能优化
性能优化
json{shen:"jing"}3 小时前
1-C语言的数据类型
c语言·c++·算法
ZHHHHHJ663 小时前
LL层-PAST
运维·服务器·网络
想学后端的前端工程师3 小时前
【React性能优化实战指南:从入门到精通-web技术栈】
前端·react.js·性能优化