使用 sysrq 快照内核状态堆栈
当你发现内核线程 "卡住(hang)" 时,第一步是检查内核线程的运行位置,可以通过 SysRq(系统请求键) 查看 CPU 和任务的堆栈状态。这步不需要加打印,会很轻量。
启用 sysrq 功能:
确保内核支持 SysRq(通常在核心配置里启用 CONFIG_MAGIC_SYSRQ):
echo 1 > /proc/sys/kernel/sysrq
触发所有 CPU 的堆栈快照: 通过以下命令输出所有 CPU 上线程的堆栈状态:
echo w > /proc/sysrq-trigger
echo w 命令输出系统中所有运行中的任务堆栈。
输出中会包含目标内核线程的 堆栈回溯(stack trace),你可以从中判断线程的阻塞点。
定位目标线程:
在生成的日志中,找到卡住的线程。
检查其信号状态(如 TASK_RUNNING, TASK_UNINTERRUPTIBLE)和调用的栈帧。
示例结果 (dmesg):
sysrq: Show Blocked State
task: kthread_example state: TASK_UNINTERRUPTIBLE
Call Trace:
my_function_wait+0x20/0x50
wait_for_event+0x15/0x60
schedule+0x35/0x50
如果线程处于 TASK_UNINTERRUPTIBLE,说明它可能正在等待某些资源。
"函数名" 指向目标函数,比如这里是 my_function_wait,你需要深入分析该函数的实现。