在嵌入式开发中,FreeRTOS 任务死锁或跑飞往往难以直接定位。本文记录一种基于韦东山老师教程的"手动栈回溯"法:通过分析 TCB(任务控制块)和任务栈(Stack),人肉还原现场,精准定位代码卡死的位置。
1. 核心原理
当 FreeRTOS 任务被挂起或中断打断时,CPU 的寄存器现场会被保存到该任务的私有栈中。
-
硬件自动保存:
xPSR, PC, LR, R12, R0-R3 -
软件手动保存:
R4-R11(以及EXC_RETURN) 只要找到栈顶指针(SP),就能顺藤摸瓜还原当时的PC指针,从而知道程序死在哪一行。
2. 调试步骤
Step 1: 定位任务句柄 (Task Handle) 首先确定是哪个任务出了问题(例如看谁一直不喂狗,或者根据逻辑推断)。获取该任务的句柄(即 TCB_t 结构体的地址)。
Step 2: 获取栈顶指针 (pxTopOfStack)
-
在 Keil 的 Watch Window 中输入任务句柄,或者直接查看内存。
-
TCB_t结构体的第一个成员 通常就是pxTopOfStack(栈顶指针)。 -
记下这个地址值(例如
0x20001234)。
Step 3: 查看栈内存 (Memory View) 在 Keil 的 Memory Window 中输入上一步得到的栈顶地址。你会看到一串数据,这就是被保存的寄存器现场。
注意: 栈是向下生长 的(高地址 -> 低地址),所以我们从栈顶地址开始,往高地址方向依次读取。
Step 4: 还原寄存器 (关键对照表) 根据 Cortex-M3/M4 (不带 FPU) 的标准入栈顺序,从栈顶开始的数据依次对应:
(注:如果开启了 FPU,中间还会有 S0-S31 等浮点寄存器)
Step 5: 修正 Thumb 地址 找到 PC 和 LR 对应的值。
-
STM32 使用 Thumb 指令集,地址最低位 (Bit0) 必定是 1。
-
实际指令地址 = 栈中值 & 0xFFFFFFFE (即减 1)。
Step 6: 汇编定位 (Disassembly)
-
在 Keil 的 Disassembly Window 中,右键 ->
Show Disassembly at Address。 -
输入修正后的 PC 地址。
-
结果分析:
-
PC 指向哪里: 这就是任务停止执行时正在运行的代码。如果指向了
HardFault_Handler或者某个死循环,说明已经跑飞。 -
LR 指向哪里: 输入修正后的 LR 地址,可以看到是谁调用了当前函数(父函数)。
-
3. 案例分析
假设栈中 PC 值为 0x08001A45。
-
修正地址:
0x08001A44。 -
在汇编窗口查看该地址,发现对应的 C 语言代码是
while(flag == 0);。 -
结论:任务卡死在等待
flag标志位的死循环中。