如何根据HardFault中断抛出的寄存器值排查数组越界

Gitee仓库

bash 复制代码
git clone https://gitee.com/banana-peel-x/freedom-learn.git

项目场景:

实习的时候遇到了函数不可重入问题,场景是上位机与MCU通过udp协议通信,控制MCU测试不同的功能项,频率为1s/次。其中测试CAN老化功能时,需要每秒让CAN控制器进入LoopBack模式,自发自收后上传。测试时偶发跑死,串口抛出异常。

根因:是由于在其他的task里会控制can的模式,在udp的钩子函数里(我的task)里也需要切换can的模式,自测没有问题是两者偶尔各自控制一下硬件没有影响,压测会出现同时控制can,出现HardFault。


问题描述

从本科做项目开始,排查Bug主要靠直觉,小代码量绰绰有余。对于代码量很大的程序却很低效。最后靠部门大佬帮忙解决,大佬一通操作直接看起了汇编,近来吃不好睡不香,故捡起来琢磨一下大佬的排查方法。

首先改进启动文件,startup_stm32f103xb.s:通常出现HardFault异常后会进入HardFault_Handler中断,这里弃用HardFault_Handler函数,改用hard_fault_handler_c函数。
常规

c 复制代码
HardFault_Handler\
                PROC
                EXPORT  HardFault_Handler          [WEAK]
                B       .
                ENDP

改进

c 复制代码
HardFault_Handler\
                PROC
                MOVS    r0, #4
                MOV     r1, lr
                TST     r0, r1
                BEQ     stacking_used_MSP
                MRS     r0, psp
                B       get_LR_and_branch
stacking_used_MSP
                MRS     r0, msp
get_LR_and_branch
                MOV     r1, lr
                IMPORT  hard_fault_handler_c
                BL       hard_fault_handler_c  
                ENDP

在hard_fault_handler_c函数中通过Uart抛出寄存器的值

c 复制代码
void hard_fault_handler_c(unsigned int * hardfault_args, unsigned lr_value)
{
  unsigned int stacked_r0;
  unsigned int stacked_r1;
  unsigned int stacked_r2;
  unsigned int stacked_r3;
  unsigned int stacked_r12;
  unsigned int stacked_lr;
  unsigned int stacked_pc;
  unsigned int stacked_psr;
  stacked_r0 = ((unsigned long) hardfault_args[0]);
  stacked_r1 = ((unsigned long) hardfault_args[1]);
  stacked_r2 = ((unsigned long) hardfault_args[2]);
  stacked_r3 = ((unsigned long) hardfault_args[3]);
  stacked_r12 = ((unsigned long) hardfault_args[4]);
  stacked_lr = ((unsigned long) hardfault_args[5]);
  stacked_pc = ((unsigned long) hardfault_args[6]);
  stacked_psr = ((unsigned long) hardfault_args[7]);

  printf ("[Hard fault handler]\r\n");
  printf ("R0 = %x\r\n", stacked_r0);
  printf ("R1 = %x\r\n", stacked_r1);
  printf ("R2 = %x\r\n", stacked_r2);
  printf ("R3 = %x\r\n", stacked_r3);
  printf ("R12 = %x\r\n", stacked_r12);
  printf ("Stacked LR = %x\r\n", stacked_lr);
  printf ("Stacked PC = %x\r\n", stacked_pc);
  printf ("Stacked PSR = %x\r\n", stacked_psr);
  printf ("Current LR = %x\r\n", lr_value);

  while(1); // endless loop
}

复制代码
发生异常后,可以通过串口抛出的值快速定位问题,KEIL在不破坏现场的情况下进入Debug模式。
当中断或者异常发生时,内核会将xPSR、PC、LR、R12、R3、R2、R1、R0这些寄存器按照顺序依次存入堆栈,这些寄存器中的值是中断/异常发生前一刻的值。
    故抛出的PC寄存器存的就是被中断打断的指令的下一条指令地址,所以我们同个定位PC寄存器中地址所指向的代码,就可以精准定位或定位在问题代码附近。

原因分析:

根据Stacked PC = 8002e8c,在汇编中查找抛出异常前代码运行位置,可以看出StackFlow_50ms函数中数组越界。



相关推荐
Wave84512 小时前
基于 STM32 + ESP8266 + W25Q64 的双核 OTA 底层架构总结
stm32·嵌入式硬件·架构
xiangw@GZ13 小时前
WiFi 全世代(WiFi1~WiFi7)技术规范与核心参数总结
嵌入式硬件
振南的单片机世界13 小时前
CPU时钟:频率越高跑越快,但物理极限在“拖后腿”
stm32·单片机·嵌入式硬件
普中科技14 小时前
【普中 51-Ai8051 开发攻略】-- 第 20 章 输入捕获实验
单片机·嵌入式硬件·输入捕获·pca·普中科技·ai8051u·aicube
d111111111d14 小时前
直流电机位置式 PID 控制 和 舵机的区别
笔记·stm32·单片机·嵌入式硬件·学习
d111111111d17 小时前
了解Modbus
网络·笔记·stm32·单片机·嵌入式硬件·学习
三佛科技-1341638421217 小时前
主控FT32F031便携式吸尘器方案,迷你手持吸尘器MCU控制方案开发
单片机·嵌入式硬件·物联网·智能家居·pcb工艺
一个平凡而乐于分享的小比特18 小时前
一文读懂MCU与FPGA:核心区别、协同之道与双修秘籍
单片机·fpga开发·职场发展·mcu开发
踏着七彩祥云的小丑19 小时前
嵌入式——认识电子元器件——微动开关系列
单片机·嵌入式硬件
调光IC-小雅19 小时前
解析FP62××系列限流保护机制:为何它是DC/DC芯片的安全底线
单片机·嵌入式硬件