常见嵌入式bug类型:死机、重启、数据错乱、通信丢包
- 一、死机(系统卡死、无响应)
- 二、重启(自动复位、反复启动)
- 三、数据错乱(数据乱码、错位、值不对)
- [四、通信丢包(UDP/TCP/串口/CAN 丢数据)](#四、通信丢包(UDP/TCP/串口/CAN 丢数据))
一、死机(系统卡死、无响应)
现象 :设备电源灯亮,但程序不动、按键无反应、串口停止打印、屏幕定格。
本质:程序跑飞、死循环、总线挂死、硬件异常(晶振/电源)。


典型原因
- 晶振虚焊/不起振:运行几分钟随机死机,无规律。
- 电源纹波过大:高负载时电压跌落,MCU 跑飞。
- I2C/SPI 总线挂死:某个外设卡死总线,程序死等。
- 代码死循环/栈溢出 :比如
while(1);、递归过深。
排查方法
- 看串口日志:卡死在哪一行 → 定位外设/函数。
- 示波器测晶振波形、电源纹波。
- 断开外设:逐个拔传感器,看是否恢复。
二、重启(自动复位、反复启动)
现象 :设备突然自动重启、循环启动、日志反复从头开始。
本质:硬件复位触发、看门狗复位、电源掉电、BOD(电压监测)复位。


典型原因
- 复位电路不稳定:复位按键漏电、RC 电容坏、NRST 虚焊。
- 电源带载能力差:一接电机/屏幕就掉电重启。
- 看门狗喂狗不及时:代码耗时太长,没按时喂狗。
- 高温/低温导致 LDO 输出不稳。
排查方法
- 看日志:是否有 "Watchdog Reset" 字样。
- 测电源:满载时电压是否掉到 3.0V 以下。
- 屏蔽看门狗:临时关闭,看是否还重启。
三、数据错乱(数据乱码、错位、值不对)
现象 :存进去的数据读出来不对、显示乱码、传感器数据跳变、Flash 读出乱码。
本质:字节序错误、缓冲区溢出、未初始化、Flash 擦写错误、时序不匹配。

典型原因
- Flash 残留脏数据:升级时没擦干净旧代码,导致数据错乱。
- 缓冲区溢出:数组越界,覆盖了其他变量。
- 大小端不匹配:比如网络数据是大端,本地是小端。
- 串口波特率/校验位不匹配:导致乱码。
排查方法
- 对比写入/读出的十六进制数据。
- 检查数组边界、指针是否越界。
- 核对通信双方波特率、数据位、校验位。
四、通信丢包(UDP/TCP/串口/CAN 丢数据)
现象 :发送 100 个包,只收到 90 个;数据断断续续、时通时断。
本质:缓冲区满、中断优先级不对、时序错误、干扰、硬件接触不良。


典型原因
- 串口缓冲区太小:高速发送时溢出丢包。
- 中断优先级配置错误:高优先级中断打断通信,导致丢包。
- 网线/接口接触不良:网口弹片氧化、虚焊。
- 电源干扰:纹波大,导致信号畸变。
- UDP 无重传:网络波动直接丢包。
排查方法
- 抓包:用 Wireshark/串口工具看收发是否一致。
- 示波器看波形:是否有毛刺、畸变。
- 增大缓冲区、调整中断优先级。