HC32F460 USB CDC通信异常:非对齐访问异常排查

一个项目中用到了HC32F460的官方USB库,使用官方的CDC例程时发现收发数据时可能会进入HardFault中断,通过在线调试可以发现异常原因为"用法错误,非对齐访问"。

故障仅发生在开启编译优化时,且和编译器有关,在我使用的Keil版本中,如果切换编译器版本为ARMCC v6.16则无法复现问题。没有测试其他编译器版本。

环境

  • 芯片平台:HC32F460
  • 测试程序:HC32F460_DDL_Rev3.3.0\projects\ev_hc32f460_lqfp100_v2\applications\usb\usb_dev_cdc
  • 编译器版本:ARMCC v5.06
  • 编译选项:-c99 -O3,在编译优化配置为O0时无法复现问题。
  • 复现条件:官方CDC例程是将虚拟串口的操作映射到一个实体串口外设上,实现一个USB-USART的透传效果。通过USB连接并打开虚拟串口,实体串口外设收到数据时会通过USB发送到主机端,此时大概率会触发异常。

分析过程

在可以在线调试的环境中,我们可以直接查看调用堆栈确认异常出现的具体位置。首先通过Keil自带的"Call Stack + Locals"窗口,我们可以看到进入异常中断前程序正在执行usb_wrpkt函数。

更进一步,通过查看具体的堆栈信息我们可以确定触发异常的具体汇编命令。

首先查看当前SP指针指向的堆栈栈顶地址,然后可以通过在线调试直接读取对应RAM地址,观察进入异常前一M4内核自动压栈的栈帧。通过其中的PC寄存器我们可以定位到具体发生异常的代码。

通过上述步骤可以确定异常发生在一个LDM汇编指令上:

出错的这行汇编代码执行两件事,加载寄存器r1指向的32位数据到r4寄存器,然后将寄存器r1的值增加4。

此时对照源码,可以确定引发异常的代码是WRITE_REG32(*fifo, *pu32Src++),源码:

c 复制代码
void usb_wrpkt(LL_USB_TypeDef *USBx, const uint8_t *pu8src, uint8_t ch_ep_num, uint16_t len, uint8_t u8DmaEn)
{
    __IO uint32_t *fifo;
    uint32_t u32Count32b;
    uint32_t u32Tmp;
    uint32_t *pu32Src = (uint32_t *)(uint32_t)pu8src;
    if (u8DmaEn == 0U) {
        u32Count32b = (len + 3UL);
        u32Count32b = u32Count32b >> 2U;
        fifo = USBx->DFIFO[ch_ep_num];
        u32Tmp = 0UL;
        while (u32Tmp < u32Count32b) {
          WRITE_REG32(*fifo, *pu32Src++);
            u32Tmp++;
        }
    }
}

从源码不难看出,该函数对传入的地址pu8Src做了强制类型转换,直接通过32位宽度去访问数据,当传入的地址不是对齐地址时,这行语句必然会触发非对齐访问。

但是Cortex-M4内核支持内存非对齐访问,为什么这里会触发异常呢?为什么调整编译优化可以规避问题呢?

带着问题查阅资料可以发现,Cortex-M4内核的内存非对齐访问仅支持单地址操作(LDR,LDRH,STR,STRH),不支持多地址(LDM,STM等)。

与此同时,不开启编译优化时问题代码对应的汇编代码是通过LDR实现,在M4内核上可以正确执行非对齐访问。这一情况解释了为什么关闭编译优化后无法复现问题。

如何解决?

源码中使用强制类型转换的引诱编译器对该处进行优化,使用更高效的LDM命令而不是LDR+ADD来实现数据加载和递增,最终引发悲剧。要根治问题,可以选择放弃一点性能换取鲁棒性,逐字节从pu8Src指向的内存中读取数据。例如:

c 复制代码
while (u32Tmp < u32Count32b) {
    uint32_t dataTemp = (*pu8Src) | (*(pu8Src + 1)) << 8 | (*(pu8Src + 2)) << 16 | (*(pu8Src + 3)) << 24;
    WRITE_REG32(*fifo, dataTemp);
    u32Tmp++;
    pu8Src += 4;
}

参考资料

1 ARM Ltd. "Arm Cortex-M4 Processor Technical Reference Manual".

2 Joseph Yiu. "The Definitive Guide to ARM Cortex-M3 and Cortex-M4 Processors". 3rd Edition

3 Ryy. "ARM Cortex-M3/M4的异常/中断处理流程" https://www.renyunyang.cn/archives/arm01.html

相关推荐
蒸蛋一级爱好者5 小时前
TFTP协议
单片机·嵌入式硬件
优信电子5 小时前
STM32/C51驱动 DHTC11 温湿度传感器
stm32·单片机·嵌入式硬件·c51·温湿度传感器·dhtc11·环境测量
QiLinkOS5 小时前
【从实验室到商业战场:发明专利如何重塑科技与企业的共生生态】
大数据·c语言·数据结构·c++·人工智能·单片机·算法
周周记笔记6 小时前
【元器件专题】三极管-如果B极给一个方波信号,那么V0输出也可以设计为一个方波信号
单片机·嵌入式硬件
HPT_Lt7 小时前
ZCC10012支持100V/1.2A 超低静态电流同步降压转换器 兼容LM5164
单片机·嵌入式硬件
2zcode7 小时前
基于STM32的多功能万年历电子闹钟设计与实现
stm32·单片机·嵌入式硬件
一抹晴空7 小时前
Keil MDK AC6 compiler编译报错,与AC5区别
c语言·arm开发·单片机
0南城逆流07 小时前
【STM32】RTT-Studio中HAL库开发教程十四:MSMART串口组件
stm32·单片机·嵌入式硬件
小慧10248 小时前
STM 32 TIM定时器(2)
stm32·单片机
无痕幽雨8 小时前
STM32实现MQTT及JSON包思路二
stm32·单片机·嵌入式硬件