ARMV8 - A64 - 函数调用,内存栈操作

说明

  • 看了下ARM平台上C语言函数调用的反汇编代码,理清楚了其中的内存栈汇编操作,特整理下。
  • 本文环境基于:ARMv8-a架构A53核soc,aarch64状态。

预先了解的知识点

内存栈

相关寄存器

  1. FP:Frame Pointer(栈帧指针),指向当前栈帧的顶部,在A53平台是使用通用寄存器x29保存。
  2. SP:Stack Pointer(栈顶指针),保存当前栈顶地址,在A53平台是一个特殊寄存器,不同异常等级是不同的寄存器,
  3. LR:Link Register(链接寄存器),保存子函数运行结束后的返回地址(跳转指令的下一条指令地址),在A53平台是使用通用寄存器x30充当,详细使用请看bl和ret指令说明。
  • 问题:初次了解,不好理解和区分FP和SP的作用和角色,SP是全局唯一的保存栈顶地址的寄存器,而FP是保存单个函数的栈帧基址,调用新函数,入栈操作结束后,需要将SP的值赋值给FP,类似于:SP是全局变量,而x29是局部变量,虽然大部分时刻两个寄存器值是一样的。

相关汇编指令

实例

  • C源码(a.c)

    #include <stdio.h>

    int test1()
    {
    return test(1, 2);
    }

    int test(int a, int b)
    {
    return a+b;
    }

    int main()
    {
    test1();
    return 0;
    }

  • 对应的汇编代码(aarch64-linux-gnu-gcc -S a.c)

    复制代码
      .arch armv8-a
      .file   "a.c"
      .text
      .align  2
      .global test1
      .type   test1, %function

    test1:
    stp x29, x30, [sp, -16]!
    add x29, sp, 0
    mov w1, 2
    mov w0, 1
    bl test
    ldp x29, x30, [sp], 16
    ret
    .size test1, .-test1
    .align 2
    .global test
    .type test, %function
    test:
    sub sp, sp, #16
    str w0, [sp, 12]
    str w1, [sp, 8]
    ldr w1, [sp, 12]
    ldr w0, [sp, 8]
    add w0, w1, w0
    add sp, sp, 16
    ret
    .size test, .-test
    .align 2
    .global main
    .type main, %function
    main:
    stp x29, x30, [sp, -16]!
    add x29, sp, 0
    bl test1
    mov w0, 0
    ldp x29, x30, [sp], 16
    ret
    .size main, .-main
    .ident "GCC: (Linaro GCC 6.3-2017.05) 6.3.1 20170404"
    .section .note.GNU-stack,"",@progbits

说明

  • 从汇编代码可以看出存在两种不同实现,如下:
  1. 函数调用栈中间函数(test1)
  2. 函数调用栈末端函数(test)

中间函数

复制代码
test1:
    stp x29, x30, [sp, -16]! //将栈空间扩大16字节(更改sp寄存器值),再将x29,x30的数据(遗传自父函数)保存到栈顶 
    add x29, sp, 0 //将栈顶地址(sp)即此函数的栈帧基址保存到x29,
    ...  //函数操作(省略)
    bl  test //跳转到test函数执行
    ldp x29, x30, [sp], 16 //将栈顶数据load到x29,x30中,再缩小栈空间16字节(即将sp恢复到父函数的栈顶)
    ret //返回父函数

末端函数

复制代码
test:
    sub sp, sp, #16 //将sp保存的数据减小16字节,即将栈空间扩大16字节
    ... //函数操作(省略)
    add sp, sp, 16 //将sp保存的数据增加16字节,即将栈空间缩小16字节
    ret

问题

  1. 为什么中间函数和末端函数实现不同,中间函数需要将x29,x30保存到栈内存中,最后再从栈内存中load到x29,x30中。
  • 是因为中间函数(test1)bl指令调用末端函数(test)时,会覆盖掉x30的数据(原本保存的是父函数main,跳转test1的下一条指令),覆盖后中间函数(test1)的ret指令就跳不回main函数了,因此需要先将x30的数据保存到栈上,从子函数跳转回来后,需要将x29,x30的数据从栈上恢复。
  • x29是栈帧指针,保存是当前函数的frame pointer,是约定俗成,因此需要保存和恢复,但是也不是必须,例如:test函数中就没有使用x29。

注意项

  1. sp 必须16Byte 对齐,扩大和缩小都必须是16字节的倍数。
相关推荐
沉在嵌入式的鱼12 小时前
使用nomachine远程连接ARM设备桌面
arm开发·rk3588·远程连接·nomachine
进击的程序汪1 天前
Linux 启动过程流程图--ARM版
linux·运维·arm开发
比奇堡在逃帅哥11 天前
硬件-DAY04(ds18b20、ARM内核)
arm开发
Ronin-Lotus11 天前
微处理器原理与应用篇---ARM常见汇编指令
汇编·arm开发·微处理原理与应用
切糕师学AI11 天前
半导体行业中的专用标准产品ASSP是什么?
arm开发·嵌入式硬件·嵌入式·计算机体系结构
Svan.12 天前
Portable Watch:基于STM32的便携智能手表
arm开发·驱动开发·stm32·嵌入式硬件·硬件工程·pcb工艺·智能手表
凉、介13 天前
CPU Cache 的映射与寻址
linux·arm开发·数据库·redis·缓存·嵌入式
学渣6765613 天前
单片机开发日志cv MDK-ARM工具链迁移到MAKE
arm开发·单片机·嵌入式硬件
ldinvicible13 天前
基于ARM ubuntu如何进行交叉编译
arm开发·数据库·ubuntu
Jason_zhao_MR13 天前
多协议物联网关的方案测试-基于米尔全志T536开发板
arm开发·嵌入式硬件·mcu·物联网·嵌入式