ARMV8 - A64 - 函数调用,内存栈操作

说明

  • 看了下ARM平台上C语言函数调用的反汇编代码,理清楚了其中的内存栈汇编操作,特整理下。
  • 本文环境基于:ARMv8-a架构A53核soc,aarch64状态。

预先了解的知识点

内存栈

相关寄存器

  1. FP:Frame Pointer(栈帧指针),指向当前栈帧的顶部,在A53平台是使用通用寄存器x29保存。
  2. SP:Stack Pointer(栈顶指针),保存当前栈顶地址,在A53平台是一个特殊寄存器,不同异常等级是不同的寄存器,
  3. LR:Link Register(链接寄存器),保存子函数运行结束后的返回地址(跳转指令的下一条指令地址),在A53平台是使用通用寄存器x30充当,详细使用请看bl和ret指令说明。
  • 问题:初次了解,不好理解和区分FP和SP的作用和角色,SP是全局唯一的保存栈顶地址的寄存器,而FP是保存单个函数的栈帧基址,调用新函数,入栈操作结束后,需要将SP的值赋值给FP,类似于:SP是全局变量,而x29是局部变量,虽然大部分时刻两个寄存器值是一样的。

相关汇编指令

实例

  • C源码(a.c)

    #include <stdio.h>

    int test1()
    {
    return test(1, 2);
    }

    int test(int a, int b)
    {
    return a+b;
    }

    int main()
    {
    test1();
    return 0;
    }

  • 对应的汇编代码(aarch64-linux-gnu-gcc -S a.c)

    复制代码
      .arch armv8-a
      .file   "a.c"
      .text
      .align  2
      .global test1
      .type   test1, %function

    test1:
    stp x29, x30, [sp, -16]!
    add x29, sp, 0
    mov w1, 2
    mov w0, 1
    bl test
    ldp x29, x30, [sp], 16
    ret
    .size test1, .-test1
    .align 2
    .global test
    .type test, %function
    test:
    sub sp, sp, #16
    str w0, [sp, 12]
    str w1, [sp, 8]
    ldr w1, [sp, 12]
    ldr w0, [sp, 8]
    add w0, w1, w0
    add sp, sp, 16
    ret
    .size test, .-test
    .align 2
    .global main
    .type main, %function
    main:
    stp x29, x30, [sp, -16]!
    add x29, sp, 0
    bl test1
    mov w0, 0
    ldp x29, x30, [sp], 16
    ret
    .size main, .-main
    .ident "GCC: (Linaro GCC 6.3-2017.05) 6.3.1 20170404"
    .section .note.GNU-stack,"",@progbits

说明

  • 从汇编代码可以看出存在两种不同实现,如下:
  1. 函数调用栈中间函数(test1)
  2. 函数调用栈末端函数(test)

中间函数

复制代码
test1:
    stp x29, x30, [sp, -16]! //将栈空间扩大16字节(更改sp寄存器值),再将x29,x30的数据(遗传自父函数)保存到栈顶 
    add x29, sp, 0 //将栈顶地址(sp)即此函数的栈帧基址保存到x29,
    ...  //函数操作(省略)
    bl  test //跳转到test函数执行
    ldp x29, x30, [sp], 16 //将栈顶数据load到x29,x30中,再缩小栈空间16字节(即将sp恢复到父函数的栈顶)
    ret //返回父函数

末端函数

复制代码
test:
    sub sp, sp, #16 //将sp保存的数据减小16字节,即将栈空间扩大16字节
    ... //函数操作(省略)
    add sp, sp, 16 //将sp保存的数据增加16字节,即将栈空间缩小16字节
    ret

问题

  1. 为什么中间函数和末端函数实现不同,中间函数需要将x29,x30保存到栈内存中,最后再从栈内存中load到x29,x30中。
  • 是因为中间函数(test1)bl指令调用末端函数(test)时,会覆盖掉x30的数据(原本保存的是父函数main,跳转test1的下一条指令),覆盖后中间函数(test1)的ret指令就跳不回main函数了,因此需要先将x30的数据保存到栈上,从子函数跳转回来后,需要将x29,x30的数据从栈上恢复。
  • x29是栈帧指针,保存是当前函数的frame pointer,是约定俗成,因此需要保存和恢复,但是也不是必须,例如:test函数中就没有使用x29。

注意项

  1. sp 必须16Byte 对齐,扩大和缩小都必须是16字节的倍数。
相关推荐
生涯にわたる学び2 天前
ARM 实操 流水灯 按键控制 day53
arm开发·嵌入式硬件
YLAD3 天前
gnu arm toolchain中的arm-none-eabi-gdb.exe的使用方法?
arm开发
饶宇航3 天前
嵌入式硬件——ARM
arm开发
small_wh1te_coder4 天前
GCC深度剖析:从编译原理到嵌入式底层实战
汇编·c++·面试·嵌入式·状态模式·c
白书宇4 天前
5.从零开始写LINUX内核--从实模式到保护模式的过渡实现
linux·汇编·数据库·开源
浩浩测试一下5 天前
02高级语言逻辑结构到汇编语言之逻辑结构转换 if (...) {...} else {...} 结构
汇编·数据结构·数据库·redis·安全·网络安全·缓存
wdfk_prog5 天前
[Linux]学习笔记系列 -- [arm][lib]
linux·运维·arm开发·笔记·学习
蚰蜒螟6 天前
JVM安全点轮询汇编函数解析
汇编·jvm·安全
努力自学的小夏6 天前
RK3568 Linux驱动学习——新字符设备驱动
linux·arm开发·驱动开发·笔记·学习
wdfk_prog7 天前
[Linux]学习笔记系列 -- [arm][lds]
linux·运维·arm开发·笔记·学习