x64汇编下过程参数解析

简介


好久没上博客, 突然发现我的粉丝数变2700+了, 真是这几个月涨的粉比我之前好几年的都多, 于是心血来潮来写一篇, 记录一下x64下的调用约定(这里的调用约定只针对windows平台)

Windows下的x64程序的调用约定有别于x86下的"stdcall调用约定"以及"cdecl调用约定", 它有如下特点:

复制代码
1. 前4个参数使用RCX, RDX, R8, R9进行传参 ⭐
2. 从第5个参数开始, 使用栈传参, 返回值用RAX ⭐
3. 从右往左入栈 ⭐
4. 浮点数用XMM0-XMM3寄存器传参, 浮点数返回值用XMM0寄存器
5. 栈由调用者清理

这里只需要关心标星⭐的点即可

分类讨论

如果参数少于4个的情况下, Windows x64调用约定将使用RCX, RDX, R8, R9进行传参, 这时就很简单:

cpp 复制代码
; 描述: strlen的实现
; RCX: 字符串地址
; 返回值: 字符串长度
StrLen proc 
    mov rax, rcx 
    jmp L1Cmp 
L1:
    inc rax 
L1Cmp:
    mov dl, [rax]
    test dl, dl 
    jnz L1 

    sub rax, rcx 
    ret  
StrLen endp 

当参数多于4个的时候, 这里将分4种情况对其进行讨论:

  • 不构造栈帧 且 没有局部变量
  • 不构造栈帧 且 有局部变量
  • 构造栈帧 且 没有局部变量
  • 构造栈帧 且 有局部变量

这里给的案例C原型如下:

c 复制代码
// 目的是为了计算6个数的和
extern "C" int MultiAdd(int iNum1, int iNum2, int iNum3, int iNum4, int iNum5, int iNum6);

情况1. 不构造栈帧 且 没有局部变量

原理图:

案例:

cpp 复制代码
; RCX:  参数1
; RDX:  参数2
; R8:   参数3
; R9:   参数4
; 参数5和参数6通过栈传递
MultiAdd proc 
    lea rax, [r8 + r9]
    add rax, rcx 
    add rax, rdx 
    ; +8是为了越过"返回地址"
    add rax, [rsp + 8]
    add rax, [rsp + 10h]
    ret 
MultiAdd endp 

解释: 由于这种情况下, 不进行任何栈操作, 所以额外的参数永远是在[rsp + 8]的位置开始的, 依次+8

情况2. 不构造栈帧 且 有局部变量

原理图:

案例:

cpp 复制代码
; RCX:  参数1
; RDX:  参数2
; R8:   参数3
; R9:   参数4
; 参数5和参数6通过栈传递
MultiAdd proc 
    sub rsp, 20h 
    lea rax, [r8 + r9]
    add rax, rcx 
    add rax, rdx 
    ; +28h实际上是8+20h
    ; 8是为了越过"返回地址", 20h是越过局部栈空间
    add rax, [rsp + 28h]
    add rax, [rsp + 30h]
    add rsp, 20h 
    ret 
MultiAdd endp 

解释: 在局部过程中开辟了栈空间或者在栈中保存了参数, 需要让RSP越过对应的空间才能访问到过程的形参, 假设额外栈空间大小为n, 那过程额外的参数永远是在[rsp + 8 + n]的位置开始的, 依次+8

情况3. 构造栈帧 且 没有局部变量

原理图:

案例:

cpp 复制代码
; RCX:  参数1
; RDX:  参数2
; R8:   参数3
; R9:   参数4
; 参数5和参数6通过栈传递
MultiAdd proc 
    ; 开辟栈帧
    push rbp 
    mov rbp, rsp 

    lea rax, [r8 + r9]
    add rax, rcx 
    add rax, rdx 
    ; +10h是越过了保存在栈帧上的rbp以及返回地址
    add rax, [rsp + 10h]
    add rax, [rsp + 18h]
    
    mov rsp, rbp 
    pop rbp 
    ret 
MultiAdd endp 

解释: 如果没有在局部过程中开辟额外栈空间, 那栈帧其实没必要构造的, 因为会让栈中额外多出8字节的开销。过程额外的参数永远是在[rsp + 10h]的位置开始的, 依次+8

情况4. 构造栈帧 且 有局部变量

这里又可以分为2种寻址方式

  • RSP寻址
  • RBP寻址
a. RSP寻址:

RSP寻址就是以RSP作为基地址进行偏移来寻址
原理图:

案例:

cpp 复制代码
; RCX:  参数1
; RDX:  参数2
; R8:   参数3
; R9:   参数4
; 参数5和参数6通过栈传递
MultiAdd proc 
    ; 开辟栈帧
    push rbp 
    mov rbp, rsp 
    sub rsp, 20h 

    lea rax, [r8 + r9]
    add rax, rcx 
    add rax, rdx 
    ; +30h实际上是10h+20h
    ; 10h是越过了保存在栈帧上的rbp以及返回地址
    ; 20h是越过了开辟的局部空间
    add rax, [rsp + 30h]
    add rax, [rsp + 38h]
    
    mov rsp, rbp 
    pop rbp 
    ret 
MultiAdd endp 

解释: 如果你开辟了栈帧, 还用RSP来寻址, 那就得不偿失了, 因为开辟栈帧主要就是为了方便创建局部变量以及访问参数, 但虽然得不偿失也未尝不可。只是比较麻烦。要越过保存在栈上的RBP以及返回地址, 还有自己开辟的局部空间。
假设额外栈空间大小为n, 那过程额外的参数永远是在[rsp + 10h + n]的位置开始的, 依次+8

b. RBP寻址

RBP寻址就是以RBP作为基地址进行偏移来寻址, 这个访问过程的参数非常方便
原理图:

案例:

cpp 复制代码
; RCX:  参数1
; RDX:  参数2
; R8:   参数3
; R9:   参数4
; 参数5和参数6通过栈传递
MultiAdd proc 
    ; 开辟栈帧
    push rbp 
    mov rbp, rsp 
    sub rsp, 20h 

    lea rax, [r8 + r9]
    add rax, rcx 
    add rax, rdx 
    ; 10h实际上是RBP以及返回地址
    add rax, [rbp + 10h]
    add rax, [rbp + 18h]
    
    mov rsp, rbp 
    pop rbp 
    ret 
MultiAdd endp 

解释:

如果用RBP进行寻址, 那就非常方便了, 以8字节的开销保存RBP为代价是非常值得的。

(完)

相关推荐
我在人间贩卖青春6 天前
汇编之伪指令
汇编·伪指令
我在人间贩卖青春6 天前
汇编之伪操作
汇编·伪操作
济6176 天前
FreeRTOS基础--堆栈概念与汇编指令实战解析
汇编·嵌入式·freertos
myloveasuka6 天前
汇编TEST指令
汇编
我在人间贩卖青春6 天前
汇编编程驱动LED
汇编·点亮led
我在人间贩卖青春6 天前
汇编和C编程相互调用
汇编·混合编程
myloveasuka7 天前
寻址方式笔记
汇编·笔记·计算机组成原理
请输入蚊子7 天前
《操作系统真象还原》 第六章 完善内核
linux·汇编·操作系统·bochs·操作系统真像还原
myloveasuka7 天前
指令格式举例
汇编·笔记·计算机组成原理
我在人间贩卖青春8 天前
汇编之分支跳转指令
汇编·arm·分支跳转