示例c++源码:
cpp
int main(int argc, char** argv)
{
auto sk = argc;
int a = 11 << sk;
int b = 19 + argc;
volatile int rv = a + b * 8;
rv *= sk;
return rv;
}
GUN x86 64bit AT&T 汇编环境下用 g++ -O1 -Wa,-adhln ./main.cc命令反汇编
反汇编源码:
cpp
0000 89F9 movl %edi, %ecx
0002 B80B0000 movl $11, %eax
0007 D3E0 sall %cl, %eax
0009 8D84F898 leal 152(%rax,%rdi,8), %eax
0010 0FAFC7 imull %edi, %eax
0013 C3 ret
一点准备知识:
先通过通用寄存器cx来说明一下寄存器的命名,以便理解。
一般来讲,cx是两个字节(一个字,16bit)的通用寄存器。cx的高8位字节叫做ch大写为CH,低8位字节叫做cl大写为CL,ch和cl可以单独再汇编指令中使用。16位寄存器,8086CPU时代的老物件了。接着到了x86-32位时代。寄存器要存储32bit,这时候cx的名字就变为ecx,大写为ECX。仍然是通用寄存器,ecx由两个cx构成,一个高16位cx另一个是低16位cx。进入如今的64位时代,ecx就升级为rcx大写为RCX。同理,AX,BX,DX,DI,SI等都一样的。相对于16为后续更高位宽的cpu计算系统,相应的增加了其他的寄存器,例如支持SSE(SIMD)和AVX(MIMD)并行计算的相关寄存器。如下图示例:
AT&T 格式(GAS)汇编指令示例说明: movl实际是mov指令,后面这个l(L的小写)是个后缀,还有诸如:"b", "s", "w", "l", "q" or "t" 这些后缀。详情如下所示:
b = byte (8 bit).
s = single (32-bit floating point).
w = word (16 bit).
l = long (32 bit integer or 64-bit floating point).
q = quad (64 bit).
t = ten bytes (80-bit floating point).
所以sall实际是sal指令加上l后缀。
逐句解释说明:
cpp
# 下面一句代码,将形参argc的数据值存放到 ecx寄存器
movl %edi, %ecx
# 下面一句代码,将立即数11存放到 eax寄存器
movl $11, %eax
# 下面一句代码, 用cl寄存器中的值对eax中的值做左移位运算操作,sal就是算数左移指令也可以是shl
sall %cl, %eax
# 下面一句代码, 是经过指令优化的。实际实现的运算逻辑是: 8 * rdi + rax + 152,而152 = 19 * 8。
# 这样的优化就减少了计算。lea指令是计算源操作数的地址并保存到目标操作数,也就是将上述计算结果的地址
# 存放到eax寄存器。
leal 152(%rax,%rdi,8), %eax
# 下面一句代码,edi的值乘以eax的值,并将结果放在eax中。imul是有符号乘法指令。
imull %edi, %eax
# 下面一句代码,函数返回。
ret