LuaJit分析(三)luajit字节码文件格式

Luajit字节码文件格式的完整信息如上图所示,包括文件头Header和原型Proto,一个原型可以对应lua源码中的一个函数或源文件。
一、文件头
文件标志: 占用三个字节,始终是0x1B4C4A,表示这是一个luajit文件
版本: 占用一个字节,最新版2.1.0-beta3显示为2
**Flags标志:**占用一个字节,官方定义为:

cpp 复制代码
#define BCDUMP_F_BE   0x01
#define BCDUMP_F_STRIP    0x02
#define BCDUMP_F_FFI    0x04
#define BCDUMP_F_FR2    0x08

BE表示是否大端对齐,默认0表示小端对齐

STRIP表示是否去除调试信息,0表示没去除,包含调试信息

FFI表示是否有调用外部C函数库

FR2表示是否使用开启了FR2,64位模式编译时FR2 = 1
文件名大小(STRIP=0) :源文件名占用的字节大小
**文件名(STRIP=0):**源文件名

二、原型
1、原型头
原型大小: uleb128类型,表示整个原型占用字节大小,为0标志结束
**原型flags标志:**定义如下:

cpp 复制代码
#define PROTO_CHILD   0x01  /* Has child prototypes. */
#define PROTO_VARARG    0x02  /* Vararg function. */
#define PROTO_FFI   0x04  /* Uses BC_KCDATA for FFI datatypes. */
#define PROTO_NOJIT   0x08  /* JIT disabled for this function. */
#define PROTO_ILOOP   0x10  /* Patched bytecode with ILOOP etc. */

第一位proto_child定义是否是一个子函数,即闭包

第二位proto_vararg 函数是否返回多个值

第三位 proto_ffi 是否使用了扩展

第四位proto_nojit标志是否禁用了jit模式

第五位 proto_iloop标志是否有iloop循环指令
参数个数: 函数有几个参数
Frame大小: 使用栈帧的大小
upvalue个数: 使用外部函数中变量的个数
复杂常量个数:
数值常量个数:
指令个数:
调试信息大小(STRIP=0): 后面调试信息占用字节的大小
起始行(STRIP=0): 原型的在文件中的起始行
行数(STRIP=0): 原型占用的总行数
2、原型体
指令: 原型的字节码指令,每条指令占四个字节,默认对齐时,第一个字节为opcode,

个数为原型头中的指令个数
Upvalues: upvalue,uint16,个数为原型头中指定的个数
**复杂常量:**保存了多种类型的常量,定义如下:

cpp 复制代码
typedef struct {
uleb128 tp;
MSize constant_type = uleb128_value(tp);
if (constant_type >= BCDUMP_KGC_STR) {
int32 len = constant_type - BCDUMP_KGC_STR;
char str[len]
} else if (constant_type == BCDUMP_KGC_TAB) {
Table t;
} else if (constant_type != BCDUMP_KGC_CHILD) {
TNumber num;
if constant_type == BCDUMP_KGC_COMPLEX:
            Tnumber num;
} else {
prototype val = prototypes.pop();
}
}ComplexConstant

第一个uleb128表示这个复杂常量的类型,如下:

cpp 复制代码
enum {
BCDUMP_KGC_CHILD = 0,
BCDUMP_KGC_TAB = 1,
BCDUMP_KGC_I64 = 2,
BCDUMP_KGC_U64 = 3,
BCDUMP_KGC_COMPLEX = 4,
BCDUMP_KGC_STR = 5
};

主要包括了字符串,数值,table 和 child (prototype自身)

Table定义如下:

cpp 复制代码
typedef struct {
uleb128 array_items_count;
uleb128 hash_items_count;
local int32 array_items_count_ = uleb128_value(array_items_count);
local int32 hash_items_count_ = uleb128_value(hash_items_count);
while (array_items_count_-- > 0) {
ArrayItem array_item;
}
while (hash_items_count_-- > 0) {
HashItem hash_item;
}
} Table;

HashItem定义如下:

cpp 复制代码
typedef struct {
ComplexConstant key;
ComplexConstant value;
} HashItem;

**数值常量:**保存数值类型的常量,可以表示整数和浮点数,定义如下:

cpp 复制代码
typedef struct {
uleb128_33 lo;
if (lo.val[0] & 0x1)
uleb128 hi;
} NumericConstant;

**调试信息(STRIP=0):**包括三个部分,定义如下:

cpp 复制代码
typedef struct{
if (debuginfo_size > 0) {
LineInfo lineinfo(lines_count, instructions_count);
if (upvalues_count > 0)
UpValueNames upvalue_names(upvalues_count);
VarInfos varinfos;
}
} DebugInfo

Lineinfo记录了每条指令所在的行,upvalue_names记录了upvalue的字符串信息,varinfos记录了每个变量的字符串,定义如下:

cpp 复制代码
typedef struct(uchar tp) {
local uchar tp_ = tp;
if (tp >= VARNAME__MAX) {
string str;
} else {
VARNAME_TYPE vartype;
}
if (tp != VARNAME_END) {
uleb128 start_addr;
uleb128 end_addr;
}
} VarInfo;

Varinfo记录了变量的类型,以及变量作用域的起始行和结束行

相关推荐
时光话9 小时前
Lua 第9部分 闭包
开发语言·lua
时光话9 小时前
Lua 第7部分 输入输出
开发语言·lua
Hy行者勇哥2 天前
使用Postman调测“获取IAM用户Token”接口实际操作
测试工具·lua·postman
加油,旭杏4 天前
【Lua语言】Lua语言快速入门
开发语言·lua
徐同保4 天前
fetch使用put请求提交文件,postman使用put请求提交文件
测试工具·lua·postman
码到成功>_<7 天前
postman使用技巧
测试工具·lua·postman
King.6248 天前
SQL2API 核心理念:如何重构数据服务交付范式
大数据·开发语言·数据库·人工智能·sql·lua
巨龙之路9 天前
Lua中的元表
java·开发语言·lua
weixin_4284984910 天前
在Fortran程序中嵌入Lua解释器
lua·hpc
hi星尘10 天前
Redis与Lua原子操作深度解析及案例分析
redis·lua