EVM-MLIR:以MLIR编写的EVM

1. 引言

EVM_MLIR:

  • 以MLIR编写的EVM。

开源代码实现见:

  • https://github.com/lambdaclass/evm_mlir(Rust)
    • 为使用MLIR和LLVM,将EVM-bytecode,转换为,machine-bytecode。
    • LambdaClass团队在2周内,用5个新员工,借助编译器将VM opcode逻辑编译为原生机器码,实现了约75%的以太坊虚拟机功能,即实现了149个opcodes中的111个。
    • 相比于revm,运行factorial和fibnacci程序,其性能提升了300%到600%。

有很多其它虚拟机会将bytecode编译为原生指令,但奇怪的是,以太坊虚拟机(EVM)的实现并没有做这种编译。LambdaClass在做Cairo Native时(见https://github.com/lambdaclass/cairo_native(Rust + Cairo)),学到了很多MLIR/LLVM的知识(详情见:LambdaClass 2023年5月3日博客 Exciting times at the intersection of Compilers and Applied Cryptography: Cairo and MLIR),为此,开启了EVM-MLIR项目,来实现比revm更快的替代方案。

2. 将MLIR用于EVM

EVM:

  • 为基于栈的虚拟机
  • 所编译的bytecode表示了一组指令,每个指令包含1-byte opcodes 及其参数。
  • Push操作可包含多达32字节的额外数据(即推送到栈上的数据量)

EVM的内存架构包含5大组件:

  • Stack:存储最多1024个256-bit宽整数。每个操作会从Stack上pop操作数,并(或)将结果推送到Stack上。若某程序run out of stack,则该程序终结。
  • Memory:为字节数组。支持按字节随机寻址。用于按顺序存储和访问可变数据。
  • Calldata:为与Memory类似的只读字节数组,作为每笔交易的输入发送。某些操作数支持从calldata拷贝到stack或memory。
  • Storage:为具有256-bit keys和values的字典。对其的修改是持久的,除非交易被revert。
  • Transient Storage:与Storage类似,但其修改会在交易结束时丢弃。

由此可知,EVM的执行模型非常简单。

指令序列上的naive interpreter loop很容易实现,但很难优化。有很多方法可实现bytecode interpreters ,但通过直接将每个操作码翻译成机器指令来消除interpreter开销是非常有效的。唯一的困难是:

  • 需要一个编译器后端以及链接和调用所生成代码的方法。

LambdaClass团队决定利用其在MLIR方面的经验,编写一个库:

  • 将每个操作转换为a sequence of MLIR blocks,每个MLIR block包含了实现每个opcode行为的MLIR操作,
  • 并通过将每个操作码连接到下一个操作码来将其串起来
  • 最后,这个表示可以转换为LLVM IR,并通过LLVM的optimizer传递。

为此:

  • 不仅将每个opcode逻辑转换为了MLIR操作,

还需要转换内存架构:

  • Stack:在开始构建MLIR blocks sequence之前,预分配最大stack size(1024个元素)。当前指针和base指针,均用于维护该stack,并检查overflow或underflow。
  • Memory:在Rust中处理内存分配,扩展为所需的FFI callbacks。
  • Calldata:存储在Rust端,将其作为EVM的输入。
  • Storage/Transient storage:通过syscalls来处理,具有与revm类似的api。

3. EVM-MLIR benchmarks

具体的benchmark代码见:

未来将添加更多复杂的程序。

3.1 以Factorial为例的benchmark

以Factorial为例:

  • 计算第N个阶乘,其中N作为calldata传入。

选择N=1000为例,将该程序循环执行10万次,有:

3.2 以Fibonacci为例的benchmark

以Fibonacci为例:

  • 计算第N个Fibonacci值,其中N作为calldata传入。

选择N=1000为例,将该程序循环执行10万次,有:

4. 未来规划

LambdaClass团队会保留一个骨干团队来完成剩余的功能并继续优化,并专注于其新执行客户端------以ETHereum Rust Execution命名为ethrex------见https://github.com/lambdaclass/ethereum_rust

该新执行客户端的目标是:

  • 在未来两个月内为以太坊生态系统提供一个具有简单、直接代码的替代Rust执行客户端。
  • MLIR EVM准备好后,打算将其整合到ethrex中,作为 dog-fooding effort的一部分。

参考资料

1\] LambdaClass团队2024年6月14日博客 [EVM performance boosts with MLIR](https://blog.lambdaclass.com/evm-performance-boosts-with-mlir/)

相关推荐
渗透测试老鸟-九青4 小时前
面试经验分享 | 成都渗透测试工程师二面面经分享
服务器·经验分享·安全·web安全·面试·职场和发展·区块链
程序猿chen4 小时前
《JVM考古现场(十五):熵火燎原——从量子递归到热寂晶壁的代码涅槃》
java·jvm·git·后端·java-ee·区块链·量子计算
碧海饮冰1 天前
Crypto加密货币生态构成及较有前景的几个crypto项目
区块链
秋说2 天前
【区块链安全 | 第八篇】多签机制及恶意多签
安全·区块链
CryptoPP2 天前
基于WebSocket的金融数据实时推送系统架构设计对接多国金融数据API
websocket·网络协议·金融·系统架构·区块链
浪子小院2 天前
区块链技术之分布式数字身份:构建数字世界的信任基石
区块链
秋说2 天前
【区块链安全 | 第十七篇】类型之引用类型(一)
安全·区块链
网络研究院2 天前
身份验证:区块链如何让用户掌控一切
去中心化·区块链·身份·隐私·技术·验证·数字
尽-欢2 天前
以太坊DApp开发脚手架:Scaffold-ETH 2 详细介绍与搭建教程
react.js·typescript·web3·区块链
区块链蓝海2 天前
Cooker.club:AI虚拟偶像与Web3的奇妙碰撞
人工智能·区块链