Vitalik 新文丨以太坊可能的未来：The Splurge

撰文：Vitalik Buterin

编译：Yangz，Techub News

以太坊协议设计中有很多「小设计」对以太坊的成功至关重要，但却无法很好地归入一个更大的子类别。在实践中，大约有一半的内容是关于各种 EVM 改进的，其余的则是各种小众话题。本文就将探讨这部分话题。

The Splurge，2023 年路线图

The Splurge 的主要目标：

使 EVM 达到性能稳定的「最终状态」
在协议中引入账户抽象，使所有用户都能从更安全、更便捷的账户中受益
优化交易费用经济学，提高可扩展性，同时降低风险
探索先进的加密技术，使以太坊从长远来看变得更好

改进 EVM

改进 EVM 旨在解决什么问题？

目前的 EVM 难以进行静态分析，因此难以创建高效的实现方法、正式验证代码并随着时间的推移进行进一步扩展。此外，它的效率极低，因此很难实现多种形式的高级加密技术，除非通过预编译明确支持这些技术。

如何改进 EVM？

当前 EVM 改进路线图的第一步是 EVM 对象格式（EOF），计划在下一次硬分叉中引入。EOF 是一系列 EIP，它规定了新版本的 EVM 代码，具有许多显著特点，其中最突出的包括：

代码（可执行，但无法从 EVM 读取）与数据（可读取，但不可执行）分离
禁止动态跳转，只允许静态跳转。
EVM 代码不再遵从与 gas 相关的信息。
新增显式子程序机制。

EOF 代码框架

尽管最终有可能废除旧式合约（甚至可能强制转换为 EOF 代码），但旧式合约将继续存在并可创建。新式合约将受益于 EOF 所带来的效率提升，包括因子程序功能而略微缩小的字节码，以及 EOF 特有的新功能或其特有的 gas 成本缩减。

引入 EOF 后，进一步升级将变得更加容易。目前最完善的是 EVM 模块化算术扩展（EVM-MAX）。EVM-MAX 专门为模块化算术创建了一组新的操作，并将其置于一个新的内存空间，其他操作码无法访问。这样，就可以使用蒙哥马利乘法（Montgomery multiplication）等优化运算。

一种较新的思路是将 EVM-MAX 与单指令多数据（SIMD）功能相结合。从 Greg Colvin 的 EIP-616 开始，SIMD 作为以太坊的一个小设计已经存在了很长时间。SIMD 可用于加速多种形式的加密算法，包括哈希函数、32 位 STARK 和格密码。EVM-MAX 和 SIMD 是对 EVM 性能导向型扩展的天然组合。

组合式 EIP 的大致设计思路是，以 EIP-6690 为起点，然后：

允许任何奇数或任何 2 的幂至(2768)作为模数
为每个 EVMMAX 操作码（add,sub,mul）添加一个版本，该版本不再取 3 个直接值（x/y/z），而是取 7 个直接值（x_start、x_skip、y_start、y_skip、z_start、z_skip、count）。在 Python 代码中，这些操作码将执行相当于以下的操作：

但在实际执行中，这些操作码将被并行处理
有可能的话，可以增加 XOR、AND、OR、NOT 和 SHIFT（循环和非循环），至少对二乘以二的模数来说是这样。此外，还可添加 ISZERO（将输出推入 EVM 主堆栈）

这样就足以实现多种形式的加密算法，包括椭圆曲线加密、小域加密（如 Poseidon、circle STARKs）、传统哈希函数（如 SHA256、KECCAK、BLAKE）和格密码。

当然，其他 EVM 升级也是可能的，但迄今为止，它们受到的关注要少得多。

现有的相关研究

EOF: https://evmobjectformat.org/
EVM-MAX: https://eips.ethereum.org/EIPS/eip-6690
SIMD: https://eips.ethereum.org/EIPS/eip-616

还有哪些工作要做，如何权衡？

目前，EOF 计划被纳入下一个硬分叉。虽然计划总有被移除的可能（此前就有过在最后一刻将计划从硬分叉中移除的情况），但这么做会是一场艰苦的「战斗」。移除 EOF 意味着未来对 EVM 的任何升级都不需要 EOF，这是可以做到的，但可能会更困难。

EVM 的主要权衡在于 L1 的复杂性与基础设施的复杂性。要在 EVM 实现中添加 EOF，需要大量代码，而且静态代码检查也相当复杂。不过，作为交换，我们可以简化高级语言、简化 EVM 实现并获得其他好处。这么说吧，一个优先考虑持续改进以太坊 L1 的路线图将包括并建立在 EOF 的基础上。而其中的一项重要工作是实现类似 EVM-MAX 加 SIMD 的功能，并对各种加密操作需要耗费多少 gas 进行基准测试。

对路线图的其他部分有何影响？

在 L1 调整其 EVM 后，L2 可以更容易地进行复刻。一方调整而另一方不调整，会导致不兼容，而这也有其自身的弊端。此外，EVM-MAX 加上 SIMD 可以降低许多验证系统的 gas 成本，从而提高 L2 的效率。用 EVM 代码取代预编译代码，也许不会对效率造成太大影响，但却能执行相同的任务，从而更容易移除更多的预编译。

账户抽象

账户抽象旨在解决什么问题？

如今，交易只能通过一种方式验证，即 ECDSA 签名。账户抽象的初衷是在此基础上进行扩展，使账户的验证逻辑可以是任意的 EVM 代码。这样就能实现一系列应用，包括：

转用抗量子加密技术
淘汰旧密钥（普遍认为这是一种值得推荐的安全做法）
多签钱包和社交恢复钱包
低价值操作使用一个密钥签名，高价值操作使用另一个密钥（或一组密钥）签名
允许隐私协议在没有中继器的情况下运作，从而大大降低复杂性，并消除关键的核心依赖点

自 2015 年开始对账户进行抽象以来，这些目标已扩展成一大套「便捷目标」，例如一个没有 ETH 但有其他 ERC20 代币的账户可以用这些代币支付 gas 费。下图是这些目标的一个总结：

MPC 指的是多方计算，这是一种已有 40 年历史的技术，可将密钥分割成多个片段存储在多个设备上，并使用加密技术生成签名，而无需直接合并密钥片段。

EIP-7702 是计划在下一次硬分叉中引入的 EIP，也是人们日益认识到有必要让包括 EOA 用户在内的所有用户都能享受到账户抽象带来的便利，从而在短期内改善用户体验，并避免分裂成两个生态的结果。这项工作始于 EIP-3074，并在 EIP-7702 中达到高潮。EIP-7702 使账户抽象的「便捷功能」适用于所有用户，包括现在的 EOA（外部账户，即由 ECDSA 签名控制的账户）。

从图表中我们可以看出，虽然某些挑战（尤其是关于「便捷性」的挑战）可以通过多方计算或 EIP-7702 等增量技术来解决，但促使最初提出账户抽象建议的大部分安全目标只能通过回溯并解决最初的问题来解决，即允许智能合约代码控制交易验证。目前还没有做到这一点是因为安全实现这一目标仍是一项挑战。

账户抽象如何运作？

账户抽象的核心是允许智能合约而不仅仅是 EOA 发起交易，其复杂性来自于如何以有利于维护去中心化网络和抵御拒绝服务攻击的方式实现这一点。

多重验证问题是一大关键挑战：

假设有 1000 个账户，其验证功能都取决于某个单一值 S，而 mempool 中的交易在 S的当前值下都是有效的，那么单个翻转 S 值的交易就会使 mempool 中的所有其他交易失效。这样，攻击者就能以极低的成本向 mempool 发送垃圾邮件，堵塞网络上的节点资源。

多年来，我们一直在努力扩展功能，同时限制 DoS 风险，最终，我们就如何实现「理想的账户抽象」达成了共识，提出了 ERC-4337。

ERC-4337 将用户操作的处理分为两个阶段，即验证和执行。首先处理所有验证，然后处理所有执行。在 mempool 中，只有当用户操作的验证阶段只涉及自己的账户，且不读取环境变量时，该用户操作才会被接受。这可以防止多重验证攻击，也会对验证步骤执行严格的 gas 限制。

ERC-4337 被设计为协议外标准（ERC），因为当时以太坊客户端开发者正忙于合并（the Merge），没有多余的能力开发其他功能。而这也是 ERC-4337 使用用户操作作为对象，而不是常规交易的原因。不过，最近我们意识到，至少有必要在协议中加入 ERC-4337 中提出的部分功能。两个主要原因是：

EntryPoint 作为合约固有的低效率：每捆绑一次操作需要花费约 10 万 gas，而每次用户操作则需要花费数千 gas。
需要确保以太坊属性延续到账户抽象用户。

此外，ERC-4337 还扩展了两个功能：

Paymasters：允许一个账户代表另一个账户支付费用，打破了在验证阶段只能访问发送人账户本身的规则，引入了特殊处理方法，以允许付款人机制并确保其安全。
聚合器：支持签名聚合，如 BLS 聚合或基于 SNARK 的聚合。这对在 Rollup 上实现最高级别的数据效率是必需的。