你有没有想过 undefined
、true
和其他核心 JavaScript 对象从何而来?这些对象是任何用户定义的对象的原子,需要首先存在。V8 称它们为不可移动的不可变根,它们生活在自己的堆中------只读堆。由于它们经常被使用,因此快速访问至关重要。还有什么比在编译时正确猜测他们的内存地址更快的呢?
例如,考虑极其常见的 IsUndefined
API 函数。如果我们可以简单地检查一个对象的指针是否以 0x61
结尾,而不是查找 undefined
对象的地址以供参考,那会怎样?这正是 V8 的静态根功能所实现的。这篇文章探讨了我们实现此目标所必须克服的障碍。该功能已经登陆 Chrome 111 并为整个虚拟机带来了性能优势,特别是加速了 C++ 代码和内置函数的执行。
引导只读堆
创建只读对象需要一些时间,因此 V8 会在编译时创建它们。要编译 V8,首先编译一个名为 mksnapshot
的最小原型 V8 二进制文件。它创建所有共享的只读对象以及内置函数的本机代码,并将它们写入快照。然后,编译实际的 V8 二进制文件并将其与快照捆绑在一起。为了启动 V8,快照被加载到内存中,我们可以立即开始使用它的内容。下图显示了独立 d8
二进制文件的简化生成过程。
一旦 d8
启动并运行,所有只读对象在内存中都有固定的位置,并且永远不会移动。当我们 JIT(Just-In-Time)代码时,例如,我们可以直接引用undefined
代码。但是,在构建快照和编译 libv8 的 C++ 时,地址尚不清楚。它取决于构建时未知的两件事:首先是只读堆的二进制布局,其次是只读堆在内存空间中的位置。
如何预测地址?
V8 使用指针压缩。我们不是完整的 64 位地址,而是以 32 位偏移量将对象引用到 4GB 内存区域。对于许多操作(如属性加载或比较),唯一标识对象只需要 32 位偏移到该笼中即可。因此,我们的第二个问题------不知道只读堆在内存空间中的什么位置------实际上并不是一个问题。我们只需将只读堆放在每个指针压缩笼的开头,从而为其提供已知位置。例如,对于 V8 堆中的所有对象,undefined
始终具有最小的压缩地址,从 0x61 字节开始。这就是我们如何知道,如果任何 JS 对象的完整地址的低 32 位是0x61,那么它一定是undefined
。
这已经很有用了,但我们希望能够在快照和 libv8 中使用这个地址------一个看似循环的问题。但是,如果我们确保 mksnapshot
确定性地创建一个完全相同的只读堆,那么我们可以在构建之间重用这些地址。为了在 libv8 中使用它们,我们基本上构建了两次 V8:
第一次调用mksnapshot时,唯一生成的产物是一个文件,其中包含只读堆中每个对象相对于cage基址的地址。在构建的第二阶段,我们再次编译 libv8,并有一个标志确保每当我们引用 undefined
时,我们实际上使用 cage_base + StaticRoot::kUndefined
;当然,会在 static-roots.h 文件中定义undefined
的静态偏移量。在许多情况下,这将允许创建 libv8 的 C++ 编译器和 mksnapshot
中的内置编译器创建更高效的代码,因为另一种方法是始终从根对象的全局数组加载地址。我们最终得到一个 d8
二进制文件,其中 undefined
的压缩地址被硬编码为0x61
。
好吧,从传统上讲,这就是一切的运作方式,但实际上我们只构建一次 V8------不是没有人有时间做这件事。生成的 static-roots.h 文件缓存在源存储库中,并且只有在我们更改只读堆的分布时才需要重新创建。
未来应用
说到实用性,静态根可以实现更多的优化。例如,我们已经将公共对象分组在一起,允许我们实现一些操作作为对其地址的范围检查。例如,所有字符串映射(即描述不同字符串类型布局的隐藏类(hidden-class)元对象)都是彼此相邻的,因此,如果对象的映射具有介0xdd
和 0x49d
之间的压缩地址,则该对象是字符串。或者,真实对象必须具有至少0xc1
的地址。
并非一切都与 V8 中 JITed 代码的性能有关。正如这个项目所展示的,对 C++ 代码进行相对较小的更改也会产生重大影响。例如,Speedometer 2 是一个执行 V8 API 以及 V8 与其嵌入器之间交互的基准测试,由于静态根,它在 M1 CPU 上的得分提高了约 1%。