repr(C):解决FFI的内存布局差异

这是在开发网关插件的时候遇到的一个问题,场景如下:

  • 插件使用Rust编写,编译为.so动态库
  • 网关加载这个动态库,执行插件逻辑
  • 当新版本的网关加载旧版本的插件后执行插件时,插件内部获取到错误的值,或者程序直接崩溃的情况。

其中插件定义如下:

rust 复制代码
#[async_trait]
pub trait Plugin: Send + Sync {
    /// 插件名称
    fn name(&self) -> &str;
    /// 插件信息
    fn info(&self) -> PluginInfo;
    /// 执行插件
    async fn execute(&self, context: &HttpContext, config: &Value) -> Result<Value, PluginError>;
}

后来在检查插件参数时,发现网关处传入的参数和旧版本插件的接收参数顺序不一致或字段个数不一致,会导致插件内部拿到不正确的值。当传入参数定义和接收参数不一致时,会导致崩溃。

其根本原因是:由于传递了一个引用,使得网关和插件访问的是同一个内存地址,然而由于插件编译为cdylib,其内存布局和Rust的不一致,导致在访问变量时,获取到了错误的值,或者访问了非法内存导致程序崩溃(在字段类型不一致时发生)。

Rust在编译结构体时,可能会对字段进行重新排序以及对齐等优化,导致实际的内存布局可能不兼容C风格的布局。因此和外部库交互(也就是FFI)时可能会发生不可预测的行为。

对于网关插件这个场景,要避免这个问题,有以下两种做法:

  • 修改插件参数为可序列化的,如JSON、Protobuf等。
  • 强制结构体使用C兼容的内存布局。

由于插件可能调用多次,需要保证高性能的执行,序列化/反序列化对性能影响较大,且部分字段可能无法序列化,因此只能使用第二种方式。

使用#[repr(C)]便可以兼容C布局。它的主要作用如下:

  • 保证 C 兼容的内存布局:确保 Rust 结构体按照 C 语言的标准进行内存排列。
  • 防止编译器优化重排:阻止 Rust 编译器对字段顺序进行优化调整。

按照Rust官方的说法,#[repr(C)]就是做C语言能做的事。字段的顺序、大小和对齐方式完全符合C或C++的预期。任何通过FFI的类型都应具有#[repr(C)]

除了repr(C)外,常见的还有这几个:

  • repr(transparent):让包装类型与被包装类型的内存布局完全相同,要求包装结构体必须有且仅有一个非零大小的字段。
  • repr(u*) / repr(i*):主要用在枚举上,指定枚举的类型和范围,并保持和C一致的内存布局。Rust默认的枚举类型是isize,指定类型后可少占用点空间。这个只能用于无字段类型的枚举。
相关推荐
doiito15 小时前
【Agent Harness】Gliding Horse 设计细节 -- 不跟风开发自己的AI Agent
架构·rust·agent
doiito17 小时前
【Agent Harness】Gliding Horse 核心设计理念,不跟风开发自己的AI Agent
ai·rust·架构设计·系统设计·ai agent
花褪残红青杏小1 天前
Rust图像处理第6节- 均值模糊 & 中值模糊:3×3 邻域的两种经典玩法
rust·webassembly·图形学
子兮曰1 天前
前端工具链的「Rust 化」:一场没有赢家的军备竞赛?
前端·后端·rust
星栈1 天前
写 Dioxus Demo 不难,难的是把它写成项目
前端·rust·前端框架
mCell1 天前
【锐评】桌面端技术营销:别拿跑分当工程判断
前端·rust·electron
武子康2 天前
调查研究-201 Rust 里的 dev build 和 release build:为什么同一份代码性能差这么多?
后端·架构·rust
doiito2 天前
【Agent Harness】Gliding Horse 的 L2 作战地图:让多 Agent 协作从“摸黑”变成“透明”
ai·rust·架构设计·系统设计·ai agent
星栈2 天前
我用 Rust + Dioxus 做了个全栈跨平台笔记应用:再把新建、编辑和交付补上
前端·rust·前端框架
独孤留白3 天前
从C到Rust:基本类型 C 的隐式不确定 vs Rust 的显式确定
rust