repr(C):解决FFI的内存布局差异

这是在开发网关插件的时候遇到的一个问题,场景如下:

  • 插件使用Rust编写,编译为.so动态库
  • 网关加载这个动态库,执行插件逻辑
  • 当新版本的网关加载旧版本的插件后执行插件时,插件内部获取到错误的值,或者程序直接崩溃的情况。

其中插件定义如下:

rust 复制代码
#[async_trait]
pub trait Plugin: Send + Sync {
    /// 插件名称
    fn name(&self) -> &str;
    /// 插件信息
    fn info(&self) -> PluginInfo;
    /// 执行插件
    async fn execute(&self, context: &HttpContext, config: &Value) -> Result<Value, PluginError>;
}

后来在检查插件参数时,发现网关处传入的参数和旧版本插件的接收参数顺序不一致或字段个数不一致,会导致插件内部拿到不正确的值。当传入参数定义和接收参数不一致时,会导致崩溃。

其根本原因是:由于传递了一个引用,使得网关和插件访问的是同一个内存地址,然而由于插件编译为cdylib,其内存布局和Rust的不一致,导致在访问变量时,获取到了错误的值,或者访问了非法内存导致程序崩溃(在字段类型不一致时发生)。

Rust在编译结构体时,可能会对字段进行重新排序以及对齐等优化,导致实际的内存布局可能不兼容C风格的布局。因此和外部库交互(也就是FFI)时可能会发生不可预测的行为。

对于网关插件这个场景,要避免这个问题,有以下两种做法:

  • 修改插件参数为可序列化的,如JSON、Protobuf等。
  • 强制结构体使用C兼容的内存布局。

由于插件可能调用多次,需要保证高性能的执行,序列化/反序列化对性能影响较大,且部分字段可能无法序列化,因此只能使用第二种方式。

使用#[repr(C)]便可以兼容C布局。它的主要作用如下:

  • 保证 C 兼容的内存布局:确保 Rust 结构体按照 C 语言的标准进行内存排列。
  • 防止编译器优化重排:阻止 Rust 编译器对字段顺序进行优化调整。

按照Rust官方的说法,#[repr(C)]就是做C语言能做的事。字段的顺序、大小和对齐方式完全符合C或C++的预期。任何通过FFI的类型都应具有#[repr(C)]

除了repr(C)外,常见的还有这几个:

  • repr(transparent):让包装类型与被包装类型的内存布局完全相同,要求包装结构体必须有且仅有一个非零大小的字段。
  • repr(u*) / repr(i*):主要用在枚举上,指定枚举的类型和范围,并保持和C一致的内存布局。Rust默认的枚举类型是isize,指定类型后可少占用点空间。这个只能用于无字段类型的枚举。
相关推荐
微小冷1 天前
Rust异步编程详解
开发语言·rust·async·await·异步编程·tokio
鸿乃江边鸟1 天前
Spark Datafusion Comet 向量化Rust Native--CometShuffleExchangeExec怎么控制读写
大数据·rust·spark·native
明飞19872 天前
tauri
rust
咚为2 天前
Rust tokio:Task ≠ Thread:Tokio 调度模型中的“假并发”与真实代价
开发语言·后端·rust
天天进步20152 天前
Motia性能进阶与未来:从现有源码推测 Rust 重构之路
开发语言·重构·rust
Hello.Reader3 天前
Rocket 0.5 响应体系Responder、流式输出、WebSocket 与 uri! 类型安全 URI
websocket·网络协议·安全·rust·rocket
FreeBuf_3 天前
黑客利用React Native CLI漏洞(CVE-2025-11953)在公开披露前部署Rust恶意软件
react native·react.js·rust
鸿乃江边鸟3 天前
Spark Datafusion Comet 向量化Rust Native--Native算子(CometNativeExec)怎么串联执行
大数据·rust·spark·native
mit6.8243 天前
[]try catch no | result yes
rust
Ivanqhz3 天前
向量化计算
开发语言·c++·后端·算法·支持向量机·rust