2311rust过程宏的示例

原文

Rust2018中的过程宏

Rust2018版本中,我最喜欢的功能是过程宏.在Rust中,过程宏有着悠久而传奇的历史(并继续拥有传奇的未来!)

因为2018年版极大改善了定义和使用它们的体验.

什么是过程宏

过程宏是,在编译时一段语法,生成新语法的函数.Rust2018中的过程宏有三个风格:

1,自Rust1.15以来,#[derive]模式宏一直很稳定,并把#[derive(Debug)]所有优点和易用性也带到了用户定义的特征中,如Serde#[derive(Deserialize)].

2,函数式宏,在2018版中是新的稳定版本,并允许在基于crates.io的库中定义:

rust 复制代码
env!("FOO") 
format_args!("...")

宏.类似macro_rules!宏.

3,我最喜欢的属性宏,也是2018版中的新功能,它允许在Rust函数上提供轻量注解,来编译时语法转换代码.

可在清单中用proc-macro=true指定宏.使用时,Rust编译器会加载过程宏,并在展开调用时执行它.

Cargo可控制过程宏版本,且可像其他Cargo依赖项一样轻松使用它们!

定义过程宏

这三类的定义方式略微不同,在此以属性宏为例.首先,标记Cargo.toml:

rust 复制代码
[lib]
proc-macro = true

然后在src/lib.rs中,可编写宏:

rust 复制代码
extern crate proc_macro;
use proc_macro::TokenStream;
#[proc_macro_attribute]
pub fn hello(attr: TokenStream, item: TokenStream) -> TokenStream {
    //...
}

然后可在tests/smoke.rs中编写单元测试:

rust 复制代码
#[my_crate::hello]
fn wrapped_function() {}
#[test]
fn works() {
    wrapped_function();
}

...就这样!执行cargo test的测试时,Cargo编译过程宏.之后,它编译编译时加载宏的单元测试,执行hello函数并编译生成的语法.

可见过程宏的几个重要属性:

1,输入/输出TokenStream类型

2,编译时可执行任意代码,即几乎不受限!

3,过程宏模块系统整合,即可像其他名字一样导入.

先深入了解其中的一些要点.

宏和模块系统

宏现在与Rust中的模块系统整合.表明导入宏时不再需要笨拙的#[macro_use]属性!不是:

rust 复制代码
#[macro_use]
extern crate log;
fn main() {
    debug!("hello, ");
    info!("world!");
}

你可以如下:

rust 复制代码
use log::info;
fn main() {
    log::debug!("hello, ");
    info!("world!");
}

好处不仅限于!风格的macro_rules宏,因为现在可转换如下代码:

rust 复制代码
#[macro_use]
extern crate serde_derive;
#[derive(Deserialize)]
struct Foo {
    //...
}
//为
use serde::Deserialize;
#[derive(Deserialize)]
struct Foo {
    //...
}

甚至不需要显式依赖Cargo.toml中的serde_derive!,只需要:

rust 复制代码
[dependencies]
serde = { version = '1.0.82', features = ['derive'] }

TokenStream内部

神秘的TokenStream类型,来自编译器提供的proc_macro仓库.

首次添加TokenStream时,只能调用to_string()parse()来回来转换其为从串转换.

Rust2018开始,可直接操作TokenStream中的令牌.

TokenStream"只是"TokenTree上的一个迭代器.Rust中的所有语法都分四类,即TokenTree的四种变体:

1,Ident是如foobar的标识.它还包含如selfsuper的关键字.

2,字面(Literal)包括像1,"foo""b"等内容.所有字面都是表示程序中常量值一个令牌.

3,Punct表示标点符号,而不是分隔符.

.foo.bar字段访问中的Punct令牌.像=>多符标点符号表示为两个Punct标记,一个表示=,一个表示>,Spacing枚举表示=与>相邻.

4,Group"树"项最相关的地方,因为Group代表一个分隔子令牌流.如,(a,b)是以括号作为分隔符Group,内部令牌流a,b.

最小化TokenTree对稳定性至关重要.

稳定RustAST是不可行的,因为那表示不能改变它.(想像假如如果不能添加?符号).

TokenStream过程宏通信,在同时可编译和处理较旧过程宏时,编译器添加新的语言语法.不过,先看看如何从TokenStream中取有用的信息.

解析TokenStream

但,只需要看看syn仓库.

使用syn仓库,可用单行代码解析RustAST:

rust 复制代码
#[proc_macro_attribute]
pub fn hello(attr: TokenStream, item: TokenStream) -> TokenStream {
    let input = syn::parse_macro_input!(item as syn::ItemFn);
    let name = &input.ident;
    let abi = &input.abi;
    //...
}

syn仓库不仅可解析内置语法,且还可轻松地为自己的语法编写递归下降解析器.更多.

生成TokenStream

不仅要以TokenStream作为过程宏的输入,还要生成TokenStream作为输出.一般要求输出是有效的Rust语法,但与输入一样,它只是要构建的令牌列表.

创建TokenStream的唯一方法是通过其FromIterator实现,即必须逐个创建每个令牌并聚集它到TokenStream中.

不过,这很乏味,所以看看synquote兄弟仓库.
quote仓库是Rust的准引用实现,主要提供了一个方便的宏:

rust 复制代码
use quote::quote;
#[proc_macro_attribute]
pub fn hello(attr: TokenStream, item: TokenStream) -> TokenStream {
    let input = syn::parse_macro_input!(item as syn::ItemFn);
    let name = &input.ident;
    //输入函数总是等价于返回`42`,对不?
    let result = quote! {
        fn #name() -> u32 { 42 }
    };
    result.into()
}

quote!这里允许你编写大部分Rust语法,并用#foo环境快速插值变量.

令牌和跨度(Span)

也许Rust2018中过程宏的最大特性是可自定义和使用每个令牌上的Span信息,这样可从过程宏中取得惊人语法错误消息:

rust 复制代码
error: expected `fn`
 --> src/main.rs:3:14
  |
3 | my_annotate!(not_fn foo() {});
  |              ^^^^^^

完全自定义的错误消息:

rust 复制代码
 错误:`导入`方法必须至少`有一个`参数
  --> invalid-imports.rs:12:5
   |
12 |     fn f1();
   |     ^^^^^^^^

Span可看作是原始源文件的指针,一般表示,foo,"Ident令牌来自文件bar.rs,第4行第5列,长度为3个字节".

此信息主要由包含警告和错误消息的编译器诊断使用.

Rust2018中,每个TokenTree都有个与之关联的Span.即,如果把所有输入令牌Span保留到输出中,则即使生成全新语法,编译器的错误消息仍是准确的!

如,如下一个小宏:

rust 复制代码
#[proc_macro]
pub fn make_pub(item: TokenStream) -> TokenStream {
    let result = quote! {
        pub #item
    };
    result.into()
}

按如下调用:

rust 复制代码
my_macro::make_pub! {
    static X: u32 = "foo";
}

是无效的,因为从应该返回u32的函数返回一个,编译器帮助诊断问题为:

rust 复制代码
 `error[E0308]`:`类型`不匹配
 --> src/main.rs:1:37
  |
1 | my_macro::make_pub!(static X: u32 = "foo");
  |                                     ^^^^^ expected u32, found reference
  |
 =注意:期望类型为`"U32"`
 找到类型`'&'staticstr'`
 错误:因为上一个错误而中止

在此可见,尽管正在生成全新语法,但编译器可保留span信息,以继续为编写代码提供针对性的诊断.

生态中的过程宏

syn,quoteproc-macro2是编写过程宏首选库.方便自定义解析器,解析现有语法,创建新语法,使用旧版本Rust等等!

Serde这里SerializeDeserialize继承宏可能是生态中最常用的宏.它们有令人印象深刻的配置量,是小注解但强大的很好示例.

wasm-bindgen项目Rust中,使用属性宏轻松定义接口,并从JS导入接口.
#[wasm_bindgen]轻量注解方便理解传入和传出内容,并删除了大量转换样板.

gobject_gen!GNOME项目的实验性IDL,来在Rust中安全地定义GObject对象,避免手写来与C语言通信,并用Rust写其他GObject实例交互期望的所有胶水.

Rocket框架最近切换到了过程宏,并展示了过程宏的一些最新功能,如自定义诊断,自定义跨度创建等.

相关推荐
QMCY_jason2 小时前
Ubuntu 安装RUST
linux·ubuntu·rust
碳苯6 小时前
【rCore OS 开源操作系统】Rust 枚举与模式匹配
开发语言·人工智能·后端·rust·操作系统·os
zaim19 小时前
计算机的错误计算(一百一十四)
java·c++·python·rust·go·c·多项式
凌云行者18 小时前
使用rust写一个Web服务器——单线程版本
服务器·前端·rust
cyz14100121 小时前
vue3+vite@4+ts+elementplus创建项目详解
开发语言·后端·rust
超人不怕冷1 天前
[rust]多线程通信之通道
rust
逢生博客1 天前
Rust 语言开发 ESP32C3 并在 Wokwi 电子模拟器上运行(esp-hal 非标准库、LCD1602、I2C)
开发语言·后端·嵌入式硬件·rust
Maer091 天前
WSL (Linux)配置 Rust 开发调试环境
linux·运维·rust
白总Server1 天前
CNN+Transformer在自然语言处理中的具体应用
人工智能·神经网络·缓存·自然语言处理·rust·cnn·transformer
凌云行者1 天前
使用rust写一个Web服务器——async-std版本
服务器·前端·rust