关于Rust中的channel
Rust的channel
是一种用于在不同线程间传递信息的通信机制,它实现了线程间的消息传递。
Channel允许在Rust中创建一个消息传递渠道,它返回一个元组结构体,其中包含发送和接收端。发送端用于向通道发送数据,而接收端则用于从通道接收数据。
每个channel
由两部分组成:发送端(Sender
)和接收端(Receiver
)。
发送端用于向channel
发送消息,而接收端则用于接收这些消息。这种机制允许线程之间的安全通信,避免了共享内存的复杂性和潜在的数据竞争问题。 (通过通信来共享内存,而非通过共享内存来通信)
Rust的channel
为线程间通信提供了一种安全、简单的方式,是构建并发应用的基础工具之一。
channel
是Rust标准库的一部分,自Rust 1.0版本以来就包含了这个功能。随着Rust语言和标准库的发展,channel
的实现和API可能会有所改进,但其基本概念和用法保持一致。
使用方式
基本步骤如下:
-
创建 : 使用
std::sync::mpsc::channel()
函数创建一个新的channel
,这个函数返回一个包含发送端(Sender
)和接收端(Receiver
)的元组。 -
发送 : 使用发送端的
send
方法发送消息。send
方法接受一个消息值,如果接收端已经被丢弃,会返回一个错误。 -
接收 : 使用接收端的
recv
方法接收消息。recv
会阻塞当前线程直到一个消息可用,或者channel
被关闭。
示例
以下是一个使用channel
在两个线程间发送和接收消息的简单例子:
rust
use std::sync::mpsc;
use std::thread;
fn main() {
// 创建一个channel
let (tx, rx) = mpsc::channel();
// 创建一个新线程,并向其中发送一个消息
thread::spawn(move || {
let msg = "Hello from the thread";
tx.send(msg).unwrap();
println!("Sent message: {}", msg);
});
// 在主线程中接收消息
let received = rx.recv().unwrap();
println!("Received message: {}", received);
}
上面例子展示了channel
的基本方法:先创建一个channel
,然后在一个新线程中发送一个字符串消息,并在主线程中接收这个消息。
注意: 发送端tx
通过move
关键字移动到新线程中,这是因为Rust的所有权规则要求确保使用数据的线程拥有该数据的所有权。
关于MPSC
其中mpsc是Multi producer, Single consumer FIFO queue
的缩写,即多生产者单消费者先入先出队列
Rust标准库提供的channel是MPSC(多生产者,单消费者)模型,这意味着可以有多个发送端(Sender
)向同一个接收端(Receiver
)发送消息。这种模式非常适用于工作队列模型,其中多个生产者线程生成任务,而单个消费者线程处理这些任务。
除了MPSC之外,还有如下几种模型:
-
SPSC(Single Producer Single Consumer):单生产者单消费者。
-
SPMC(Single Producer Multiple Consumer):单生产者多消费者。
-
MPSC(Multi Producer Single Consumer):多生产者单消费者, Rust中标准的mpsc模型。
-
MPMC(Multi Producer Multi Consumer)*:多生产者多消费者。
MPSC是标准库中使用的模型
不需要阻塞吗?
主线程是否会立马结束退出程序?
在上面的示例中,如果主线程执行得太快,有可能在接收到 子线程发送消息之前就结束了,没打印出接收到的内容程序就退出了.
但事实上,并没有发生这种现象. 即便在新进程段添加休眠3s的代码,thread::sleep(std::time::Duration::from_secs(3));
, 程序也不会提早退出.
关于Rust中程序的休眠,可参考Rust中程序休眠的几种方式
这是因为,recv
方法是阻塞的,即 它会阻塞当前线程, 直到从通道中接收到消息。
因此,在上面例子中,主线程在调用rx.recv().unwrap()
时会阻塞 等待消息的到来。一旦子线程通过tx.send(msg).unwrap();
发送了消息,主线程会接收到这个消息并继续执行,之后程序才会正常退出。
探索更多阻塞方式
可以使用join
方法,来确保主线程等待一个或多个子线程完成执行。这在处理多个线程时特别有用。
rust
use std::sync::mpsc;
use std::thread;
fn main() {
let (tx, rx) = mpsc::channel();
// 创建一个新线程,并保存其句柄
let handle = thread::spawn(move || {
let msg = "Hello from the thread";
tx.send(msg).unwrap();
println!("Sent message: {}", msg);
});
// 在主线程中接收消息
let received = rx.recv().unwrap();
println!("Received message: {}", received);
// 使用join等待子线程完成
handle.join().unwrap();
}
thread::spawn
返回一个JoinHandle
,通过调用这个句柄的join
方法来确保主线程在子线程完成其执行之后才继续执行
但是因为recv方法
本身就是阻塞的,已经确保了主线程会等待至少一个消息的到来,这时再使用join
看起来没有太大必要。
但当有多个线程执行独立任务,且这些任务不一定涉及到主线程立即需要的通道通信时,join的作用就变得非常明显了, 如下示例展示了如何创建多个线程,并使用join
确保它们都完成了工作:
rust
use std::thread;
use std::time::Duration;
fn main() {
// 创建一个向量来存储子线程的句柄
let mut handles = vec![];
for i in 0..10 {
// 创建10个子线程
let handle = thread::spawn(move || {
println!("Thread {} is starting", i);
println!("--------------");
// 模拟工作负载,耗时1s
thread::sleep(Duration::from_secs(1));
println!("Thread {} has finished", i);
println!("~~~~~~~~~~~~~~");
});
handles.push(handle);
}
// 等待所有子线程完成
for handle in handles {
handle.join().unwrap();
}
println!("All threads have finished");
}
输出:
shell
Thread 0 is starting
--------------
Thread 1 is starting
--------------
Thread 3 is starting
--------------
Thread 2 is starting
--------------
Thread 4 is starting
--------------
Thread 5 is starting
--------------
Thread 6 is starting
--------------
Thread 7 is starting
--------------
Thread 9 is starting
--------------
Thread 8 is starting
-------------- (到此都是立刻打印出来; 下面的输出等1s后一股脑打印出来)
Thread 0 has finished
~~~~~~~~~~~~~~
Thread 1 has finished
Thread 2 has finished
Thread 5 has finished
~~~~~~~~~~~~~~
~~~~~~~~~~~~~~
Thread 4 has finished
~~~~~~~~~~~~~~
Thread 6 has finished
~~~~~~~~~~~~~~
Thread 3 has finished
~~~~~~~~~~~~~~
~~~~~~~~~~~~~~
Thread 7 has finished
~~~~~~~~~~~~~~
Thread 8 has finished
~~~~~~~~~~~~~~
Thread 9 has finished
~~~~~~~~~~~~~~
All threads have finished
在这个例子中创建了10个子线程,每个子线程都模拟执行一些操作,然后在主线程中使用一个循环来join
这些线程。
通过这种方式,即使这些子线程并没有向主线程发送任何消息,仍然能够确保它们都完成了各自的工作,然后程序才会退出。这就是join
在处理多个线程时的优势所在。
使用join
确保主线程等待所有子线程完成其任务,这在处理并行计算、执行多个独立任务时特别重要,因为这些任务可能不会立即或根本不会向主线程报告其完成状态。在这种情况下,如果没有使用join
,主线程可能会在子线程完成它们的工作之前结束,导致程序提前退出,而且可能留下未完成的后台工作。
Rust channel的更多高阶用法
Rust中的channel不仅仅支持简单的消息传递,还可以用于实现更复杂的并发模式和高级用法。这些用法可以增加程序的灵活性和性能,特别是在处理大量数据、多线程任务或需要高度并行的场景中。
选择性接收(Select)
在处理多个channel时,可能希望能够选择性地接收多个来源的消息。
Rust的标准库目前并没有直接支持select机制,但是crossbeam-channel
库提供了这样的功能,使得可以从多个channel中选择性地接收消息。
rust
use crossbeam_channel::{select, unbounded};
use std::thread;
fn main() {
let (tx1, rx1) = unbounded();
let (tx2, rx2) = unbounded();
thread::spawn(move || {
tx1.send(1).unwrap();
});
thread::spawn(move || {
tx2.send(2).unwrap();
});
select! {
recv(rx1) -> msg => println!("Received {} from rx1", msg.unwrap()),
recv(rx2) -> msg => println!("Received {} from rx2", msg.unwrap()),
}
}
cargo add crossbeam_channel
添加依赖库,
而后多次 cargo run
, 可以发现,会在Received 1 from rx1
和和Received 2 from rx2
中随机打印其中一个
如上代码演示了如何在Rust中使用crossbeam-channel
库实现选择性接收(select)机制。该机制允许程序从多个不同的channel中接收消息,而不是被限制在单一的channel上等待。这是通过select!
宏来实现的,它可以监听多个channel,并在任一channel接收到消息时立即响应。
具体来说,代码的功能如下:
-
引入库 :首先,引入了
crossbeam_channel
的select
和unbounded
,以及std::thread
。crossbeam_channel
是一个提供了高性能channel实现的外部库,包括了select机制。unbounded
用于创建一个无界(unbounded)的channel,即没有容量限制的channel。 -
创建无界channel :通过调用
unbounded()
函数,创建了两个无界channel,分别是tx1/rx1
和tx2/rx2
。这里,tx1
和tx2
是发送端(Sender
),而rx1
和rx2
是接收端(Receiver
)。 -
发送消息 :接下来,创建了两个线程,每个线程向各自的channel发送一个整数消息,第一个线程通过
tx1
发送1
,第二个线程通过tx2
发送2
。这两个线程是并行执行的,因此发送操作是异步的。 -
选择性接收消息 :
select!
宏用于同时监听rx1
和rx2
这两个接收端。当任一channel接收到消息时,select!
宏会立即匹配到相应的分支并执行。这里有两个recv
调用,分别对应两个接收端。一旦任一接收端接收到消息,对应的代码块就会执行,并打印出接收到的消息及其来源。msg.unwrap()
用于获取Result
类型中的消息值,前提是没有发生错误。
代码中的select!
宏使得程序不必在单一的channel上阻塞等待,而是可以灵活地处理来自多个源的消息。这种模式在需要处理多个异步事件源时非常有用,例如在网络服务器或并发系统中处理来自不同客户端或任务的输入。
有点类似Go的select语句
迭代器接收
Receiver
实现了Iterator
,这意味着可以使用迭代器的方式接收所有可用的消息,直到channel被关闭。这种方式简化了接收端的代码,特别是当需要处理所有消息而不必关心接收的具体时机时。
rust
use std::sync::mpsc;
use std::thread;
fn main() {
let (tx, rx) = mpsc::channel();
thread::spawn(move || {
for i in 1..=5 {
tx.send(i).unwrap();
}
});
// 通过迭代器接收消息
for received in rx {
println!("Received: {}", received);
}
}
输出:
rust
Received: 1
Received: 2
Received: 3
Received: 4
Received: 5