ROS 2 的通信快过 UDP 原生性能,关键思路是避开 UDP 协议本身的短板(如丢包、低效拷贝、缓冲受限),而不是真的去修改 UDP 协议。
具体可以从 通信机制、传输层配置、系统内核 三个层面来优化:
通信机制 (软件层):用"零拷贝"和进程内通信
· 零拷贝 (Zero Copy):在进程间传输图像、点云等大数据时,使用共享内存(Shared Memory)直接传递指针。这能避免多次内存复制,大幅降低延迟和 CPU 负载 。
· 进程内通信 (Intra-Process):将相关节点放在同一进程内,同样通过共享指针实现零拷贝,彻底规避网络协议栈的额外开销 。
传输层配置 (中间件层):更换 DDS 或切换协议
· 启用 Large Data Mode:若使用 Fast DDS,可设置 export FASTDDS_BUILTIN_TRANSPORTS=LARGE_DATA。这会让大数据自动走 TCP 或有超时控制的共享内存,避免 UDP 丢包和分片导致的卡顿 。
· 更换 DDS 实现:尝试 Cyclone DDS,它被广泛认为是目前 ROS 2 中性能最出色、延迟最低的开源 DDS 实现之一 。
系统与内核调优 (底层):疏通网络管道
· 增大 UDP 缓冲区:Linux 默认的 UDP 缓冲很小(约 256KB),发送大数据时极易溢出丢包。建议临时调高验证效果:
```bash
sudo sysctl -w net.core.rmem_max=8388608
sudo sysctl -w net.core.rmem_default=8388608
```
此法对图像、点云传输立竿见影 。
终极思路:升级硬件方案
如果你的场景是 MCU 与高性能计算平台 之间的极速通信,建议绕过完整的 ROS 2 协议栈。参考一篇相关硕论,可以 用 Micro-ROS 配合 FreeRTOS,在 MCU 端仅运行极简的 UDP 收发逻辑,以此实现更极致的低延迟 。