技术栈

marl

m0_65010824
1 天前
论文阅读·marl·多智能体系统·网联自动驾驶·意图共享·自适应通讯·端到端协同
IntNet:面向协同自动驾驶的通信驱动多智能体强化学习框架在动态复杂的城市环境中部署网联自动驾驶汽车(CAVs),安全高效的多智能体协同是核心挑战。多智能体强化学习(MARL)虽在多机器人路径规划等领域展现出潜力,但应用于自动驾驶时,面临非平稳性、部分可观测性以及人类驾驶行为不确定性等多重难题。传统协同 MARL 方法仅通过共享编码状态观测来提升协同能力,在安全关键场景中表现不足。
时间里的河
2 年前
算法·强化学习·marl·多智能体·mappo
MAPPO 算法的深度解析与应用和实现说明:PPO 属于 on-policy 的算法,所以被认为它的样本效率比较低。在多智能体的环境下,off-policy的策略被广泛使用。在这项工作中,我们仔细研究了PPO在合作多智能体设置下的性能。我们展示了基于ppo的多智能体算法在四种流行的多智能体测试平台(粒子世界环境、星际争霸多智能体挑战、Google Research Football和Hanabi挑战)中实现了惊人的强大性能,只需要最小的超参数调整,并且没有任何特定领域的算法修改或架构。重要的是,与竞争性的 off-policy 方法相比,PP
我是有底线的