技术栈

多智能体强化学习

lxlyhwl
2 个月前
多智能体强化学习·代码框架
【动手学强化学习】番外7-MAPPO应用框架2学习与复现为了在自建环境上使用mappo算法,偶然发现了大佬使用的mappo框架,对其学习理解并复现。(1)搭建基础环境 (2)代码复现及结果展示 (3)代码框架理解
全栈O-Jay
1 年前
人工智能·深度学习·强化学习·多智能体强化学习·完全合作
一文了解【完全合作关系】下的【多智能体强化学习】处于完全合作关系的多智能体的利益一致,获得的奖励相同,有共同的目标。比如多个工业机器人协同装配汽车,他们的目标是相同的,都希望把汽车装好。