技术栈
多智能体强化学习
全栈O-Jay
10 个月前
人工智能
·
深度学习
·
强化学习
·
多智能体强化学习
·
完全合作
一文了解【完全合作关系】下的【多智能体强化学习】
处于完全合作关系的多智能体的利益一致,获得的奖励相同,有共同的目标。比如多个工业机器人协同装配汽车,他们的目标是相同的,都希望把汽车装好。