Multi-Agent Routing Value Iteration Network(多智能体路由值迭代网络)论文阅读

标题:Multi-Agent Routing Value Iteration Network(多智能体路由值迭代网络)

作者:Quinlan Sykora, Mengye Ren, Raquel Urtasun

单位: Uber

发表期刊:AI

发表时间:2020年

论文研究主题归类:强化学习多智能体应用

1.论文解决什么问题

本文研究了多个agent协同路由问题。传统的方法通常不是为包含稀疏连接图和未知流量的真实环境而设计的,并且在运行时速度太慢而不实用。相比之下,我们提出了一个基于图神经网络的模型,该模型能够在稀疏连通图中,在动态变化的交通条件下进行基于学习值迭代的多智能体路由。此外,学习的通信模块使agent能够在线协调并更有效地适应变化。

2.是否有公开的数据集及源代码

数据集:未公开

源代码:https://github.com/uber-research/MARVIN

3.论文的主要观点

作者认为传统的多智能体方法方法通常不是为包含稀疏连接图和未知流量的真实环境而设计的,并且在运行时速度太慢而不实用。

相关推荐
可怜的Tom被玩弄于股掌之中2 小时前
sqli-labs靶场通关保姆级教学(Get传输篇)Less-1Less-10
网络·sql·安全·web安全·网络安全
浪前3 小时前
【网络篇】传输层TCP协议的确认应答,超时重传机制
网络·网络协议·tcp/ip
开开心心就好12 小时前
提升办公效率的PDF转图片实用工具
运维·服务器·网络·python·智能手机·pdf·ocr
JAVA学习通13 小时前
[javaEE]网络编程
运维·服务器·网络
钢铁男儿14 小时前
Python 函数装饰器和闭包(闭包)
java·网络·python
alden_ygq15 小时前
/etc/kdump.conf 配置详解
服务器·网络·php
卡戎-caryon15 小时前
【项目实践】boost 搜索引擎
linux·前端·网络·搜索引擎·boost·jieba·cpp-http
JANYI201815 小时前
Linux 常用指令详解
linux·c语言·网络
安生生申17 小时前
MQTT 协议与 HTTP 协议的区别
网络·网络协议·http
我爱C编程18 小时前
基于Qlearning强化学习的电梯群控系统高效调度策略matlab仿真
matlab·强化学习·qlearning·电梯群控