Multi-Agent Routing Value Iteration Network(多智能体路由值迭代网络)论文阅读

标题:Multi-Agent Routing Value Iteration Network(多智能体路由值迭代网络)

作者:Quinlan Sykora, Mengye Ren, Raquel Urtasun

单位: Uber

发表期刊:AI

发表时间:2020年

论文研究主题归类:强化学习多智能体应用

1.论文解决什么问题

本文研究了多个agent协同路由问题。传统的方法通常不是为包含稀疏连接图和未知流量的真实环境而设计的,并且在运行时速度太慢而不实用。相比之下,我们提出了一个基于图神经网络的模型,该模型能够在稀疏连通图中,在动态变化的交通条件下进行基于学习值迭代的多智能体路由。此外,学习的通信模块使agent能够在线协调并更有效地适应变化。

2.是否有公开的数据集及源代码

数据集:未公开

源代码:https://github.com/uber-research/MARVIN

3.论文的主要观点

作者认为传统的多智能体方法方法通常不是为包含稀疏连接图和未知流量的真实环境而设计的,并且在运行时速度太慢而不实用。

相关推荐
星马梦缘9 小时前
计算机网络6 第六章 应用层——解决“怎么发请求、怎么回响应”的问题(邮件整体传输流程)
网络·计算机网络·域名·ftp·dns·dhcp
@CLoudbays_Martin119 小时前
为什么动态视频业务内容不可以被CDN静态缓存?
java·运维·服务器·javascript·网络·python·php
沉默媛9 小时前
【论文阅读】InnerGS: Internal Scenes Rendering via Factorized 3D Gaussian Splatting
论文阅读·3dgs·内部精细结果重建
zzzyzh10 小时前
RL【3】:Bellman Optimality Equation
强化学习
东哥说-MES|从入门到精通11 小时前
Mazak MTF 2025制造未来参观总结
大数据·网络·人工智能·制造·智能制造·数字化
sheepwjl11 小时前
《嵌入式硬件(三):串口通信》
网络·嵌入式硬件·网络协议·串口通信
Jayyih11 小时前
嵌入式系统学习DAY28(网络编程)
网络·学习·tcp/ip
dbdr090112 小时前
Linux 入门到精通,真的不用背命令!零基础小白靠「场景化学习法」,3 个月拿下运维 offer,第二十六天
linux·运维·服务器·网络·python·学习
日更嵌入式的打工仔13 小时前
PHY的自适应协商简析
网络·嵌入式硬件·自适应·phy
XXYBMOOO14 小时前
Qt UDP 通信类详解与实现
开发语言·网络·c++·qt·网络协议·ui·udp