强化学习算法复现记录

目录

1.多智能体强化学习

MADDPG tensorflow2版本

文章链接:tensorflow2实现多智能体强化学习算法MADDPG

IMAC tensorflow2版本

文章链接:

2.单智能体强化学习

DQN pytorch版本

文章链接:使用Pytorch实现强化学习------DQN算法

PPO pytorch版本

文章链接:使用pytorch/torchrl和mujoco实现强化学习PPO算法

相关推荐
人工智能研究所3 小时前
字节开源 DeerFlow 2.0——登顶 GitHub Trending 1,让 AI 可做任何事情
人工智能·深度学习·开源·github·ai agent·字节跳动·deerflow2.0
万里鹏程转瞬至3 小时前
为什么早期线性注意力没有成为主流大模型方案?
深度学习·aigc
逻辑君3 小时前
Research in Brain-inspired Computing [9]-球机器人研究【2】
人工智能·深度学习·神经网络·机器人
这张生成的图像能检测吗3 小时前
(论文速读)TDANN:用于轴承故障诊断的三域对抗神经网络
人工智能·深度学习·神经网络·故障诊断
向哆哆3 小时前
人脸眼部特征检测数据集(千张图片已划分、已标注)适用于YOLO系列深度学习分类检测任务
深度学习·yolo·分类
Chasing Aurora4 小时前
Python后端开发之旅(五)——DL
开发语言·pytorch·python·深度学习
我要学好英语5 小时前
概率密度——分布、期望、方差和协方差
深度学习·概率论·概率密度·方差·协方差·期望·分布
放下华子我只抽RuiKe55 小时前
深度学习 - 01 - NLP自然语言处理基础
前端·人工智能·深度学习·神经网络·自然语言处理·矩阵·easyui
AI-Ming5 小时前
程序员转行学习 AI 大模型: 模型微调| 附清晰概念分类
人工智能·pytorch·深度学习·机器学习·chatgpt·nlp·gpt-3
盼小辉丶5 小时前
PyTorch实战(39)——使用Captum解释深度学习模型
pytorch·深度学习·模型解释