强化学习算法复现记录

目录

1.多智能体强化学习

MADDPG tensorflow2版本

文章链接:tensorflow2实现多智能体强化学习算法MADDPG

IMAC tensorflow2版本

文章链接:

2.单智能体强化学习

DQN pytorch版本

文章链接:使用Pytorch实现强化学习------DQN算法

PPO pytorch版本

文章链接:使用pytorch/torchrl和mujoco实现强化学习PPO算法

相关推荐
牧歌悠悠3 小时前
【深度学习】Unet的基础介绍
人工智能·深度学习·u-net
Archie_IT4 小时前
DeepSeek R1/V3满血版——在线体验与API调用
人工智能·深度学习·ai·自然语言处理
大数据追光猿4 小时前
Python应用算法之贪心算法理解和实践
大数据·开发语言·人工智能·python·深度学习·算法·贪心算法
Watermelo6176 小时前
从DeepSeek大爆发看AI革命困局:大模型如何突破算力囚笼与信任危机?
人工智能·深度学习·神经网络·机器学习·ai·语言模型·自然语言处理
Donvink6 小时前
【DeepSeek-R1背后的技术】系列九:MLA(Multi-Head Latent Attention,多头潜在注意力)
人工智能·深度学习·语言模型·transformer
计算机软件程序设计7 小时前
深度学习在图像识别中的应用-以花卉分类系统为例
人工智能·深度学习·分类
終不似少年遊*10 小时前
词向量与词嵌入
人工智能·深度学习·nlp·机器翻译·词嵌入
夏莉莉iy12 小时前
[MDM 2024]Spatial-Temporal Large Language Model for Traffic Prediction
人工智能·笔记·深度学习·机器学习·语言模型·自然语言处理·transformer
pchmi13 小时前
CNN常用卷积核
深度学习·神经网络·机器学习·cnn·c#
deflag13 小时前
第P10周-Pytorch实现车牌号识别
人工智能·pytorch·yolo