强化学习算法复现记录

目录

1.多智能体强化学习

MADDPG tensorflow2版本

文章链接:tensorflow2实现多智能体强化学习算法MADDPG

IMAC tensorflow2版本

文章链接:

2.单智能体强化学习

DQN pytorch版本

文章链接:使用Pytorch实现强化学习------DQN算法

PPO pytorch版本

文章链接:使用pytorch/torchrl和mujoco实现强化学习PPO算法

相关推荐
AI技术控30 分钟前
论文解读:AE-TCN-SA——基于自编码器、TCN 与自注意力机制的锂电池内短路诊断方法
人工智能·python·深度学习·算法·机器学习·自然语言处理
数智工坊2 小时前
具身智能人形机器人:从实验室走向现实的下一代通用智能体
人工智能·深度学习·机器人
keineahnung23452 小时前
PyTorch symbolic_shapes 模組的 is_contiguous 從哪來?── sizes_strides_user 安裝與實作解析
人工智能·pytorch·python·深度学习
大模型推理2 小时前
Nano-vLLM 源码解读 - 7. Continuous Batching
深度学习·自然语言处理·vllm
多年小白3 小时前
芯片/半导体/CPO光模块 深度分析报告
人工智能·深度学习·microsoft·ai
初心未改HD3 小时前
深度学习之损失函数详解
人工智能·深度学习
轻口味3 小时前
HarmonyOS 6.1 全栈实战录 - 09 极光底座:ArkWeb 6.1 性能、安全与视觉插帧全特性深度实战
pytorch·安全·harmonyos
张二娃同学3 小时前
第12篇_深度学习学习路线总结
人工智能·python·深度学习·神经网络·学习
aisifang004 小时前
GPT-Image2:高保真视频生成新突破
人工智能·深度学习