Simulations RL 平台学习笔记

1. 选择标准

1.1 开源项目,🌟star数量越多越好

2. 常见平台

2.1 🌟18.6k ML-Agents:基于Unity实现

2.2 🌟1.2k Godot RL Agents

相关推荐
山顶夕景13 天前
【RL-LLM】Self-Rewarding Language Models
llm·强化学习·rl·dpo
山顶夕景13 天前
【RL】ORPO: Monolithic Preference Optimization without Reference Model
大模型·llm·强化学习·rl
山顶夕景21 天前
【RLVR】GRPO中奖励函数的设计逻辑
llm·强化学习·rl·奖励函数·reward
Scc_hy1 个月前
强化学习_Paper_2000_Eligibility Traces for Off-Policy Policy Evaluation
人工智能·深度学习·算法·强化学习·rl
xwz小王子3 个月前
Science Robotics 丰田研究院提出通过示例引导RL的全身丰富接触操作学习方法
rl
仙人掌_lz6 个月前
深入理解蒙特卡洛树搜索(MCTS):python从零实现
人工智能·python·算法·ai·强化学习·rl·mcts
仙人掌_lz6 个月前
深度理解用于多智能体强化学习的单调价值函数分解QMIX算法:基于python从零实现
python·算法·强化学习·rl·价值函数
仙人掌_lz7 个月前
理解多智能体深度确定性策略梯度MADDPG算法:基于python从零实现
python·算法·强化学习·策略梯度·rl
仙人掌_lz7 个月前
深入理解深度Q网络DQN:基于python从零实现
python·算法·强化学习·dqn·rl