Simulations RL 平台学习笔记

1. 选择标准

1.1 开源项目,🌟star数量越多越好

2. 常见平台

2.1 🌟18.6k ML-Agents:基于Unity实现

2.2 🌟1.2k Godot RL Agents

相关推荐
xwz小王子8 天前
Science Robotics 丰田研究院提出通过示例引导RL的全身丰富接触操作学习方法
rl
仙人掌_lz4 个月前
深入理解蒙特卡洛树搜索(MCTS):python从零实现
人工智能·python·算法·ai·强化学习·rl·mcts
仙人掌_lz4 个月前
深度理解用于多智能体强化学习的单调价值函数分解QMIX算法:基于python从零实现
python·算法·强化学习·rl·价值函数
仙人掌_lz4 个月前
理解多智能体深度确定性策略梯度MADDPG算法:基于python从零实现
python·算法·强化学习·策略梯度·rl
仙人掌_lz4 个月前
深入理解深度Q网络DQN:基于python从零实现
python·算法·强化学习·dqn·rl
仙人掌_lz4 个月前
为特定领域微调嵌入模型:打造专属的自然语言处理利器
人工智能·ai·自然语言处理·embedding·强化学习·rl·bge
木亦汐丫6 个月前
【大模型系列篇】国产开源大模型DeepSeek-V3技术报告解析
sft·rl·mtp·mla·deepseekmoe·fp8 混合精度训练·dualpipe算法
老A的AI实验室6 个月前
通俗理解Test time Scaling Law、RL Scaling Law和预训练Scaling Law
人工智能·深度学习·算法·chatgpt·llm·agi·rl
、达西先生7 个月前
强化学习笔记6——异同策略、AC、等其他模型总结
强化学习·端到端·rl