Simulations RL 平台学习笔记

1. 选择标准

1.1 开源项目,🌟star数量越多越好

2. 常见平台

2.1 🌟18.6k ML-Agents:基于Unity实现

2.2 🌟1.2k Godot RL Agents

相关推荐
亚里随笔20 小时前
MegaFlow:面向Agent时代的大规模分布式编排系统
人工智能·分布式·llm·rl·agentic
山顶夕景6 天前
【RL】Absolute Zero: Reinforced Self-play Reasoning with Zero Data
大模型·llm·强化学习·rl
X.Cristiano6 天前
VERL源码解读 &实操笔记
rl·verl
亚里随笔17 天前
超越LoRA:参数高效强化学习方法的全面评估与突破
人工智能·深度学习·机器学习·lora·rl
蜡笔小新..18 天前
从零学习 RL :初识强化学习
人工智能·强化学习·rl
缘友一世19 天前
基于GSPO算法实现Qwen3-VL 8B在MathVista数据集上的强化学习实践入门
llm·rl·gspo·rlvr
亚里随笔20 天前
GenEnv:让AI智能体像人一样在_游戏_中成长
人工智能·游戏·llm·rl·agentic
具身智能之心25 天前
让机器人“舞得更好”的全身运控的方案还有哪些进化空间?
rl·vla·3dgs·realsim2real
亚里随笔1 个月前
STAgent:专为时空推理设计的智能代理模型
人工智能·深度学习·机器学习·llm·rl·agentic
iiiiii111 个月前
TD(λ),资格迹(Eligibility Traces)与时序差分学习的统一
人工智能·学习·机器学习·强化学习·rl