π0.5

《VLA 系列》π0 与 π0.5 | 强化学习训练 | VLA本文分享使用 RLinf 框架对 π₀ 和π₀.₅ 进行强化学习微调。支持PPO和GRPO等强化学习算法。

《VLA 系列》π0.5 | 流匹配 | 分层推理 | VLAπ0.5基于π0模型升级，采用统一Transformer架构，核心是分层推理、离散+连续动作融合表示，是首个实现开放世界复杂家庭任务泛化的端到端VLA模型。

self-motivation

在jetson thor上高效部署π0.5和yolo模型有2种方法:其中方法2的难点是如何将tensorrt engine与pytorch流程结合起来，如使用pytorch + action DIT engine或者使用pytorch + llm tensorrt engine + action DIT engine

我是有底线的