技术栈

π0.5

一颗小树x
15 天前
强化学习·训练·vla·π0·π0.5
《VLA 系列》π0 与 π0.5 | 强化学习 训练 | VLA本文分享使用 RLinf 框架对 π₀ 和π₀.₅ 进行强化学习微调。支持PPO和GRPO等强化学习算法。
一颗小树x
19 天前
vla·流匹配·π0.5·分层推理
《VLA 系列》π0.5 | 流匹配 | 分层推理 | VLAπ0.5基于π0模型升级,采用统一Transformer架构,核心是分层推理、离散+连续动作融合表示,是首个实现开放世界复杂家庭任务泛化的端到端VLA模型。
self-motivation
22 天前
pytorch·yolo·tensorrt·π0.5·jetson thor
在jetson thor上高效部署π0.5和yolo模型有2种方法:其中方法2的难点是如何将tensorrt engine与pytorch流程结合起来, 如使用pytorch + action DIT engine或者使用pytorch + llm tensorrt engine + action DIT engine
我是有底线的