vla

YMWM_2 天前
论文阅读·vla
论文阅读“SimVLA: A Simple VLA Baseline for Robotic Manipulation“摘要Vision-Language-Action (VLA) models have emerged as a promising paradigm for general-purpose robotic manipulation, leveraging large-scale pre-training to achieve strong performance. The field has rapidly evolved with additional spatial priors and divers
一颗小树x3 天前
vla·流匹配·dm0·具身空间推理·空间思维链
《VLA 系列》DM0 | 流匹配 | 具身空间推理增强 | 空间思维链DM0 是一个流匹配系列改进的 VLA 架构,适用于真实的物理机器人中兼顾模型的通用多模态能力和具身动作控制能力,形成 VLM骨干 + 流匹配 动作专家 的端到端架构
BackCatK Chen4 天前
算法·华为·gpu算力·vla·世界模型
2026智驾决赛圈:洗牌、技术决战与3大生死门槛中国智能驾驶(智驾)行业正经历史上最剧烈的洗牌:曾经估值百亿的独角兽停摆、中腰部玩家批量出局,牌桌快速清空。行业形成明确共识:2026年将是决赛圈关闭的最后期限,最终仅2-3家核心供应商能存活,而主机厂自研阵营中,仅蔚来等少数玩家仍在坚守。
一颗小树x7 天前
具身智能·vla·一站式·dexbotic·vla 开发工具箱
《VLA 系列》Dexbotic | 一站式 | 具身智能 | VLA 开发工具箱Dexbotic 是一个基于 PyTorch 构建的开源 VLA 模型工具,面向具身智能领域的研究者和开发者,提供一站式的 VLA 研究服务。
YMWM_10 天前
论文阅读·人工智能·vla
论文阅读“DM0: An Embodied-Native Vision-Language-Action Model towards Physical AI“摘要Moving beyond the traditional paradigm of adapting internet-pretrained models to physical tasks, we present DM0, an Embodied-Native Vision-Language-Action (VLA) framework designed for Physical AI.  Unlike approaches that treat physical grounding as a fi
一颗小树x10 天前
强化学习·训练·vla·π0·π0.5
《VLA 系列》π0 与 π0.5 | 强化学习 训练 | VLA本文分享使用 RLinf 框架对 π₀ 和π₀.₅ 进行强化学习微调。支持PPO和GRPO等强化学习算法。
YMWM_12 天前
论文阅读·vla
论文阅读“OpenVLA: An Open-Source Vision-Language-Action Model“摘要Large policies pretrained on a combination of Internet-scale vision-language data and diverse robot demonstrations have the potential to change how we teach robots new skills: rather than training new behaviors from scratch, we can fine-tune such vision
一颗小树x14 天前
vla·流匹配·π0.5·分层推理
《VLA 系列》π0.5 | 流匹配 | 分层推理 | VLAπ0.5基于π0模型升级,采用统一Transformer架构,核心是分层推理、离散+连续动作融合表示,是首个实现开放世界复杂家庭任务泛化的端到端VLA模型。
YMWM_18 天前
论文阅读·vla
论文阅读“Thinker: A vision-language foundation model for embodied intelligence“摘要When large vision-language models (VLMs) are applied in the field of robotics, they encounter problems that are simple for humans yet error-prone for the models. Such issues include confusion between third-person and first-person perspectives, and a ten
YMWM_18 天前
论文阅读·vla
论文阅读“Scalable and General Whole-Body Control for Cross-Humanoid Locomotion“摘要Learning-based whole-body controllers have become a key driver for humanoid robots, yet most existing approaches require robot-specific training.   In this paper, we study the problem of cross-embodiment humanoid control and show that a single policy ca
一颗小树x23 天前
微调·强化学习·vla·流匹配·πrl
【VLA 系列】 πRL | 在线强化学习 | 流匹配 | VLAπRL是一款在线强化学习的VLA框架,适配π0、π0.5等基于流的VLA模型。核心解决 “对数似然计算难” 和 “探索性不足” 两大问题:
一颗小树x24 天前
强化学习·rl·vla·simplevla-rl
《VLA 系列》SimpleVLA-RL | 端到端 在线强化学习 | VLA本文分析SimpleVLA-RL ,它是一款端到端 在线强化学习 的VLA框架。核心目标*是解决VLA模型面临的两个挑战:
是Yu欸25 天前
机器人·大模型·昇腾·vla
Pi0机器人VLA大模型在昇腾A2平台上的测评版权声明:本文为原创,遵循 CC 4.0 BY-SA 协议。转载请注明出处。随着人工智能技术的持续神户以及人形机器人产业的快速发展,算力在提升机器人运动控制精度、实时响应能力与智能化水平方面的作用日益凸显。为实现降本增效,国产化算力代替需求不断攀升,本文基于国产化适配的 Pi0机器 VLA大模型,在昇腾 Atlas 800I A2服务器上完成部署与测试,结果表明:该模型在推理性能、推理精度及功能完整性等方面,不仅实现了与英伟达同级别硬件相当的算力表现,更在部分场景下表现出更优的运行效率。
leo03081 个月前
vla·vlm
深入解析 π₀ 与 π₀.5:Physical Intelligence 的机器人基础模型演进本文详细对比分析 Physical Intelligence 公司发布的两代视觉-语言-动作(VLA)模型:π₀ 和 π₀.5,从设计目标、模型架构、训练方法、数据策略等多个维度进行深入解读。
滴啦嘟啦哒1 个月前
深度学习·ros·vla
【机械臂】【LLM】一、接入千问LLM实现自然语言指令解析临近本科毕业,考虑到未来读研的方向以及自己的兴趣方向,我选择的课题大致为“基于VLA结构的指令驱动式机械臂仿真系统的实现”。
传说故事1 个月前
人工智能·深度学习·机器人·具身智能·vla
【论文自动阅读】ActiveVLA: 将主动感知注入VLA模型以实现精准三维机器人操控本文提出了一种名为 ActiveVLA 的新框架,让机器人不再被动地“看”世界,而是能像人一样主动调整视角和焦距,从而在杂乱或有遮挡的环境中精准完成复杂的操作任务。
YMWM_1 个月前
微调·vla·pi0.5
测试 pi0.5 微调模型指南首先,检查训练是否完成以及模型保存位置:训练完成后,检查点会保存在:如果你的数据集有对应的仿真环境,可以使用 lerobot-eval 命令:
m0_650108242 个月前
论文阅读·自动驾驶·vla·高效推理·端到端ad·openemma
OpenEMMA:开源多模态端到端自动驾驶框架全解析在自动驾驶技术飞速发展的今天,端到端系统因其能直接从传感器输入学习驾驶动作、实现整体优化的特性,逐渐成为研究热点。然而,现有端到端模型存在资源需求大、泛化能力弱、闭源限制等问题。由德州农工大学、密歇根大学和多伦多大学联合提出的 OpenEMMA 框架,基于多模态大语言模型(MLLMs),以开源、高效、鲁棒为核心优势,为端到端自动驾驶技术的普及与发展提供了全新解决方案。
datamonday2 个月前
人工智能·深度学习·机器人·具身智能·vla
[EAI-037] π0.6* 基于RECAP方法与优势调节的自进化VLA机器人模型论文标题:: a VLA That Learns From Experience 作者/机构:Physical Intelligence (Pi) Team (核心作者包括 Kevin Black, Sergey Levine 等) 发布时间:2025年11月 (arXiv:2511.14759v2) 项目主页:https://pi.website/blog/pistar06 Keywords:VLA, Flow Matching, Offline RL, Advantage Conditioning,
datamonday2 个月前
具身智能·vla·pi0·知识隔离
[EAI-036] 知识隔离VLA模型:阻断梯度干扰实现快速训练、高效推理与强泛化能力论文标题:Knowledge Insulating Vision-Language-Action Models: Train Fast, Run Fast, Generalize Better 作者/机构:Physical Intelligence (Danny Driess, et al.) 发布时间:2025年5月 项目主页:https://pi.website/research/knowledge_insulation keywords:VLA, Flow Matching, Knowledge I