vla

铮铭6 小时前
人工智能·具身智能·vla
开源!π0.6-MEM 机器人长时记忆架构完整实现——基于 Physical Intelligence 最新论文的工程落地GitHub 地址:https://github.com/hzm8341/pi0.6参考论文:MEM: Multi-Scale Embodied Memory for Vision Language Action Models,Physical Intelligence,2026年3月
是Yu欸7 天前
机器人·大模型·华为snap·gitcode·昇腾·vla
【CANN】Pi0机器人大模型 × 昇腾A2 测评版权声明:本文为原创,遵循 CC 4.0 BY-SA 协议。转载请注明出处。Pi0机器人VLA大模型测评
传说故事9 天前
论文阅读·人工智能·具身智能·vla
【论文阅读】See Once, Then Act:基于单次视频演示任务学习的VLA模型本文提出了一种名为ViVLA的机器人策略模型,能让机器人通过看一次人类或其他机器人的示范视频,就能学会从未见过的新操作任务,无需额外训练。
YMWM_22 天前
论文阅读·vla
论文阅读“SimVLA: A Simple VLA Baseline for Robotic Manipulation“摘要Vision-Language-Action (VLA) models have emerged as a promising paradigm for general-purpose robotic manipulation, leveraging large-scale pre-training to achieve strong performance. The field has rapidly evolved with additional spatial priors and divers
一颗小树x23 天前
vla·流匹配·dm0·具身空间推理·空间思维链
《VLA 系列》DM0 | 流匹配 | 具身空间推理增强 | 空间思维链DM0 是一个流匹配系列改进的 VLA 架构,适用于真实的物理机器人中兼顾模型的通用多模态能力和具身动作控制能力,形成 VLM骨干 + 流匹配 动作专家 的端到端架构
BackCatK Chen24 天前
算法·华为·gpu算力·vla·世界模型
2026智驾决赛圈:洗牌、技术决战与3大生死门槛中国智能驾驶(智驾)行业正经历史上最剧烈的洗牌:曾经估值百亿的独角兽停摆、中腰部玩家批量出局,牌桌快速清空。行业形成明确共识:2026年将是决赛圈关闭的最后期限,最终仅2-3家核心供应商能存活,而主机厂自研阵营中,仅蔚来等少数玩家仍在坚守。
一颗小树x1 个月前
具身智能·vla·一站式·dexbotic·vla 开发工具箱
《VLA 系列》Dexbotic | 一站式 | 具身智能 | VLA 开发工具箱Dexbotic 是一个基于 PyTorch 构建的开源 VLA 模型工具,面向具身智能领域的研究者和开发者,提供一站式的 VLA 研究服务。
YMWM_1 个月前
论文阅读·人工智能·vla
论文阅读“DM0: An Embodied-Native Vision-Language-Action Model towards Physical AI“摘要Moving beyond the traditional paradigm of adapting internet-pretrained models to physical tasks, we present DM0, an Embodied-Native Vision-Language-Action (VLA) framework designed for Physical AI.  Unlike approaches that treat physical grounding as a fi
一颗小树x1 个月前
强化学习·训练·vla·π0·π0.5
《VLA 系列》π0 与 π0.5 | 强化学习 训练 | VLA本文分享使用 RLinf 框架对 π₀ 和π₀.₅ 进行强化学习微调。支持PPO和GRPO等强化学习算法。
YMWM_1 个月前
论文阅读·vla
论文阅读“OpenVLA: An Open-Source Vision-Language-Action Model“摘要Large policies pretrained on a combination of Internet-scale vision-language data and diverse robot demonstrations have the potential to change how we teach robots new skills: rather than training new behaviors from scratch, we can fine-tune such vision
一颗小树x1 个月前
vla·流匹配·π0.5·分层推理
《VLA 系列》π0.5 | 流匹配 | 分层推理 | VLAπ0.5基于π0模型升级,采用统一Transformer架构,核心是分层推理、离散+连续动作融合表示,是首个实现开放世界复杂家庭任务泛化的端到端VLA模型。
YMWM_1 个月前
论文阅读·vla
论文阅读“Thinker: A vision-language foundation model for embodied intelligence“摘要When large vision-language models (VLMs) are applied in the field of robotics, they encounter problems that are simple for humans yet error-prone for the models. Such issues include confusion between third-person and first-person perspectives, and a ten
YMWM_1 个月前
论文阅读·vla
论文阅读“Scalable and General Whole-Body Control for Cross-Humanoid Locomotion“摘要Learning-based whole-body controllers have become a key driver for humanoid robots, yet most existing approaches require robot-specific training.   In this paper, we study the problem of cross-embodiment humanoid control and show that a single policy ca
一颗小树x2 个月前
微调·强化学习·vla·流匹配·πrl
【VLA 系列】 πRL | 在线强化学习 | 流匹配 | VLAπRL是一款在线强化学习的VLA框架,适配π0、π0.5等基于流的VLA模型。核心解决 “对数似然计算难” 和 “探索性不足” 两大问题:
一颗小树x2 个月前
强化学习·rl·vla·simplevla-rl
《VLA 系列》SimpleVLA-RL | 端到端 在线强化学习 | VLA本文分析SimpleVLA-RL ,它是一款端到端 在线强化学习 的VLA框架。核心目标*是解决VLA模型面临的两个挑战:
是Yu欸2 个月前
机器人·大模型·昇腾·vla
Pi0机器人VLA大模型在昇腾A2平台上的测评版权声明:本文为原创,遵循 CC 4.0 BY-SA 协议。转载请注明出处。随着人工智能技术的持续神户以及人形机器人产业的快速发展,算力在提升机器人运动控制精度、实时响应能力与智能化水平方面的作用日益凸显。为实现降本增效,国产化算力代替需求不断攀升,本文基于国产化适配的 Pi0机器 VLA大模型,在昇腾 Atlas 800I A2服务器上完成部署与测试,结果表明:该模型在推理性能、推理精度及功能完整性等方面,不仅实现了与英伟达同级别硬件相当的算力表现,更在部分场景下表现出更优的运行效率。
leo03082 个月前
vla·vlm
深入解析 π₀ 与 π₀.5:Physical Intelligence 的机器人基础模型演进本文详细对比分析 Physical Intelligence 公司发布的两代视觉-语言-动作(VLA)模型:π₀ 和 π₀.5,从设计目标、模型架构、训练方法、数据策略等多个维度进行深入解读。
滴啦嘟啦哒2 个月前
深度学习·ros·vla
【机械臂】【LLM】一、接入千问LLM实现自然语言指令解析临近本科毕业,考虑到未来读研的方向以及自己的兴趣方向,我选择的课题大致为“基于VLA结构的指令驱动式机械臂仿真系统的实现”。
传说故事2 个月前
人工智能·深度学习·机器人·具身智能·vla
【论文自动阅读】ActiveVLA: 将主动感知注入VLA模型以实现精准三维机器人操控本文提出了一种名为 ActiveVLA 的新框架,让机器人不再被动地“看”世界,而是能像人一样主动调整视角和焦距,从而在杂乱或有遮挡的环境中精准完成复杂的操作任务。
YMWM_2 个月前
微调·vla·pi0.5
测试 pi0.5 微调模型指南首先,检查训练是否完成以及模型保存位置:训练完成后,检查点会保存在:如果你的数据集有对应的仿真环境,可以使用 lerobot-eval 命令: