当下的具身智能赛道,已经卷成两大技术流派的拉锯战。
纯 VLA 模型 Physical Intelligence π0.7 擅长举一反三,能适配陌生场景;世界模型派英伟达 DreamZero 主打「预判未来」,可零样本适配新机器人。
但这两种路线各有短板,行业迟迟没有出现能跑通能落地、可规模化的统一方案。
面对行业僵局,具身智能头部企业银河通用创新推出 1.6B 参数的跨本体「隐式世界 - 动作基础模型」LDA-1B。
LDA-1B 走的是自研的 WAM 世界 - 动作融合路线。
目前,该工作成果成功登顶今年仅有 210 篇录用的机器人顶会 RSS,项目成果代码已全面开源。

代码地址:github.com/jiangranlv/...
LDA-1B 模型首次在数据层面实现虚实共融、人机混合、质量参差、有无动作标签的数据统一有效利用。
用不那么学术的话来说,这个模型在业界首次做到了「吃数据的时候不挑食」。
无论是虚拟仿真还是真实拍摄、人类视频还是机器人记录、高清画面还是模糊影像、带标注的教案还是没标注的原始素材,统统可以混在一起训练,并且都能被有效利用。

只需短短 1 个小时的后训练,它就能实现跨具身本体的自适应。
换句话说,它可以快速 "学会" 操控各种不同形态的机器人身体。
过去这些数据源互相水土不服,只能分开处理;现在壁垒被 LDA-1B 打破,数据获取与标注成本大幅降低,AI 能从更广泛、更便宜的来源中学习。
回顾 GPT-2 之于大语言模型的最重要意义,就是打破了高质量标注数据的依赖枷锁,依靠海量异构数据实现持续 Scaling。
反观具身智能,一直受困于数据割裂难题,难以进阶。
现在,LDA-1B 打破该桎梏,解锁了具身智能的「GPT-2 时刻」。
比如精准预判「推动扫帚会带动纸团位移」的物理逻辑,这也是其攻克长程任务、灵巧操作难题的核心关键。
团队在实验过程中,验证了一个行业反直觉结论:
在下游任务微调中加入包含大量失败和不稳定操作的遥操作数据,π0.5 性能下降,LDA-1B 性能反而提升 10%。
不管是曾经被定义为「低质量」的数据,还是那些「不可用」的数据,现在统统都可以被 LDA 吃干榨尽。
整体而言,LDA-1B 完成了模型能力与硬件适配的全域归一,突破单一技术路线、单一机器人本体的能力局限,实现多场景、多硬件、多任务的通用化作业能力。
全链路闭环,开启具身规模化时代
复盘行业两大主流路线的底层缺陷,不难发现,两者的天花板很明显。
纯 VLA 路线无法脱离专家数据掣肘,难以规模化;传统世界模型受像素空间制约,参数扩容无法带来有效增益。
而 LDA-1B 依托 WAM 统一框架,凭借 DINO 结构化表征、四任务协同训练、全量数据分工复用三大核心革新,补齐了具身智能规模化进化的全部条件,构建起可持续自我迭代的底层范式。
不同于行业传统的「数据筛选」模式,LDA-1B 建立的「数据组织」范式,让海量异构数据持续为模型进化赋能,成功复刻大模型的 Scaling 增长逻辑,让机器人真正拥有自主学习、持续进化的通用智能能力。
在产业落地层面,LDA-1B 是银河通用银河星脑全人形通用基础模型体系的关键闭环,它嵌入在「银河星脑(AstraBrain)」的完整技术体系之中:
从「银河星数」所构建的数据基础设施,到跨本体的世界 - 动作基础模型,再到面向真实场景的持续部署与反馈学习闭环,为实体场景规模化落地筑牢技术根基。
依托成熟完备的技术管线,银河通用将工厂工业、家庭起居作为核心落地主战场,针对性打磨适配两类高频刚需场景的通用具身能力。
在工厂场景,模型可适配复杂工业产线环境,完成柔性搬运、精密操作、巡检运维、流程辅助等多元化作业,适配多品类工厂非标化需求,降低产线智能化改造成本,助力工业自动化提质增效。
在家庭场景,可深度适配居家复杂动态环境,覆盖全屋家务打理、老人儿童陪护、居家安全巡检、生活化便民操作等日常需求,打破家庭服务机器人功能单一、环境适配差的行业痛点,真正落地普惠型家庭智能服务。
在此两大核心场景之外,同步延伸至零售等细分领域,形成主次分明、重点突出的落地布局,推动具身智能从实验室演示技术,升级为可落地、可复用、可创造价值的生产力基础设施。
生态层面,银河通用秉持开放共建理念,已开源基于公开数据训练的 LDA-1B 模型版本。
打破行业封闭迭代壁垒,为全球具身智能研究提供通用、高效的技术底座,加速全行业技术跃迁。
从技术模型、数据资源到产业生态,LDA-1B 完成了全维度的全域归一,构建起技术可迭代、数据可循环、产业可落地的完整闭环,牢牢坐稳国内具身智能赛道的技术与估值龙头地位。
技术与产业的双重突破,让这家公司获得了资本市场的高度认可。
截至 2026 年 4 月,银河通用已是国内估值最高的未上市具身智能企业,估值超 200 亿元。
而 LDA-1B 的问世,再度夯实了企业的核心技术壁垒与行业领先的产业价值。
归根结底,LDA-1B 的价值早已超越榜单跑分的浅层竞争。
它解答了具身智能领域最本质的命题:
依托 WAM 世界 - 动作统一框架,机器人是否可以复刻 LLM 的规模化逻辑,从海量异构数据中持续认知世界、迭代进化?
就这个问题,LDA-1B 用自身给出了肯定的答案。
从 GPT 大模型的文本智能,到 LDA-1B 的机器人具身智能,统一建模、全量数据驱动的规模化逻辑一脉相承。
银河通用将这套成熟的 AI 进化范式落地机器人领域,正式拉开了具身智能规模化、通用化、产业化的全新序幕。
One More Thing
去年 3 月,银河通用就率先提出并实践了将 World Model_(世界模型)与 Action Model (动作模型)统一的框架 WAM(World-Action Model)_。
感兴趣的小伙伴可以跳转论文《DyWA: Dynamics-adaptive World Action Model》。
该论文在全球范围内首次对 WAM 的概念进行结构化定义,并在接触动力学复杂的任务实现了成功的验证。
DyWA 创新性引入动态自适应机制,突破了传统操控模型泛化弱、动态适配不足的痛点,为具身智能与非抓取操控研究提供全新思路,学术价值突出。
在产业端,该模型显著提升机器人复杂场景作业能力,降低落地适配成本,有效赋能服务机器人、柔性工业操作等场景,加速通用具身智能技术落地与产业化进程。
欢迎在评论区留下你的想法!
--- 完 ---