世界模型

RockHopper20253 天前
具身智能·世界模型·具身机械主义·具身认知
闭环与世界模型:具身智能系统中的多对多关系——从“稳定现象”到“可治理机制”的工程解释在具身智能系统的讨论中,“世界模型(world model)”常被赋予某种中心地位:仿佛只要模型足够丰富、足够准确,系统就会自然地表现出稳定、可靠、可预测的智能行为。然而,真实工程现场反复证明:智能行为能否稳定存在,首先取决于闭环机制是否成立,其次才是闭环内部使用了怎样的世界模型。换言之,世界模型并非闭环的先验前提,而更像闭环中的一类“结构化工具”与“约束载体”。
s1ckrain4 天前
论文阅读·具身智能·世界模型
【论文阅读】Motus: A Unified Latent Action World Model摘要研究背景现状: 目前的具身智能系统通常是由多个独立的模型拼凑而成的。问题:这种碎片化方法有两个主要缺陷:
RockHopper20255 天前
人工智能·具身智能·世界模型·具身机械主义·具身认知
为何具身机械主义可以被视为一种工程第一性原则在工程语境中,“第一性原则”并非形而上学意义上的终极公理,也不同于具体技术路线或实现方法。它指的是这样一类原则:
RockHopper20255 天前
分布式·世界模型·amr·具身机械主义·具身认知
AMR “分布式多世界”世界模型的工作原理说明在工业场景中,AMR 系统并不运行在一个“单一、实时一致、全知全能”的世界模型之上。工厂现场的可观测性天然不完备、约束来源多元、决策时标分层,并且存在多主体(车辆、调度器、边缘交通控制、站点设备、业务系统与人)并发行动。由此,AMR 的“世界模型”必须被理解为一种分布式的多世界世界模型:
RockHopper20256 天前
具身智能·世界模型·具身机械主义·具身认知
论隐式世界模型与显式世界模型在具身机械主义语境下的本质区别在智能系统里,“世界模型”常被误解成一个可有可无的内部组件:有的系统做了“模型”,有的系统“端到端”似乎就不需要模型。但在具身机械主义的语境下,这种二分法是站不住的。原因很简单:任何能稳定行动的具身系统,都必须以某种方式将感知—行动闭环中的不确定性压缩为可决策的结构。这意味着:
数据与后端架构提升之路10 天前
数据湖·mlops·vla·流批一体·世界模型·自动驾驶数据闭环·occupancy
2025:把“大模型”写进“数据闭环”——从自动驾驶到具身机器人,我如何用数据与算法做可落地的智能系统关键词:数据湖 / 流批一体 / MLOps / 自动驾驶数据闭环 / Occupancy / VLA / 世界模型 / 小模型本地推理 / 可靠性
RockHopper202510 天前
智能制造·世界模型·isa-95·isa-88
S95xS88智能制造系统的“双世界”世界模型工作原理在S95×S88 智能制造系统中看“双世界(Two-World)世界模型”,最贴切的理解是:用两套不同语义、不同时间尺度、不同责任边界的模型,把同一个制造系统“看成两个世界”,再用一层可治理的映射把它们扣成一个可闭环的“认知系统”。
龙腾亚太12 天前
人工智能·具身智能·智能体·世界模型·智能体培训·具身智能培训
大模型在工业物流领域有哪些应用关键词:人工智能大模型 人工智能培训 大模型培训 具身智能培训 智能体 VLA截至2025年,大模型(Large AI Models)在工业物流领域的应用已从概念验证走向规模化落地,覆盖运输、仓储、供应链协同、园区管理、安全合规等多个环节。以下是其主要应用场景及典型案例:
龙腾亚太14 天前
具身智能·智能体·世界模型·智能体培训·具身智能培训
世界模型可以应用在哪些领域或解决那些问题关键词:人工智能大模型 人工智能培训 大模型培训 具身智能培训 智能体培训 VLA“世界模型”(World Model)是一种旨在对环境动态进行内部建模的人工智能方法,最早由 Jürgen Schmidhuber 等人在 1990 年代提出,并在近年来随着深度学习和强化学习的发展重新受到关注。其核心思想是:智能体通过构建一个关于外部世界的内部表示(即“世界模型”),来预测未来状态、规划行动、甚至在想象中进行试错,从而提升决策效率与泛化能力。
RockHopper202518 天前
人工智能·llm·世界模型·显式模型
一种面向服务LLM应用系统的显式世界模型架构原理在企业级 LLM 应用中,“对话”天然擅长表达意图与生成文本,但不擅长长期一致性维护:对象指代会漂移、状态会被遗忘、约束会被稀释、事实与假设会混杂。对强约束、强状态、需审计的业务流程(如客服工单、运营处置、交付协作、合规审查)而言,系统必须具备一个稳定的“共同现实”载体,使多方协作在时间尺度上保持一致,并能对关键决策提供证据链与追溯能力。
阿杰学AI1 个月前
人工智能·ai·语言模型·aigc·世界模型·world model·sara
AI核心知识39——大语言模型之World Model(简洁且通俗易懂版)世界模型 (World Model) 是通往 AGI (通用人工智能) 的另一块必不可少的拼图,也是目前 AI 界大佬们(特别是 Meta 的首席科学家 Yann LeCun)吵得最凶的话题。
铮铭1 个月前
人工智能·机器人·强化学习·世界模型
扩散模型简介:The Annotated Diffusion ModelIn this blog post, we'll take a deeper look into Denoising Diffusion Probabilistic Models (also known as DDPMs, diffusion models, score-based generative models or simply autoencoders) as researchers have been able to achieve remarkable results with them f
数据与后端架构提升之路1 个月前
人工智能·自动驾驶·世界模型·锚点预测
Map-World:用“填空”与“路径积分”重构自动驾驶规划范式在自动驾驶的“大脑”——规划模块中,始终存在一个核心难题:道路交通的瞬息万变,让同一行驶场景下的未来充满多种合理可能。传统规划方法要么被预设的“锚点轨迹”束缚手脚,要么在筛选最优路径时浪费大量有效信息。而近期引发关注的Map-World方法,用“完形填空”式规划与“路径积分”世界模型的组合拳,打破了这一僵局,为多模态规划带来了颠覆性思路。
铮铭3 个月前
论文阅读·人工智能·机器人·世界模型
【论文阅读】具身竞技场:面向具身智能的全面、统一、演进式评估平台论文题目: Embodied Arena: A Comprehensive, Unified, and Evolving Evaluation Platform for Embodied AI
一颗小树x3 个月前
机器人·世界模型·目标导航·wmnav·vlm融入世界模型
【机器人】WMNav 将VLM融入世界模型 | 零样本目标导航 | IROS‘25WMNav 是一种将VLM融入世界模型(World Model) 的目标导航框架,支持零样本。设计一种预测环境状态的记忆策略,采用在线好奇心价值图来量化存储,目标在世界模型预测的各种场景中出现的可能性。
陈敬雷-充电了么-CEO兼CTO4 个月前
人工智能·chatgpt·大模型·多模态·世界模型·kimi·deepseek
视频理解新纪元!VideoChat双模架构突破视频对话瓶颈,开启多模态交互智能时代注:此文章内容均节选自充电了么创始人,CEO兼CTO陈敬雷老师的新书《GPT多模态大模型与AI Agent智能体》(跟我一起学人工智能)【陈敬雷编著】【清华大学出版社】
scott1985124 个月前
扩散模型·生成式·世界模型
GSFix3Dpaper来源GSFix3D: Diffusion-Guided Repair of Novel Views in Gaussian Splatting
scott1985124 个月前
人工智能·计算机视觉·生成式·世界模型
世界模型的典型框架与分类人类和动物智能的一个重要方面是我们对世界的内部模型。我们使用这个模型来预测我们的行为将如何影响我们的环境,预测未来的事件,并计划复杂的行动序列以实现目标。当前大多数机器学习研究都集中在被动理解数据的模型上,例如图像分类器或字幕模型。然而,为了创建能够真正与环境互动而不仅仅是观测环境的人工智能系统,我们需要有效的世界模型来了解行为如何影响环境。
xwz小王子5 个月前
机器人·世界模型
Nature Machine Intelligence 面向机器人操作有效滑移控制的仿生轨迹模块在机器人灵巧操作领域,物体滑移控制是确保任务可靠性和稳定性的核心挑战之一。传统方法主要依赖夹持力调节,但在夹持力已达极限或操作易碎物体时,其性能往往受限。此外,现有滑移控制策略多基于反应式机制,依赖实时触觉反馈,难以应对动态环境中的快速扰动和非线性交互。受人类手部运动策略的启发,提出了一种数据驱动的“Bioinspired Predictive Slip Control (BPSC)”框架,通过融合神经网络预测与模型预测控制(MPC),实现机器人轨迹调制的主动滑移抑制。该框架创新性地引入动作条件触觉前向模
一颗小树x6 个月前
人工智能·机器人·世界模型·aether
【机器人】复现 Aether 世界模型 | 几何感知统一 ICCV 2025Aether 是几何感知统一的世界模型,来自ICCV 2025,该框架具有三大核心功能:(1) 4D动态重建,(2) 动作条件视频预测, (3) 目标条件视觉规划。