技术栈
世界模型
七77.
2 天前
3d
·
世界模型
【世界模型】UrbanWorld: An Urban World Model for 3D City Generation
标题:UrbanWorld:一种用于三维城市生成的城市世界模型 原文链接:https://arxiv.org/abs/2407.11965 源码链接:https://github.com/Urban-World/UrbanWorld 发表:预印本(ICLR-2025被拒) https://openreview.net/forum?id=4W1wTg7q9o
机器觉醒时代
7 天前
人工智能
·
具身智能
·
人形机器人
·
世界模型
DreamZero:从语言理解到世界建模——具身智能的WAM新范式
在具身智能的发展进程中,机器人要实现从“语言理解”到“物理交互”的跨越,仍面临泛化能力不足、物理机理建模困难以及跨场景、跨本体迁移性差等核心挑战。以视觉-语言-动作模型(VLA)为代表的主流技术方案,借助预训练视觉-语言模型(VLM)强大的语义先验,在指令跟随与简单物体操作任务上取得了显著进展。然而,其在未知环境下的场景泛化能力,尤其是在新技能学习与运动模式生成方面的适应性,依然存在明显局限。
杀生丸学AI
9 天前
3d
·
aigc
·
扩散模型
·
视觉大模型
·
世界模型
·
点云分割
·
高斯泼溅
【世界模型】WorldWarp:异步视频扩散的3D重建
标题:《WorldWarp: Propagating 3D Geometry with Asynchronous Video Diffusion》 项目:https://hyokong.github.io/worldwarp-page/ 来源:新加坡国立大学 ;香港理工大学
BackCatK Chen
25 天前
算法
·
华为
·
gpu算力
·
vla
·
世界模型
2026智驾决赛圈:洗牌、技术决战与3大生死门槛
中国智能驾驶(智驾)行业正经历史上最剧烈的洗牌:曾经估值百亿的独角兽停摆、中腰部玩家批量出局,牌桌快速清空。行业形成明确共识:2026年将是决赛圈关闭的最后期限,最终仅2-3家核心供应商能存活,而主机厂自研阵营中,仅蔚来等少数玩家仍在坚守。
v_JULY_v
1 个月前
世界模型
·
rise
RISE——组合式世界模型驱动的RL框架:基于视频扩散模型预测的未来视觉状态,和VLA估计的进度价值评估,以先离线预热后在线改进
世界模型一定是2026年的具身领域最热的研究方向之一,为何这么说呢为弥合这一鸿沟,RISE应运而生,一个通过想象进行机器人强化学习的可扩展框架。其核心是一个组合式世界模型,该模型
v_JULY_v
1 个月前
世界模型
·
gigabrain-0.5m
·
gigabrain-0.5
GigaBrain-0.5M*(可对标π∗0.6)——从基于世界模型的RL中学习的VLA:通过“预测的价值和未来状态、经验数据、人工纠正”优化动作策略
今26年2.16是除夕,我司于过去三年完成了在具身领域的奠基回归正题,如果说上一篇文章《GigaBrain-0——通过世界模型GigaWorld增强VLA的泛化能力:基于RGBD输入建模,及通过具身CoT增强推理能力》介绍的GigaBrain-0,可对标π0.5
阿杰学AI
1 个月前
人工智能
·
ai
·
语言模型
·
自然语言处理
·
aigc
·
世界模型
·
世界模型训练师
AI核心知识106—大语言模型之 World Model Trainer(简洁且通俗易懂版)
世界模型训练师 (World Model Trainer) 是 AI 领域中一个极具未来感、正在快速崛起的新兴职业。
要加油哦~
1 个月前
人工智能
·
世界模型
AI-具身智能 | 世界模型 | Code2World 总结
一、介绍Code2World 研究:如何把“代码”映射成一个可交互、可验证、可执行的“世界(World)”,并通过环境反馈反向改进代码生成。
康谋自动驾驶
1 个月前
人工智能
·
3d
·
自动驾驶
·
仿真
·
3dgs
·
世界模型
2026年,3DGS和世界模型,在自动驾驶仿真中的组合应用
2026年,自动驾驶仿真赛道将持续升温。回顾2025年,两大仿真新技术快速走进公众视野,分别是世界模型(World Model)与3DGS(3D Gaussian Splatting,3D高斯泼溅)。
杀生丸学AI
2 个月前
人工智能
·
扩散模型
·
具身智能
·
视频生成
·
世界模型
·
自回归
·
空间智能
【世界模型】AI世界模型的两次物理大考(测评)
如果你让当今最先进的AI视频模型生成一段“冰块落入温水”的视频,你很可能会得到一个画质惊艳、光线完美、动态流畅的短片。它几乎能以假乱真。
杀生丸学AI
2 个月前
人工智能
·
大模型
·
aigc
·
三维重建
·
世界模型
·
逆渲染
【物理重建】PPISP :辐射场重建中光度变化的物理合理补偿与控制
标题:《PPISP: Physically-Plausible Compensation and Control of Photometric Variations in Radiance Field Reconstruction》 项目:https://hyokong.github.io/worldwarp-page/ 来源:NVIDIA
杀生丸学AI
2 个月前
人工智能
·
深度学习
·
3d
·
三维重建
·
世界模型
·
空间智能
·
高斯溅射
【视频生成】SRENDER:基于<稀疏扩散>与<3D渲染>的像机轨迹视频生成
标题:《Efficient Camera-Controlled Video Generation of Static Scenes via Sparse Diffusion and 3D Rendering》 项目:https://ayushtewari.com/projects/srender/ 来源:英国剑桥大学
白云千载尽
2 个月前
算法
·
大模型
·
世界模型
·
自动驾驶仿真
·
navsim
cosmos系列模型的推理使用——cosmos transfer2.5
我们先来使用cosmos transfer2.5来进行基本的功能推理。之前已经用过cosmos-transfer1的功能了,所以对一些基本内容还是比较熟悉了,这次我们主要解决cosmos2上遇到的一些问题。
M宝可梦
2 个月前
人工智能
·
大语言模型
·
世界模型
·
lecun
·
jepa
I-JEPA CVPR2023 LeCun所说的world model和视频生成模型是一回事儿吗
本文分为三大部分,一是对原论文的一些笔记;二是I-JEPA代码的一些记录;三是最后的一点总结;1.图像自监督学习分为invariance- based 方法以及 generative methods;
逐梦苍穹
2 个月前
人工智能
·
世界模型
世界模型通俗讲解:AI大脑里的“物理模拟器“
🍃作者介绍:25届双非本科网络工程专业,阿里云专家博主,深耕 AI 原理 / 应用开发 / 产品设计。前几年深耕Java技术体系,现专注把 AI 能力落地到实际产品与业务场景。 🦅个人主页:@逐梦苍穹 ✈ 您的一键三连,是我创作的最大动力🌹
深蓝学院
2 个月前
机器人
·
点云
·
视觉
·
机器人操作
·
具身智能
·
世界模型
李飞飞团队2026开年首篇工作:一张RGB-D图像让机器人野外零样本全能操作
目录01 从“专属模型”到“通用预测”02 500小时数据+0.1秒推理03 核心设计动作表示:不用关节,用几何
RockHopper2025
2 个月前
具身智能
·
世界模型
·
具身机械主义
·
具身认知
闭环与世界模型:具身智能系统中的多对多关系
——从“稳定现象”到“可治理机制”的工程解释在具身智能系统的讨论中,“世界模型(world model)”常被赋予某种中心地位:仿佛只要模型足够丰富、足够准确,系统就会自然地表现出稳定、可靠、可预测的智能行为。然而,真实工程现场反复证明:智能行为能否稳定存在,首先取决于闭环机制是否成立,其次才是闭环内部使用了怎样的世界模型。换言之,世界模型并非闭环的先验前提,而更像闭环中的一类“结构化工具”与“约束载体”。
s1ckrain
3 个月前
论文阅读
·
具身智能
·
世界模型
【论文阅读】Motus: A Unified Latent Action World Model
摘要研究背景现状: 目前的具身智能系统通常是由多个独立的模型拼凑而成的。问题:这种碎片化方法有两个主要缺陷:
RockHopper2025
3 个月前
人工智能
·
具身智能
·
世界模型
·
具身机械主义
·
具身认知
为何具身机械主义可以被视为一种工程第一性原则
在工程语境中,“第一性原则”并非形而上学意义上的终极公理,也不同于具体技术路线或实现方法。它指的是这样一类原则:
RockHopper2025
3 个月前
分布式
·
世界模型
·
amr
·
具身机械主义
·
具身认知
AMR “分布式多世界”世界模型的工作原理说明
在工业场景中,AMR 系统并不运行在一个“单一、实时一致、全知全能”的世界模型之上。工厂现场的可观测性天然不完备、约束来源多元、决策时标分层,并且存在多主体(车辆、调度器、边缘交通控制、站点设备、业务系统与人)并发行动。由此,AMR 的“世界模型”必须被理解为一种分布式的多世界世界模型: