具身智能

几道之旅15 小时前
机器人·具身智能
Isaac Sim 5.1 机器人基本操作Create > Robots > Franka Emika Panda Arm Tools > Physics > Physics Inspector
几道之旅2 天前
机器人·具身智能
Isaac Sim机器人基本操作及关键词汇英中文对照Isaac Sim提供GUI、Extension脚本、Standalone Python三种核心操作方式,覆盖从可视化调试到自动化运行的全场景需求,以下以Franka Emika Panda机械臂为例,详细说明核心操作流程。
datamonday2 天前
人工智能·深度学习·机器人·具身智能·vla
[EAI-037] π0.6* 基于RECAP方法与优势调节的自进化VLA机器人模型论文标题:: a VLA That Learns From Experience 作者/机构:Physical Intelligence (Pi) Team (核心作者包括 Kevin Black, Sergey Levine 等) 发布时间:2025年11月 (arXiv:2511.14759v2) 项目主页:https://pi.website/blog/pistar06 Keywords:VLA, Flow Matching, Offline RL, Advantage Conditioning,
BFT白芙堂2 天前
人工智能·深度学习·算法·机器学习·gpu·具身智能·frankaresearch3
基于 GPU 并行加速的 pRRTC 算法:赋能 Franka 机械臂的高效、稳定运动规划高自由度机械臂(如7 自由度的 Franka Research 3)在执行复杂任务时,运动规划的实时性和一致性是至关重要的。传统的基于采样的运动规划算法(SBMP),如 RRT-Connect,虽然在处理高维空间问题上表现出色,但在复杂受限环境下的计算开销依然巨大 。
datamonday3 天前
具身智能·vla·pi0·知识隔离
[EAI-036] 知识隔离VLA模型:阻断梯度干扰实现快速训练、高效推理与强泛化能力论文标题:Knowledge Insulating Vision-Language-Action Models: Train Fast, Run Fast, Generalize Better 作者/机构:Physical Intelligence (Danny Driess, et al.) 发布时间:2025年5月 项目主页:https://pi.website/research/knowledge_insulation keywords:VLA, Flow Matching, Knowledge I
GitCode官方3 天前
机器人·具身智能·atomgit
具身智能时代,从“白虎”开始:白虎数据集构建通用机器人数据底座当机器人智能逐步从单一动作执行走向复杂任务协作,行业对通用机器人能力的期待不断提高。相比模型结构本身,能够真实反映多本体、多任务、多场景操作的数据,正在成为制约具身智能发展的关键因素。
深蓝学院4 天前
机器人·导航·端到端·具身智能
完全端到端闭环导航!仅需相机,LoGoPlanner实现感知定位规划一体化目录01 把“位置感”塞进策略02 技术亮点Metric-aware visual geometry,把“真实尺度”学进来
传说故事4 天前
深度学习·具身智能
【论文自动阅读】GR-Dexter Technical Report字节跳动提出GR-Dexter框架,通过设计21自由度灵巧手硬件、VR手套遥操作系统,结合多数据源(视觉语言、跨机器人、人类/机器人轨迹)训练VLA模型,实现双灵巧手机器人的语言控制长时操纵与泛化抓取。
RockHopper20255 天前
具身智能·世界模型·具身机械主义·具身认知
闭环与世界模型:具身智能系统中的多对多关系——从“稳定现象”到“可治理机制”的工程解释在具身智能系统的讨论中,“世界模型(world model)”常被赋予某种中心地位:仿佛只要模型足够丰富、足够准确,系统就会自然地表现出稳定、可靠、可预测的智能行为。然而,真实工程现场反复证明:智能行为能否稳定存在,首先取决于闭环机制是否成立,其次才是闭环内部使用了怎样的世界模型。换言之,世界模型并非闭环的先验前提,而更像闭环中的一类“结构化工具”与“约束载体”。
Mr.Winter`5 天前
c++·人工智能·机器人·自动驾驶·ros·路径规划·具身智能
运动规划实战案例 | 基于采样的MPC控制(MPPI)算法(附ROS C++/Python仿真)在机器人控制、自动驾驶和无人机导航等领域,系统往往需要在不确定和动态变化的环境中实现高精度、鲁棒性的轨迹跟踪。传统控制方法如PID控制或基于模型的预测控制(MPC),虽然在许多场景中表现良好,但它们通常依赖于精确的系统模型和梯度信息。当系统模型复杂或存在显著不确定性时,这些方法的性能可能不稳定。此外,传统优化方法在实时性要求高的场景中可能面临计算瓶颈,特别是面对非凸问题难以在有限时间内找到全局最优解。
万俟淋曦6 天前
人工智能·深度学习·机器人·大模型·论文·robotics·具身智能
【论文速递】2025年第50周(Dec-07-13)(Robotics/Embodied AI/LLM)中文使用 googletrans 翻译,翻译不对的地方以英文为准We present Wan-Move, a simple and scalable framework that brings motion control to video generative models. Existing motion-controllable methods typically suffer from coarse control granularity and limited scalability, leav
万俟淋曦6 天前
人工智能·机器学习·机器人·大模型·论文·robotics·具身智能
【论文速递】2025年第47周(Nov-16-22)(Robotics/Embodied AI/LLM)中文使用 googletrans 翻译,翻译不对的地方以英文为准This report introduces Kandinsky 5.0, a family of state-of-the-art foundation models for high-resolution image and 10-second video synthesis. The framework comprises three core line-up of models: Kandinsky 5.0 Image Lite -
s1ckrain6 天前
论文阅读·具身智能·世界模型
【论文阅读】Motus: A Unified Latent Action World Model摘要研究背景现状: 目前的具身智能系统通常是由多个独立的模型拼凑而成的。问题:这种碎片化方法有两个主要缺陷:
万俟淋曦6 天前
人工智能·深度学习·机器人·大模型·论文·robotics·具身智能
【论文速递】2025年第51周(Dec-14-20)(Robotics/Embodied AI/LLM)中文使用 googletrans 翻译,翻译不对的地方以英文为准We present Kling-Omni, a generalist generative framework designed to synthesize high-fidelity videos directly from multimodal visual language inputs. Adopting an end-to-end perspective, Kling-Omni bridges the functional sep
WWZZ20256 天前
人工智能·计算机视觉·机器人·大模型·slam·具身智能
SLAM进阶——数据集目录1 寻找目标领域数据集并下载2 数据集处理及运行2.1 单目2.2.1 图片2.2.2 时间戳2.2.3 相机参数yaml编写
万俟淋曦6 天前
人工智能·深度学习·机器学习·机器人·大模型·论文·具身智能
【论文速递】2025年第49周(Nov-30-Dec-06)(Robotics/Embodied AI/LLM)中文使用 googletrans 翻译,翻译不对的地方以英文为准Large language models (LLMs) have fundamentally transformed automated software development by enabling direct translation of natural language descriptions into functional code, driving commercial adoption through tools like
RockHopper20257 天前
人工智能·具身智能·世界模型·具身机械主义·具身认知
为何具身机械主义可以被视为一种工程第一性原则在工程语境中,“第一性原则”并非形而上学意义上的终极公理,也不同于具体技术路线或实现方法。它指的是这样一类原则:
WWZZ20257 天前
人工智能·大模型·slam·orb·具身智能·特征提取
SLAM进阶——特征提取目录1 现状2 ORB算法2.1 原理2.2 算法2.2.1 FeatureExtraction.hpp
具身智能之心8 天前
机器人·具身智能
Google最新!Gemini Robotics 1.5:通用机器人领域的突破进展Google DeepMind 发布的《Gemini Robotics 1.5.pdf》系统呈现了通用机器人领域的突破性进展,该系列包含Gemini Robotics 1.5(多形态视觉 - 语言 - 动作模型,VLA) 与Gemini Robotics-ER 1.5(顶尖嵌入式推理模型,ER) 两大核心模型。通过 “思考 - 动作融合”“跨形态运动迁移”“嵌入式推理升级” 三大创新,结合 “协调器 + 动作模型” 的智能体架构,实现了机器人 “感知 - 思考 - 行动” 的闭环,为复杂多步骤物理任务解决
几道之旅8 天前
具身智能
Isaac Sim里的hello world按这个来操作,(创建–》环境–》简单房间)至此,咱已是元宇宙里有房的人了。再整个机械臂 最开始我一直纠结这个机械臂是不是往桌子里穿模了,或者飘到天上了。后来我发现,这个初始位置,就是刚好放在桌面上的。所以机械臂和桌子,就暂时不用动了。