具身智能

AIminminHu21 小时前
人工智能·具身智能
(AI篇)OpenGL渲染与几何内核那点事-(二-1-(12):给AI一副“身体”有多难?从“缸中之脑”到R2-D2,一文看透具身智能60年进化血泪史@[TOC]((AI篇)OpenGL渲染与几何内核那点事-(二-1-(12):给AI一副“身体”有多难?从“缸中之脑”到R2-D2,一文看透具身智能60年进化血泪史)
传说故事1 天前
论文阅读·人工智能·机器人·具身智能
【论文阅读】通过homeostasis RL学习合成综合机器人行为1.题目: Synthesising integrated robot behaviour through reinforcement learning for homeostasis 2.时间: 2024.06 3.机构: Kyoto University, The University of Tokyo 4.3个英文关键词: Homeostasis, Deep Reinforcement Learning, Embodied Neural Homeostat
Robot_Nav2 天前
机器人·具身智能·vla·wbc
机器人全身控制(WBC)深度技术综述:从经典理论到VLA前沿全身控制(Whole-Body Control, WBC)是一种面向高自由度机器人的统一任务导向反馈控制方法,其核心在于同时协调机器人所有关节与接触点,以满足多重物理约束并执行多项具有优先级差异的任务。WBC 被 IEEE 列为重点研究方向,覆盖全身位/力控制、模型基动力学控制、质心动量调控及多接触力分配等主题。本文从数学基础(零空间投影、层级优化)、经典求解方法(封闭式 vs. 优化式、ID-WBC/PB-WBC/QP-WBC)、与 MPC/TO 的系统对比、开源框架(OpenSoT、legged_co
Godspeed Zhao2 天前
人工智能·机器学习·深度相机·具身智能
具身智能中的传感器技术36——RGB-D相机1RGB-D相机是具身智能机器人的关键感知设备,其选型需重点关注深度精度、分辨率、填充率、最小盲区和帧率等核心指标。结构光适合精细操作,ToF适用于远距离导航,主动双目则在抗干扰性上表现突出。实际应用中需注意厂家标称数据与实际场景的差异,透明物体识别难题,以及多机干扰问题。不同技术路线各具优势,应根据具体应用场景选择合适的相机类型。
lovep13 天前
机器人·具身智能·vla·rt-1
VLA系列RT-1: Robotics Transformer for Real-World Control 论文阅读和理解验证上述问题的难点:如何解决:贡献点:这里有一个值得思考的地方:text token其实根据token-prune相关的paper中会发现占比是很重要的,也就是当遇到这种类似场景时,text-token比视觉token更重要,会不会带来vla泛化性能有问题使得模型更关注指令而非视觉?
Godspeed Zhao3 天前
人工智能·科技·数码相机·具身智能
具身智能中的传感器技术35——RGB-D相机0摘要:RGB-D相机是具身智能机器人的核心传感器,通过RGB彩色图像和深度信息实现3D感知。主流技术包括:1)结构光技术,基于几何三角测量,近距离精度高但抗光性差,适用于精细操作;2)ToF技术,通过测量光飞行时间实现中远距离探测,抗干扰强但精度一般,适合避障应用;3)主动双目技术,结合双目视差和主动投影,环境适应性强但计算量大,常用作机器人主摄像头。三种技术各具优势,需根据机器人应用场景(精细操作、避障导航或环境感知)选择合适方案。
传说故事5 天前
论文阅读·人工智能·具身智能
【论文阅读】DreamDojo: A Generalist Robot World Model from Large-Scale Human VideosNVIDIA搞了一个叫DreamDojo的“机器人模拟器”,它通过看几万小时人类第一人称视频学会了物理常识和动作逻辑,能让机器人在脑子里“做梦”预演未来,从而学会各种没见过的复杂动作。
s1ckrain6 天前
论文阅读·多模态·具身智能
【论文阅读】AstraNav-Memory: Contexts Compression for Long MemoryMotivation具身智能正从单次任务执行向终身多任务学习演进。类人导航的核心特征:在未知环境中具备渐进式推理与探索的能力
具身新纪元6 天前
机器人·具身智能
首个具身智能“顶配全家桶”开源:一站式解决具身智能模型训练与评估近日,具身智能创业公司**智平方(AI² Robotics)联合港科大(广州)**熊辉团队,正式开源了具身智能模型社区 AlphaBrain Platform。
北京盟通科技官方账号6 天前
人工智能·机器人·具身智能·虚拟调试·agv安全·工业产线·现场工程师
拒绝返工,应对挑战:fe.screen-sim 虚拟调试技术深度问答面对日益复杂的自动化项目,虚拟调试(Virtual Commissioning)已成为系统集成商(SI)降本增效的核心。本文将以 QA 形式,解析德国 F.EE 公司的旗舰软件 fe.screen-sim,探讨其如何协助工程师化解现场调试中的各类挑战。
传说故事7 天前
论文阅读·人工智能·具身智能
【论文阅读】Being-H0.7: A Latent World-Action Model from Egocentric Videos在VLA和WAM之间找平衡:用少量latent query在隐空间做"未来推理",既保留VLA的推理效率,又获得WAM的未来感知能力,预训练20万小时第一人称视频后在多个机器人benchmark上SOTA。
传说故事7 天前
论文阅读·具身智能·vla
【论文阅读】Fast-WAM: Do World Action Models Need Test-time Future Imagination?发现WAM的核心价值在于训练时用视频预测任务学习更好的世界表征,而非测试时真的去生成未来视频,因此提出Fast-WAM:训练保留视频co-training,推理跳过未来预测,实现4倍加速且性能不降。
传说故事7 天前
论文阅读·人工智能·具身智能·vla
【论文阅读】StarVLA-α: Reducing Complexity in Vision-Language-Action Systems题目:时间: 2026.04机构: HKUST, XJTU, CUHK, THU, Tongyi Lab Alibaba Group, SmartMore Ltd.
传说故事7 天前
论文阅读·人工智能·机器人·具身智能
【论文阅读】RADAR:通过语义规划与自主因果环境重置的闭环机器人数据生成作者造了一个叫RADAR的“全自动机器人数据工厂”,它只需要人演示几次,就能自己给自己出题、自己干活、自己判断干得对不对,甚至干完活后还能自己把桌子收拾好(环境重置),从而不知疲倦地自动生产海量训练数据。
传说故事8 天前
论文阅读·人工智能·强化学习·具身智能
【论文阅读】ViVa: A Video-Generative Value Model for Robot Reinforcement Learning1.题目: ViVa: A Video-Generative Value Model for Robot Reinforcement Learning 2.时间: 2026.04 3.机构: GigaAI, Sichuan University, Tsinghua University 4.3个英文关键词: Video-Generative Model, Value Estimation, Robotic Reinforcement Learning
SCBAiotAigc8 天前
人工智能·具身智能·yolo26
2026.4.21:在做yolo26分类任务时出现save_dir一直是个固定的一个值的避坑技巧
传说故事8 天前
论文阅读·人工智能·具身智能
【论文阅读】RoboCodeX: Multimodal Code Generation for Robotic Behavior Synthesis1.题目: RoboCodeX: Multimodal Code Generation for Robotic Behavior Synthesis 2.时间: 2024.02 3.机构: The University of Hong Kong, OpenGVLab, Shanghai AI Laboratory, ETH Zurich, Shanghai Jiao Tong University, The Chinese University of Hong Kong, Tsinghua Univers
深兰科技8 天前
人工智能·erlang·laravel·具身智能·智能机器人·深兰科技·深兰智养
深兰科技×南京同仁堂达成合作,深兰智养落地:AI+中医探索四高肥胖非药物健康管理新路径2026年4月,深兰人工智能科技(上海)股份有限公司与百年国药品牌南京同仁堂达成合作,共同推出深兰智养——面向高血压、高血糖、高血脂、高尿酸及肥胖人群的AI+中医垂直健康管理平台。双方将围绕慢病管理与健康干预场景,结合传统中医经验与人工智能技术,探索非药物健康管理的标准化与规模化应用路径。
WWZZ202513 天前
人工智能·算法·机器人·深度强化学习·具身智能·四足·人形
Sim2Sim理论与实践3:深度强化学习目录1 强化学习的核心框架——马尔可夫决策过程MDP(1)理论框架(2)性质(3)定义2 方法论2.1 动态规划DP