具身智能

ROS2——基础6（TF2机器人坐标系管理器、Gazebo）目录1 TF2简介2 TF命令行测试3 静态TF广播4 TF监听机器人系统中有很多坐标系，机器人中心点设为基坐标系base link、雷达所在位置为雷达坐标系laser link、机器人移动里程计累积位置的参考系称为里程计坐标系odom link、里程计有累积误差和飘逸又有绝对位置参考系/地图坐标系map link。TF2在ROS中用于管理机器人的坐标系。

想要成为计算机高手

π*0.6: 从实践中学习 -- 2025.11.17 -- Physical Intelligence (π) -- 未开源It’s amazing what you can learn if you’re not afraid to try.

ROS2——基础4（通信接口、参数说明、分布式通信）目录1 通信接口2 参数说明2.1 定义2.2 param参数指令2.3 创建参数示例3 分布式通信3.1 定义及介绍

快速上手大模型：深度学习12（目标检测、语义分割、序列模型）目录1 目标检测1.1 边界框(Bounding box)1.2 代码1.3 常用算法1.3.1 R-CNN

ROS Bag与导航数据集技术指南ROS Bag是ROS (Robot Operating System)的二进制时序数据格式,用于记录和回放ROS话题(topic)消息流。

PaLM-E：具身智能的多模态语言模型新范式在机器人与具身智能领域，如何让模型实现真实世界的精准感知与决策，一直是科研界的核心挑战。谷歌团队推出的 PaLM-E，首次将大规模语言模型（LLM）与多模态感知能力深度融合，构建出首个通用型具身多模态语言模型，既能完成机器人规划、故障检测等具身任务，又保持了顶尖的视觉 - 语言理解与纯语言能力。

快速上手大模型：深度学习13（文本预处理、语言模型、RNN、GRU、LSTM、seq2seq）目录1 文本预处理1.1 库1.2 读取数据集1.3 词元化1.4 词表2 语言模型2.1 定义2.2 代码

PPO-clip算法在Gymnasium的Pendulum环境实现我在gymnasium的pendulum环境上实现了PPO-clip算法，并通过调节超参数来探索超参数对训练过程与训练结果的作用。

快速上手大模型：深度学习11（数据增强、微调、目标检测）目录1 数据增强（Data Augmentation）1.1 概念1.2 增强方法1.2.1 翻转1.2.2 切割

快速上手大模型：深度学习5（实践：过、欠拟合）目录1 调用库2 生成数据集3 格式转换4 检查数据是否正确生成及转换5 模型训练及测试6 拟合情况6.1正常拟合

快速上手大模型：深度学习10（卷积神经网络2、模型训练实践、批量归一化）（1）减小batch size（最有效）；（2）降低输入分辨率resize；（3）减少模型复杂度 / 层数 / 通道数；

快速上手大模型：深度学习9（池化层、卷积神经网络1）目录1 作用2 代码2.1 最大/平均池化层2.2 填充和步幅2.3 多个通道3 卷积神经网络算法3.1 背景

具身新纪元

AAAI 2026 Oral | 清华SpatialActor：解耦语义与几何的机器人操控新框架精确的空间理解是机器人与物理世界交互的基础。然而，现有方法常面临困境：基于点云的方法因稀疏采样损失细粒度语义；基于图像的方法将语义与几何特征纠缠，在真实世界常见的深度噪声干扰下，其性能会显著下降。此外，这些方法大多关注高层几何结构，忽略了对精确操控至关重要的低层空间线索。为解决这些问题，我们提出 SpatialActor，一个为机器人操控设计的解耦表示框架。SpatialActor 的核心思想是将语义和几何信息彻底分离，并进一步将几何信息分解为高层结构与低层线索。其主要包含两个创新模块：

【学习笔记】Diffusion Policy for Robotics本文档基于我的兴趣与关注，结合扩散模型理论，全面阐述 Diffusion Policy 在机器人领域的应用。文档涵盖理论基础、实践经验、代码实现和前沿研究。

具身智能赋能厨具：Deepoc 如何让烹饪机器人精准贴合需求？清晨七点，厨房中飘散着咖啡的醇香。你对着台面上的白色立方体轻声说道：“今天睡眠不太够，想要一份能提神的早餐。” 无需预设指令，也不用按键操作，这款名为 “食悟” 的机器人随即缓缓启动。它的机械臂精准取出咖啡豆，同时用语音回应：“推荐搭配富含维生素 B 的全麦吐司和煎蛋，是否需要调整？” 这便是搭载 Deepoc 具身模型的厨具机器人的日常场景。深算纪元 Deepoc 厨具机器人外挂板的问世，正悄然重塑我们与厨房的联结，该外挂板可应用于传统厨具机器人生产厂家。从 “机械执行” 到 “具身感知”：智能厨具的

具身机器人是一种不拘于具体物理形态的智能体我们可以从以下几个层面来深入理解为什么“形态”在具身智能中是次要的：具身智能的理论根基是“具身认知”。该理论挑战了传统的“计算机隐喻”（认为大脑就像电脑的CPU，身体只是输入/输出设备）。它认为：

Tokenization的演进：从NLP基石到多模态AI的“通用翻译器”我在近日读论文的过程中不断地注意到tokens这个概念，同时我总是在网络上，各种源码里见到tokenizer这个东西，我觉得挺混淆的。又因为我自己所持的一个学术态度是永远要消除疑惑，所以正好自己有足够的精力支持自己从正在做的事情脱出，在gemini那里问了几嘴，以下为ai辅助的整合的内容：

数据集月度精选 | 高质量具身智能数据集：打开机器人“感知-决策-动作”闭环的钥匙在AI从虚拟世界走向物理世界的过程中，具身智能正成为下一代人工智能的核心方向。然而，当前机器人模型在复杂环境中的泛化能力与适应性，仍受限于高质量、多模态交互数据的稀缺。

快速上手大模型：深度学习7（实践：卷积层）核心是将输入图像X中所有像素与每个输出像素相连，MLP思想。式中表示隐藏层中位置(i,j)处的像素，表示输入图像(k,l)处的像素，

EQ-雪梨蛋花汤

【讨论】VR + 具身智能 + 人形机器人：通往现实世界的智能接口摘要：本文探讨了“VR + 具身智能 + 人形机器人”作为通往现实世界的智能接口的前沿趋势。文章从技术融合、应用场景、商业潜力三个维度分析其价值，涵盖工业协作、教育培训、医疗康复、服务陪护等领域，并展望VR赋能下的人机共生未来，揭示具身智能如何推动机器人真正理解、感知并参与现实世界。