机器人工程师学习路线详解
机器人与「纯软件 AI」最大的分野,在于是否必须与物理世界 持续交互:传感器读到的噪声、电机与结构的非理想性、接触力与摩擦、实时性与安全------这些都无法只靠调大模型参数解决。杨硕(YY硕)在约十年前的《机器人工程师学习计划》里,把这条主线讲得极透:瓶颈在物理交互,路线是理论与实践交替推进。
2026 年的行业与十年前已大不相同:人形与四足量产叙事、具身智能(VLA/世界模型) 、ROS 2 全面替代 ROS 1、仿真先训再部署 成为常态,开源数据集与 LeRobot 类框架降低了入门门槛,但系统工程复杂度 并未下降。本文在杨硕六年骨架上,按 2026 年技术栈与行业现状 重写一版可执行的学习地图------面向电子/机械/计算机专业学生与转行工程师,偏能动手、能协作、能落地的软件向机器人工程师。
速览
- 不变:物理交互是核心;感知 / 行为 / 数学基础;大一打地基 → 大二嵌入式与比赛 → 大三独立整机 → 大四 ROS 2 与表达 → 研一深耕方向 → 研二输出与带队。
- 2026 更新:ROS 2 Humble/Jazzy;Ubuntu 22.04/24.04;PyTorch + 仿真(MuJoCo/Isaac/Gazebo);具身数据与 VLA;人形/四足生态;仍须 C/C++ 嵌入式与 Linux。
- 定位 :机器人工程师 ≈ 飞机总体设计师------听得懂各模块,能协调攻坚;某一方向达到专精更佳。
目录
一、认知框架
- [1. 机器人学在解决什么问题](#1. 机器人学在解决什么问题)
- [2. 2016 → 2026:什么变了、什么没变](#2. 2016 → 2026:什么变了、什么没变)
- [3. 一页脑图:年级与能力阶段](#3. 一页脑图:年级与能力阶段)
二、六年学习路线(2026 版)
- [4. 大一:工具链、数学与英语](#4. 大一:工具链、数学与英语)
- [5. 大二:嵌入式、动手与竞赛](#5. 大二:嵌入式、动手与竞赛)
- [6. 大三:独立整机与方向启蒙](#6. 大三:独立整机与方向启蒙)
- [7. 大四:ROS 2、仿真与表达](#7. 大四:ROS 2、仿真与表达)
- [8. 研一:方向深耕与仿真闭环](#8. 研一:方向深耕与仿真闭环)
- [9. 研二:系统化、前沿与输出](#9. 研二:系统化、前沿与输出)
三、工程与行业
- [10. 2026 工具栈速查](#10. 2026 工具栈速查)
- [11. 行业动态与方向选择](#11. 行业动态与方向选择)
- [12. 反模式与心态](#12. 反模式与心态)
- [13. 非典型路径](#13. 非典型路径)
- [14. 能力自检表](#14. 能力自检表)
- [15. 按年级行动清单](#15. 按年级行动清单)
1. 机器人学在解决什么问题
1.1 与物理世界交互的三条主线
| 主线 | 内容 | 2026 典型技术 |
|---|---|---|
| 感知 | 传感器 + 处理算法 | 相机/IMU/力觉、标定、融合;学习式感知、深度估计 |
| 行为 | 动力学、控制、操作与移动 | PID/MPC、WBC、轨迹优化;sim-to-real |
| 数学基础 | 估计、几何、优化 | 卡尔曼/因子图、g2o/Ceres、凸优化、李群 SO(3) |
1.2 CMU 四核心领域(仍适用)
| 领域 | 范围 |
|---|---|
| 感知 | 视觉、触觉、力觉、惯导 |
| 认知 | 规划、任务调度、机器学习 / 大模型策略 |
| 行为 | 运动学、动力学、控制、manipulation & locomotion |
| 数学 | 最优估计、微分几何、计算几何、运筹学 |
1.3 工程师定位
在大型机器人项目里,机器人工程师接近总体设计师 :未必在某个子领域待最久,但要能听懂机械、硬件、嵌入式、算法、软件各模块的语言,做接口与排期协调。若能在控制、感知、规划、嵌入式之一达到专业工程师深度,则更有竞争力。
2. 2016 → 2026:什么变了、什么没变
2.1 没变(杨硕论断仍成立)
| 论断 | 2026 含义 |
|---|---|
| 核心是物理交互 | 大模型能写代码、能对话,但拧螺丝、走楼梯、力控装配仍要闭环到真实或高保真仿真 |
| 线代会学很多遍 | SLAM、控制、学习、优化处处是矩阵与几何 |
| 理论 + 实践要交错 | 只看书焊不出整机;只比赛不补数学则上限低 |
| 文档与 BugList 是资产 | BOM、接线表、踩坑记录决定团队效率与个人身价 |
| 表达被严重低估 | README、设计评审、论文/答辩、对外 API 文档 |
2.2 重大变化
| 维度 | ~2016 | 2026 |
|---|---|---|
| 中间件 | ROS 1 + Ubuntu 14.04/16.04 | ROS 2 (Humble LTS / Jazzy LTS )+ Ubuntu 22.04/24.04 |
| 仿真 | Gazebo Classic、Simulink 为主 | MuJoCo (开源)、Isaac Sim/Lab 、Gazebo Harmonic、Drake |
| 学习/策略 | 手工调参、传统 SLAM 为主 | 模仿学习 / RL / VLA;Open X-Embodiment、LeRobot 等数据与框架 |
| 硬件门槛 | 高质量电机与飞控较贵 | 国产四足/人形、廉价激光雷达与深度相机、Jetson Orin 普及;仍烧钱,但入门套件更多 |
| 产业叙事 | 扫地机、无人机、工业臂 | 人形机器人 、仓储 AMR、智驾、具身智能融资与量产并行 |
| 语言栈 | C/C++ 嵌入式 + Python 脚本 | 同上,但 Python 3.10+ 、PyTorch 为算法默认;部分部署仍要 C++/CUDA/TensorRT |
| 通信 | TCP/自定义、部分 ROS | DDS(ROS 2 底层)、CAN-FD、EtherCAT 在车载与工控仍关键 |
2.3 「富人运动」「屠龙之术」如何理解 today
- 富人运动 :整机、人形、多传感器平台仍昂贵;优先蹭实验室、竞赛队、企业开源与云仿真,再考虑自购大件。
- 屠龙之术 :单点炫技(只会调一个 SLAM 包)不等于能交付产品;务必保留可迁移技能(编程、Linux、控制基础、读写能力)。
- 积极面 :2026 年中国在供应链、场景(制造、物流、巡检)与政策上对机器人更友好,国内顶尖实验室与公司的平台资源已不输十年前「必须出国」的单一选项(仍因方向与课题而异)。
3. 一页脑图:年级与能力阶段
| 阶段 | 能力目标 | 2026 关键词 | 避免过早 |
|---|---|---|---|
| 大一 | 工具 + 数学直觉 | Ubuntu、Git、Python、线代、英语 | ROS 2、人形整机 |
| 大二 | 能焊能调小车 | STM32/ESP32、PID、竞赛队、SolidWorks/PCB 入门 | 只刷课不动手 |
| 大三 | 独立做一台完整机器人 | RM/Robocon/自研小车/四足套件、OpenCV 入门 | 只调包不读原理 |
| 大四 | 通用基础设施 | ROS 2、Gazebo/Isaac 入门、旋转表示、毕设/实习 | ros1 新项目 |
| 研一 | 单方向「理论+实现+仿真」 | SLAM/控制/规划/具身之一;g2o、EKF、MLS | 同时开五个方向 |
| 研二 | 课题 + 论文/工程输出 | 前沿论文、带队、演讲、开源 | 重复大二项目 |
#mermaid-svg-roVT1HHHjoV0WPBh{font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}@keyframes edge-animation-frame{from{stroke-dashoffset:0;}}@keyframes dash{to{stroke-dashoffset:0;}}#mermaid-svg-roVT1HHHjoV0WPBh .edge-animation-slow{stroke-dasharray:9,5!important;stroke-dashoffset:900;animation:dash 50s linear infinite;stroke-linecap:round;}#mermaid-svg-roVT1HHHjoV0WPBh .edge-animation-fast{stroke-dasharray:9,5!important;stroke-dashoffset:900;animation:dash 20s linear infinite;stroke-linecap:round;}#mermaid-svg-roVT1HHHjoV0WPBh .error-icon{fill:#552222;}#mermaid-svg-roVT1HHHjoV0WPBh .error-text{fill:#552222;stroke:#552222;}#mermaid-svg-roVT1HHHjoV0WPBh .edge-thickness-normal{stroke-width:1px;}#mermaid-svg-roVT1HHHjoV0WPBh .edge-thickness-thick{stroke-width:3.5px;}#mermaid-svg-roVT1HHHjoV0WPBh .edge-pattern-solid{stroke-dasharray:0;}#mermaid-svg-roVT1HHHjoV0WPBh .edge-thickness-invisible{stroke-width:0;fill:none;}#mermaid-svg-roVT1HHHjoV0WPBh .edge-pattern-dashed{stroke-dasharray:3;}#mermaid-svg-roVT1HHHjoV0WPBh .edge-pattern-dotted{stroke-dasharray:2;}#mermaid-svg-roVT1HHHjoV0WPBh .marker{fill:#333333;stroke:#333333;}#mermaid-svg-roVT1HHHjoV0WPBh .marker.cross{stroke:#333333;}#mermaid-svg-roVT1HHHjoV0WPBh svg{font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;}#mermaid-svg-roVT1HHHjoV0WPBh p{margin:0;}#mermaid-svg-roVT1HHHjoV0WPBh .label{font-family:"trebuchet ms",verdana,arial,sans-serif;color:#333;}#mermaid-svg-roVT1HHHjoV0WPBh .cluster-label text{fill:#333;}#mermaid-svg-roVT1HHHjoV0WPBh .cluster-label span{color:#333;}#mermaid-svg-roVT1HHHjoV0WPBh .cluster-label span p{background-color:transparent;}#mermaid-svg-roVT1HHHjoV0WPBh .label text,#mermaid-svg-roVT1HHHjoV0WPBh span{fill:#333;color:#333;}#mermaid-svg-roVT1HHHjoV0WPBh .node rect,#mermaid-svg-roVT1HHHjoV0WPBh .node circle,#mermaid-svg-roVT1HHHjoV0WPBh .node ellipse,#mermaid-svg-roVT1HHHjoV0WPBh .node polygon,#mermaid-svg-roVT1HHHjoV0WPBh .node path{fill:#ECECFF;stroke:#9370DB;stroke-width:1px;}#mermaid-svg-roVT1HHHjoV0WPBh .rough-node .label text,#mermaid-svg-roVT1HHHjoV0WPBh .node .label text,#mermaid-svg-roVT1HHHjoV0WPBh .image-shape .label,#mermaid-svg-roVT1HHHjoV0WPBh .icon-shape .label{text-anchor:middle;}#mermaid-svg-roVT1HHHjoV0WPBh .node .katex path{fill:#000;stroke:#000;stroke-width:1px;}#mermaid-svg-roVT1HHHjoV0WPBh .rough-node .label,#mermaid-svg-roVT1HHHjoV0WPBh .node .label,#mermaid-svg-roVT1HHHjoV0WPBh .image-shape .label,#mermaid-svg-roVT1HHHjoV0WPBh .icon-shape .label{text-align:center;}#mermaid-svg-roVT1HHHjoV0WPBh .node.clickable{cursor:pointer;}#mermaid-svg-roVT1HHHjoV0WPBh .root .anchor path{fill:#333333!important;stroke-width:0;stroke:#333333;}#mermaid-svg-roVT1HHHjoV0WPBh .arrowheadPath{fill:#333333;}#mermaid-svg-roVT1HHHjoV0WPBh .edgePath .path{stroke:#333333;stroke-width:2.0px;}#mermaid-svg-roVT1HHHjoV0WPBh .flowchart-link{stroke:#333333;fill:none;}#mermaid-svg-roVT1HHHjoV0WPBh .edgeLabel{background-color:rgba(232,232,232, 0.8);text-align:center;}#mermaid-svg-roVT1HHHjoV0WPBh .edgeLabel p{background-color:rgba(232,232,232, 0.8);}#mermaid-svg-roVT1HHHjoV0WPBh .edgeLabel rect{opacity:0.5;background-color:rgba(232,232,232, 0.8);fill:rgba(232,232,232, 0.8);}#mermaid-svg-roVT1HHHjoV0WPBh .labelBkg{background-color:rgba(232, 232, 232, 0.5);}#mermaid-svg-roVT1HHHjoV0WPBh .cluster rect{fill:#ffffde;stroke:#aaaa33;stroke-width:1px;}#mermaid-svg-roVT1HHHjoV0WPBh .cluster text{fill:#333;}#mermaid-svg-roVT1HHHjoV0WPBh .cluster span{color:#333;}#mermaid-svg-roVT1HHHjoV0WPBh div.mermaidTooltip{position:absolute;text-align:center;max-width:200px;padding:2px;font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:12px;background:hsl(80, 100%, 96.2745098039%);border:1px solid #aaaa33;border-radius:2px;pointer-events:none;z-index:100;}#mermaid-svg-roVT1HHHjoV0WPBh .flowchartTitleText{text-anchor:middle;font-size:18px;fill:#333;}#mermaid-svg-roVT1HHHjoV0WPBh rect.text{fill:none;stroke-width:0;}#mermaid-svg-roVT1HHHjoV0WPBh .icon-shape,#mermaid-svg-roVT1HHHjoV0WPBh .image-shape{background-color:rgba(232,232,232, 0.8);text-align:center;}#mermaid-svg-roVT1HHHjoV0WPBh .icon-shape p,#mermaid-svg-roVT1HHHjoV0WPBh .image-shape p{background-color:rgba(232,232,232, 0.8);padding:2px;}#mermaid-svg-roVT1HHHjoV0WPBh .icon-shape .label rect,#mermaid-svg-roVT1HHHjoV0WPBh .image-shape .label rect{opacity:0.5;background-color:rgba(232,232,232, 0.8);fill:rgba(232,232,232, 0.8);}#mermaid-svg-roVT1HHHjoV0WPBh .label-icon{display:inline-block;height:1em;overflow:visible;vertical-align:-0.125em;}#mermaid-svg-roVT1HHHjoV0WPBh .node .label-icon path{fill:currentColor;stroke:revert;stroke-width:revert;}#mermaid-svg-roVT1HHHjoV0WPBh :root{--mermaid-font-family:"trebuchet ms",verdana,arial,sans-serif;} 2026 栈
年级
大一 地基
大二 嵌入式
大三 整机
大四 ROS2
研一 深耕
研二 输出
Linux Git Py C
MCU PID 竞赛
整机 视觉
ROS2 Sim
SLAM 控制 VLA
论文 带队
4. 大一:工具链、数学与英语
4.1 英语与信息源
英语仍是长期天花板:顶会论文、厂商手册、Issue 讨论以英文为主。2026 年可借助翻译与 Copilot 类工具加速阅读 ,但不能替代自己啃原版教材与论文摘要的能力。
| 习惯 | 说明 |
|---|---|
| GitHub | 读优秀开源机器人项目(LeRobot、ORB-SLAM3、micro-ROS 等) |
| Stack Overflow / ROS Discourse | 搜报错与最佳实践 |
| arXiv + 顶会 | Robotics: Science and Systems、ICRA、IROS、CoRL |
4.2 数学
| 课程/资源 | 说明 |
|---|---|
| 微积分、线性代数 | 职业生涯中会多次重学;第一遍用英文教材质量通常更高 |
| 《Linear Algebra Done Right》或 Treil《Linear Algebra Done Wrong》(免费 PDF) | 配合 MIT 18.06 或 3Blue1Brown 几何直觉 |
| 离散数学 / 概率 | 大二大三会反复用到,大一暑假可预习 |
4.3 编程与系统
| 步骤 | 2026 建议 |
|---|---|
| Python 3 | 官方教程 + numpy;LeetCode/力扣适量刷题 |
| C/C++ | 嵌入式与性能路径仍离不开;用数组/指针手写矩阵运算练基本功 |
| Linux | Ubuntu 22.04 LTS (与 ROS 2 Humble 对齐)或 24.04(与 Jazzy 对齐);命令行、ssh、vim/nano |
| 构建 | cmake + make;大二前不必深挖 ROS 2 构建 |
| 版本管理 | Git + GitHub;从第一天养成 commit 习惯 |
Web 基础(仍值得学):JSON、HTTP、REST 概念;前端不必精通,但机器人 Web 遥操作、rosbridge、Foxglove 等依赖这些概念。可选:MDN 学 HTML/JS 基础。
大一暑假:个人主页或博客(静态站/GitHub Pages)、巩固线代与 C、预习概率。
5. 大二:嵌入式、动手与竞赛
5.1 目标
能画简单结构图、能焊板子、能写单片机读传感器、能调差速底盘 PID,理解 UART/SPI/I2C/CAN 基本原理。
5.2 技能树(2026)
| 类别 | 内容 |
|---|---|
| 机械 | SolidWorks / Fusion 360 入门;3D 打印与基础金工 |
| 电路 | Altium / KiCad 入门;焊接、杜邦线/端子工艺 |
| MCU | STM32(主流)或 ESP32(Wi-Fi/BLE 场景);51 可作极简入门 |
| 电机 | 直流减速电机 + 编码器、舵机、无刷+电调(无人机/四足) |
| 控制 | PID 直观理解;倒立摆可用 Python/MuJoCo 或 Simulink |
| 传感器 | IMU、超声波、红外、廉价激光/深度相机(RealSense 等) |
5.3 竞赛与社群(国内仍极有价值)
| 类型 | 价值 |
|---|---|
| RoboMaster / Robocon | 整机、团队协作、Deadline 压力 |
| 智能车、电赛、大创 | 嵌入式与方案完整度 |
| 无校队资源 | STM32 官方例程、阿莫论坛、立创开源、LeRobot SO-101 等低成本臂 |
警惕比赛坏习惯 :「糙猛快」砸结构、盲调 PID、无 BOM 与版本管理------大二暑假应复盘,把临时方案改成可建模、可文档化的做法。
5.4 软件补充
- 面向对象:Java/C++ 课程项目完整手写一个小游戏或工具(3000 行级经验)
- 自动控制原理、概率统计:与线代、微积分联动复习
- GitHub:课程设计与小项目公开托管
6. 大三:独立整机与方向启蒙
6.1 核心目标
一个人(或小团队)从机械/电路/软件到联调,做出一台「比赛级或接近」的完整机器人:地面车、RM 战车、四旋翼、机械臂小车、开源四足套件均可。
6.2 项目选型参考
| 项目 | 训练点 | 2026 备注 |
|---|---|---|
| Robocon 级地面机器人 | 机械、多 MCU、运动学、任务逻辑 | 传统但全面 |
| RM 战车 | 底盘、云台、视觉、功率与实时 | 视觉可用 OpenCV + 深度学习检测 |
| 四旋翼 | 姿态解算、混控、滤波 | 成品飞控学习仍有效;开源 Betaflight/PX4 生态成熟 |
| 移动机械臂 / LeRobot 类 | 遥操作、数据采集、模仿学习入门 | 对接 2026 具身热点 |
| 四足/人形套件 | locomotion、全身控制入门 | 宇树 Go2/Edu、开源 MIT Cheetah 仿真等 |
6.3 飞控学习路径(若选无人机)
- 调通小四轴(机架 + 遥控 + 成品或开源飞控)
- 读硬件框图与固件模块:姿态估计、控制环、混控
- 小改:加定高/定点(超声波/光流/视觉)
- 补理论:刚体运动学、互补滤波/EKF、PID/MPC 基础
- 可选:自研飞控板(STM32 + IMU)------仍是最硬核的硬件理解路径之一
定位 :飞控仍是理解状态估计 + 控制闭环 的极佳抓手,但除非明确走多旋翼 / 无人机方向,不必把「自研飞控」当作全体机器人工程师的必修里程碑;地面移动、操作臂、人形路径可把时间更多放在运动学、规划或全身控制上。
6.4 工程素养(大三必须建立)
| 实践 | 说明 |
|---|---|
| BOM 表 | 螺丝型号、线规、电机规格 |
| BugList | 接线、加工、协议、时序踩坑 |
| 软件工程 | 模块接口、UML/简单设计文档;Git 每日提交 |
| RTOS 概念 | FreeRTOS on MCU;与 Linux 实时补丁对比 |
| 细分方向启蒙 | 感知 / SLAM / 控制 / 规划 / 嵌入式 / 具身学习------择一多读 |
暑假 :参赛或 RoboMaster 夏令营类集训;思考保研/出国/就业与方向选择。
7. 大四:ROS 2、仿真与表达
7.1 为何大四再系统学 ROS 2
ROS 2 依赖 Linux、网络、C++/Python 与分布式概念;不宜大一就以 ROS 2 为核心构建知识体系 。杨硕「大四前别碰 ROS」在 2026 仍大体成立 (对应 ROS 2,而非已 EOL 的 ROS 1)。
大一~大三可以在使用工具 层面少量接触:例如用 RViz2 看点云、用 Foxglove 看话题、在队里跑现成的 ros2 launch------很多竞赛队大二就会用 ROS 2 跑包,完全禁止反而脱离现实 。关键是主次:地基仍是 Linux、C/C++、线代与嵌入式;ROS 2 的系统化学习放在大四及以后。
| 2026 选型 | 说明 |
|---|---|
| Ubuntu 22.04 + ROS 2 Humble | 工业与教材引用最广的 LTS 组合之一 |
| Ubuntu 24.04 + ROS 2 Jazzy | 新 LTS,与 Gazebo Harmonic 等对齐 |
| 勿在新项目用 ROS 1 Noetic | 2025 年已 EOL(以 Open Robotics 发行版说明 为准) |
7.2 大四应开题的方向
| 主题 | 资源线索 |
|---|---|
| 旋转表示 | 欧拉角、旋转矩阵、四元数、SO(3);MLS 第 2 章 |
| 凸优化入门 | Boyd《Convex Optimization》前几章 |
| 仿真 | Gazebo Harmonic + ROS 2;或 MuJoCo + Python;有 GPU 可试 Isaac Sim |
| ROS 2 实践 | ros2 CLI、rclcpp/rclpy、Launch、TF2、RViz2、Foxglove |
7.3 表达与求职资产
| 输出 | 说明 |
|---|---|
| 毕业设计 | 按正式项目:需求、架构、测试、可复现 |
| LaTeX + Inkscape | 论文与报告 |
| 个人站 / GitHub | 视频、代码、英文技术小结 |
| 实习 | 机器人/智驾/无人机/自动化公司 |
8. 研一:方向深耕与仿真闭环
8.1 目标
在一个方向上形成「读论文 → 复现/改进 → 仿真或实物验证」闭环。
8.2 方向与 2026 入口
| 方向 | 核心数学/工具 | 2026 延伸 |
|---|---|---|
| SLAM / 定位 | 几何、BA、g2o、EKF/因子图 | 语义 SLAM、学习式 VO、SLAM+深度网络 |
| 运动规划 | 图搜索、采样规划、优化 | MoveIt 2、TrajOpt、全身规划 |
| 控制 | 现代控制、MPC、WBC | 四足/人形 WBC、sim-to-real |
| 操作 / 具身 | 运动学、阻抗、学习 | Diffusion Policy 、VLA、遥操作数据采集 |
| 嵌入式 / 系统 | RTOS、驱动、中间件 | micro-ROS、DDS、功能安全入门 |
SLAM 仍建议 :跑通 ORB-SLAM3 / VINS 等后,至少手写简化 VO 或 EKF 的一小部分,避免只会调包。
具身 2026 建议 :LeRobot / OpenTeach 类栈做遥操作 + 数据集 + 策略训练最小闭环;仿真可用 MuJoCo 或 Isaac。
具身热潮下的冷静提醒 :2026 年 VLA、世界模型、端到端操作类论文井喷,但相当比例成果停留在仿真或精心设计的真机演示 。学习时应优先掌握数据采集与标注、标定、评估指标、失败案例分析、sim-to-real 与域随机化,而不是只跑通一个 demo 就自称「会做具身」。
8.3 仿真能力(研究生硬指标)
能自建或修改:刚体动力学 + 关节约束 + 接触/摩擦模型 。明白仿真器忽略了什么 (如部分引擎对科里奥利力、柔性、延迟的处理)。工具:MuJoCo、Gazebo、Isaac、Drake、Simulink 择一二深入。
| 工具 | 工程上常怎么用 | 可信度边界(示意) |
|---|---|---|
| Gazebo Harmonic | ROS 2 生态联调、传感器管线 | 摩擦/接触模型与真机差距大,适合功能联调而非高精度力控验证 |
| MuJoCo | RL、locomotion、接触丰富场景 | 接触求解器对 RL 友好;高精度力控、复杂柔性体仍需谨慎 |
| Isaac Sim / Lab | 视觉丰富、GPU 并行、sim-to-real 管线 | 效果好,但对显卡与资产制作要求高 |
| Drake / Simulink | 控制与多体动力学分析 | 更偏模型与分析,与游戏引擎式渲染不同 |
sim-to-real 仍是瓶颈,不是口号:仿真里调通的策略,上真机往往要重新处理延迟、标定误差、接触与磨损。
8.4 书单(经典仍有效)
| 领域 | 书目 |
|---|---|
| 优化 | Boyd《Convex Optimization》 |
| 估计 | Maybeck;Thrun 概率机器人(SLAM 部分) |
| 操作臂 | Murray《A Mathematical Introduction to Robotic Manipulation》 |
| 视觉几何 | Ma《计算机视觉:算法与应用》或多视图几何 |
9. 研二:系统化、前沿与输出
- 精读 4~5 本 专著、50+ 篇论文;代码量上万行级经验。
- 写论文或可开源的工程系统;带本科生/竞赛队。
- 演讲训练:组会、竞赛指导、会议报告。
- 前沿关注:SLAM+学习 、触觉与力控 、人形 loco-manipulation 、世界模型与 VLA 、sim-to-real。
- 出路:机器人/智驾公司(算法、系统、嵌入式)、读博、创业团队技术骨干。
10. 2026 工具栈速查
| 层次 | 推荐(2026) | 备注 |
|---|---|---|
| OS | Ubuntu 22.04 / 24.04 | 与 ROS 2 发行版对齐 |
| 中间件 | ROS 2 Humble / Jazzy | ROS 2 文档 |
| 通信 | DDS、CAN、EtherCAT | ROS 2 基于 DDS |
| 嵌入式 | STM32、FreeRTOS、micro-ROS | C/C++ |
| 边缘 AI | Jetson Orin、RK3588 | 部署 ONNX/TensorRT |
| 算法 | Python 3.10+、PyTorch 2.x | CUDA 基础 |
| 仿真 | MuJoCo、Gazebo Harmonic、Isaac | 先仿真后实物 |
| 视觉 | OpenCV、RealSense、ROS 2 image_pipeline | 标定不可省 |
| 机械 CAD | SolidWorks、Fusion、Onshape | |
| PCB | KiCad、Altium | |
| 文档 | Markdown、LaTeX、Foxglove |
11. 行业动态与方向选择
11.1 2026 热点(工程视角)
| 赛道 | 特点 | 学习路线关联 |
|---|---|---|
| 人形 / 四足 | 全身控制、高成本、话题度高 | 大三整机 + 研一控制/WBC |
| 工业臂 / AMR | 落地成熟、项目多 | 运动学、规划、PLC/现场总线 |
| 智驾 / 无人车 | 感知融合、规控、车规 | SLAM、预测、嵌入式 |
| 具身智能 | 数据、VLA、遥操作 | 研一 LeRobot 类 + 仿真 |
| 无人机 | 成熟产业链 | 飞控、规划、视觉 |
11.2 方向怎么选
- 前期广、后期窄:大一~大三广度;大四~研一收敛。
- 跟场景走:有实验室人形平台就跟 WBC;有 AGV 就跟导航;勿纯追热搜。
- 国内 vs 出国 :顶尖资源两边都有;看课题组方向与资金,而非只看学校牌子。
12. 反模式与心态
| 反模式 | 后果 |
|---|---|
| 大一就上 ROS 2 + 人形 | 基础不牢,只会 launch 别人包 |
| 只调包不写核心算法 | 面试与科研上限低 |
| 比赛糙猛快不复盘 | 坏习惯带入工业项目 |
| 忽视文档与 BOM | 团队无法接力 |
| 生产环境暴露未鉴权调试接口 | 安全与合规风险 |
| 追模型不追物理 | 策略在真机上一塌糊涂 |
数学 :线代、概率、优化、几何------反复学,每次带新问题回去看。
隐形资产:BugList、BOM、接线图、标定参数表------工作几年后极值钱。
13. 非典型路径
六年路线默认读者是电子 / 机械 / 计算机专业、能相对按部就班跟年级推进。若你已工作、跨专业或时间有限,可裁剪为:
| 情况 | 建议 |
|---|---|
| 已工作转行 | 优先补齐:Linux + C++/Python + 线代 + 控制基础;用 evenings 做一个小项目开源 |
| 非工科背景 | 不要跳过数学与 C;用 LeRobot + MuJoCo 走「操作 / 具身」捷径往往比硬啃整机更快见效 |
| 时间有限 | 放弃「机械+电路+算法全流程」幻想,深耕单模块:感知 / 规划 / 控制 / 嵌入式之一 |
| 只想快速入行 | 工业 AMR、自动化集成岗:ROS 2 导航 + PLC/现场总线 + 实习项目,比追人形更现实 |
非典型路径仍须承认:物理交互与系统思维逃不掉;只是整机里程碑可以换成「可演示的仿真 + 一段真机验证」。
14. 能力自检表
比「读了几本书」更有说服力的是能否在无提示下完成核心推导或实现。大三结束时可自测(不必全会,但应知道差在哪):
| 自检项 | 说明 |
|---|---|
| 2D 差速底盘运动学 | 给定轮距、轮速,手写线速度与角速度 |
| EKF 融合 IMU + 里程计 | 能说清状态、观测、协方差的意义,而非只调包 |
| 简化 BA 或梯度下降 | Python + NumPy 实现小规模非线性最小二乘或迭代优化 |
| URDF / XACRO | 读懂关节链,指出惯性参数缺失或接触未建模的风险 |
| PID 与饱和 | 解释积分饱和、微分噪声,并对应到真实电机限幅 |
| Git 协作 | 分支、PR、可复现的 README 与依赖说明 |
研一结束前可增加:一种旋转表示的转换、一次 g2o/Ceres 风格因子图、或一条真机数据采集到训练的完整记录。
15. 按年级行动清单
| 年级 | 本学期可执行 |
|---|---|
| 大一 | 装 Ubuntu 22.04 + Git + VS Code;Python + 线代;注册 GitHub;每天英语 30 分钟 |
| 大二 | 入机器人队;STM32 点灯→PWM→电机编码器→PID 小车;维护个人 BugList |
| 大三 | 独立项目开源到 GitHub;选细分方向读 1 本经典;BOM + 视频记录 |
| 大四 | ROS 2 官方教程 + 一个小仿真项目;LaTeX 毕设;实习 |
| 研一 | 复现 1 篇顶会论文核心;仿真+实物二选一闭环 |
| 研二 | 论文或开源系统;带队伍;练英文报告 |
延伸阅读
| 主题 | 链接 |
|---|---|
| 杨硕原文(2016) | 机器人工程师学习计划(知乎专栏) |
| ROS 2 | https://docs.ros.org/ |
| ROS 发行版与 EOL | https://docs.ros.org/en/humble/Releases.html |
| Gazebo | https://gazebosim.org/ |
| MuJoCo | https://mujoco.org/ |
| LeRobot | https://github.com/huggingface/lerobot |
| PX4 飞控 | https://px4.io/ |
| MoveIt 2 | https://moveit.ai/ |
| MAVLink | https://mavlink.io/ |
| Boyd 凸优化(在线书) | https://web.stanford.edu/\~boyd/cvxbook/ |
| MLS 操作臂教材 | http://www.cds.caltech.edu/\~murray/books/MLS/mls94.pdf |
一句话 :2026 年的机器人工程师仍须敬畏物理世界 ------在大模型与人形热潮下,六年路线 的本质没变:工具与数学地基、嵌入式与整机、ROS 2 与仿真、单点深耕与持续输出;变的是 ROS 2、学习式感知与策略、仿真先训、国产平台与开源生态------把杨硕地图换上这一套栈,比从零摸索省几年弯路。