【AI技能】跟着费曼学自动驾驶

😏★,° :.☆(￣▽￣)/$:.°★ 😏
探智求真，学以致用。

欢迎来到我的博客，一起学习，共同进步。

喜欢的朋友可以关注一下，下次更新不迷路🥞

- [:smirk:1. 概述](#:smirk:1. 概述)
- [:blush:2. 主线](#:blush:2. 主线)
- [:satisfied:3. 总结](#:satisfied:3. 总结)

说起自动驾驶，我们可能会说出一堆术语------传感器融合、SLAM、轨迹规划、端到端学习------但如果要解释给一个六年级学生听，我们会怎么说呢。

需要换个方式，想象你坐在车里，前面有个司机。自动驾驶要干的，就是把那个司机替换掉。

那司机在干嘛？

他做四件事：

自动驾驶也是这么四档事，对应四个模块：感知→规划→决策→控制。名字听起来高大上，其实就是看、想、动、控。

三个眼睛：摄像头、雷达、激光雷达。

摄像头像人眼，能认颜色和形状，红绿灯、标志牌得靠它。但它怕黑，下雨天糟糕。

雷达像蝙蝠发出的超声波，不靠光，黑夜大雨都不怕，但看不清细节------它知道前面有个东西，但不知道是车还是狗。

**激光雷达（lidar）**是个发射激光的扫描仪，能画出三维地图。它像给世界拍了一张3D照片，精确知道每个东西在哪。但贵，现在还在降价。

这三个货各有所长，各有所短。自动驾驶就把它们的数据融合在一起------这叫传感器融合。这就像你同时用耳朵听、眼睛看、鼻子闻，然后大脑把它们综合起来，形成一个完整的画面。

看到东西了，接下来呢？你得决定怎么走。

这里分两层：

全局规划------从A点到B点走哪条路最快。这跟导航软件一样，用地图算法（A*、Dijkstra什么的），不新鲜。

局部规划------比如现在绿灯亮了，前面有个行人要过马路，你得决定是停还是绕过去。这才是真正难的部分。

难点在于：不确定性。你不知道那个行人是真的要闯红灯还是只是站在那看看。你不知道后面那辆车会不会突然超车。人类司机靠"直觉"，自动驾驶靠概率模型。

Waymo和特斯拉的区别就在这：

决策做好了，就该动手了。控制模块把规划好的轨迹变成具体的指令：方向盘转多少度，油门踩多深，刹车踩多重。

这部分其实相对成熟，传统控制理论就能搞定。PID控制器、模型预测控制------这些在工业里用了几十年了。

现在自动驾驶学习的问题是什么呢？

很多人教的是这样：

"首先介绍感知层的卷积神经网络，然后用激光雷达点云进行目标检测，接着讲基于采样的轨迹规划算法..."

这是命名≠理解的典型。你在背菜名，不是做菜。

费曼会怎么教？

他会让你先坐一次自动驾驶车，然后问你：

"你觉得它哪里像人？哪里不像人？"

然后你们一起从那个具体的体验出发，去追问背后的原理。

最后，真正的问题是：安全。你怎么证明它比人安全？你不能只跑一百万英里然后说"你看，没出事"。这是确认偏误。

自动驾驶没那么神秘。它就是：

学这个的时候，别从术语开始。从一辆车开始。从一次乘坐体验开始。然后问自己问题，带着问题去找答案。

最重要的不是记住pipeline有几个模块，而是要真的明白：机器是怎么处理不确定性的。

因为驾驶这事的本质就是------你永远不可能100%确定前面那个骑车的会不会突然转向。你得在不确定中做决定。

这就是自动驾驶最迷人的地方，也是最难的地方。

以上。