😏*★,°* :.☆( ̄▽ ̄)/$:.°★ 😏
探智求真,学以致用。欢迎来到我的博客,一起学习,共同进步。
喜欢的朋友可以关注一下,下次更新不迷路🥞
文章目录
-
- [:smirk:1. 概述](#:smirk:1. 概述)
- [:blush:2. 主线](#:blush:2. 主线)
- [:satisfied:3. 总结](#:satisfied:3. 总结)
😏1. 概述
说起自动驾驶,我们可能会说出一堆术语------传感器融合、SLAM、轨迹规划、端到端学习------但如果要解释给一个六年级学生听,我们会怎么说呢。
需要换个方式,想象你坐在车里,前面有个司机。自动驾驶要干的,就是把那个司机替换掉。
那司机在干嘛?
他做四件事:
- 看------用眼睛看路、车、行人
- 想------判断前面那个人会不会闯红灯
- 动------决定是踩刹车还是打方向盘
- 控------真的去操作刹车和方向盘
自动驾驶也是这么四档事,对应四个模块:感知→规划→决策→控制。名字听起来高大上,其实就是看、想、动、控。
😊2. 主线
感知:它怎么"看"?
三个眼睛:摄像头、雷达、激光雷达。
摄像头像人眼,能认颜色和形状,红绿灯、标志牌得靠它。但它怕黑,下雨天糟糕。
雷达像蝙蝠发出的超声波,不靠光,黑夜大雨都不怕,但看不清细节------它知道前面有个东西,但不知道是车还是狗。
**激光雷达(lidar)**是个发射激光的扫描仪,能画出三维地图。它像给世界拍了一张3D照片,精确知道每个东西在哪。但贵,现在还在降价。
这三个货各有所长,各有所短。自动驾驶就把它们的数据融合 在一起------这叫传感器融合。这就像你同时用耳朵听、眼睛看、鼻子闻,然后大脑把它们综合起来,形成一个完整的画面。
规划:它怎么"想"?
看到东西了,接下来呢?你得决定怎么走。
这里分两层:
全局规划------从A点到B点走哪条路最快。这跟导航软件一样,用地图算法(A*、Dijkstra什么的),不新鲜。
局部规划------比如现在绿灯亮了,前面有个行人要过马路,你得决定是停还是绕过去。这才是真正难的部分。
难点在于:不确定性。你不知道那个行人是真的要闯红灯还是只是站在那看看。你不知道后面那辆车会不会突然超车。人类司机靠"直觉",自动驾驶靠概率模型。
Waymo和特斯拉的区别就在这:
- Waymo用详细地图+规则,保守,出了名的心狠------前面有个塑料袋,它也停下来。
- 特斯拉用端到端学习更像"神经网络大脑",更像人类司机,但有时候会犯人类不会犯的错。
控制:它怎么"动"?
决策做好了,就该动手了。控制模块把规划好的轨迹变成具体的指令:方向盘转多少度,油门踩多深,刹车踩多重。
这部分其实相对成熟,传统控制理论就能搞定。PID控制器、模型预测控制------这些在工业里用了几十年了。
我来说说什么是"真理解"
现在自动驾驶学习的问题是什么呢?
很多人教的是这样:
"首先介绍感知层的卷积神经网络,然后用激光雷达点云进行目标检测,接着讲基于采样的轨迹规划算法..."
这是命名≠理解的典型。你在背菜名,不是做菜。
费曼会怎么教?
他会让你先坐一次自动驾驶车,然后问你:
"你觉得它哪里像人?哪里不像人?"
然后你们一起从那个具体的体验出发,去追问背后的原理。
最后,真正的问题是:安全。你怎么证明它比人安全?你不能只跑一百万英里然后说"你看,没出事"。这是确认偏误。
😆3. 总结
自动驾驶没那么神秘。它就是:
- 看(感知)
- 想(规划)
- 决定(决策)
- 动(控制)
学这个的时候,别从术语开始。从一辆车开始。从一次乘坐体验开始。然后问自己问题,带着问题去找答案。
最重要的不是记住pipeline有几个模块,而是要真的明白:机器是怎么处理不确定性的。
因为驾驶这事的本质就是------你永远不可能100%确定前面那个骑车的会不会突然转向。你得在不确定中做决定。
这就是自动驾驶最迷人的地方,也是最难的地方。

以上。