一、一个令人不安的现实
2026年,自动驾驶正处于一个微妙的时刻。
技术层面,一切都在高歌猛进。激光雷达、摄像头、毫米波雷达的感知精度不断提升,算力平台从几百TOPS迈向几千TOPS,算法模型从规则驱动走向端到端神经网络。
但如果你仔细观察,会发现一个令人不安的事实:几乎所有的"无人驾驶",背后都还有人。
无人驾驶出租车在城市道路上运行,远程监控室里坐着安全员。L3级自动驾驶在特定场景下移交驾驶权给系统,但随时需要人类接管。行业里有一句心照不宣的话:"无人驾驶,只是把安全员从车上搬到了监控室。"
为什么?
因为谁都不敢真正把方向盘交给机器。
二、自动驾驶的"三秒钟困境"
2025年,行业发生了一起引起广泛关注的事故。一辆配备高阶智驾的车辆在道路维修场景下,系统对工况的识别一步步失效,从碰撞到接管只有2-3秒的窗口期-。
2-3秒,对机器来说是一千年,对人来说只是一瞬间。
问题出在哪里?行业专家指出,当前智驾评测技术面临的最大挑战,主要来自于人工智能模型的黑箱特性以及边缘场景的安全长尾问题-。更糟糕的是"稀疏度灾难"------当自动驾驶系统遇到不常见的情况或边缘案例时,无法做出正确的决策,从而导致事故或故障-。
"边缘场景"有多离谱?在美国,有人穿着印有"STOP"字样的T恤站在路边,就成功"干蒙"了Waymo的无人驾驶出租车-。系统看到了"STOP"字样,但它理解不了"这是一个穿T恤的人,不是停车标志"------它只会机械地匹配文字。
更令人头疼的是"鬼探头"式的场景。一个小孩突然从车前草丛探出头来,摄像头只捕捉到极短时间的部分轮廓,雷达回波弱,LiDAR点稀少-。自动驾驶系统需要在信息极其有限的情况下评估"这是不是危险",并不能因为信息不全就放松警惕,也不能因为一次噪声就触发激烈动作-。
这就是自动驾驶的核心困境:它能"看见",但不能"理解";它能"识别",但不能"判断"。
三、钱学森的预见:不确定性是控制论的基本问题
1954年,钱学森在美国出版了《工程控制论》一书-。他在这本书中,早已预见了自动驾驶今天面临的困境。
钱学森将"工程控制论"的内容界定为**"系统各个部分之间的相互作用的定性性质以及整个系统的运转状态"** -。自动驾驶汽车,正是一个典型的"被控制系统"------它接收传感器输入、执行驾驶动作,但它对自己的"运转状态"缺乏深度的感知和判断。
钱学森明确指出,控制论的基本问题"就在于存在各种不确定因素(Uncertainty)" -1。他进一步阐述:"控制系统的性质常可用某一特定数值是否为零来判断,但若该值不为零但特别小,很小的误差或噪声干扰就可能导致严重的后果,于是能否放心使用就是一个常见的问题"-1。
这段话用在今天的自动驾驶身上,再贴切不过。传感器读数总会有误差,环境总会有变化,边缘场景总会有未曾预见的细节------这些"很小的误差或噪声干扰",在高速行驶的车辆中,可能"导致严重的后果"。
钱学森为此开出的药方是:"反馈系统要比开环系统强" -1。系统需要通过反馈来感知自身状态,并据此调整行为。
他还进一步指出:"系统的结构和参数存在误差或发生变化时,为使系统保持良好性能,就需要研究系统对这些变化的灵敏度或鲁棒性问题 "-1。一个真正可靠的自动驾驶系统,必须在面对传感器误差、环境变化和未知场景时依然保持稳定。
在《工程控制论》第十八章中,钱学森还专门探讨了**"用不怎么可靠的元件,来组成高度可靠系统"** 的理念--8。自动驾驶恰恰面临同样的挑战------每一个传感器都可能出错,每一种算法都有盲区,但整个系统必须可靠。
钱学森的结论是:"我们有办法利用不十分可靠的元件做出非常可靠的系统" -8。办法就是------系统层面的设计、冗余、反馈和判断。
四、传统方法的局限:为什么"端到端"解决不了问题
面对自动驾驶的"判断难题",行业目前主要有两条技术路线。
第一条:规则覆盖。 工程师穷举所有可能的驾驶场景,为每一种场景编写应对规则。这条路已经走不通了------现实世界的场景是无限的,规则是有限的。"稀疏度灾难"正是这个问题的学术表达:当系统遇到不常见的情况或边缘案例时,无法做出正确的决策-。
第二条:端到端学习。 用海量驾驶数据训练一个神经网络,从传感器输入直接映射到驾驶输出。这条路同样存在根本问题。端到端系统是一个黑箱 ------工程师只能通过测试来了解它的性能,而无法真正理解它"为什么这么判断"-。当它遇到训练数据中没有覆盖的场景时,它的行为变得不可预测。更致命的是,它自己也不知道自己不可预测。
这正是钱学森所说的"不确定性"问题------传统方法试图用"更多规则"或"更多数据"来消灭不确定性,但不确定性是消灭不了的。它只能被感知、量化和管理。
钱学森在《工程控制论》中指出:"理论的方法还要结合经验的判断 "-1。他还进一步指出:"存在主观的不确定性或知识不足时,可以利用模糊控制、智能控制等技术"-1。
这意味着:面对不确定性,系统需要的不是更精确的"算",而是更可靠的"断"。
五、WOLM如何给自动驾驶装上"判断力"
WOLM(字序生命模型)给自动驾驶带来的,不是一个"更好的感知算法",而是一套完整的判断力架构-。
1. 从"传感器数据"到"事件序列"
传统自动驾驶处理的是传感器数据------图像、点云、雷达回波。WOLM处理的是事件 -28------"前方有障碍物"、"传感器数据冲突"、"行人突然出现"。
事件是带有语义标签的结构化信息。它让系统不再只是"看到"一个物体,而是"理解"一个"发生"。传感器数据是"物"的语言,事件是"事"的语言。WOLM让自动驾驶从"物的世界"进入"事的世界"。
2. 从"概率预测"到"确定性判断"
传统端到端系统输出的是概率 ------"前方有障碍物的概率是87%"。WOLM输出的是确定性判断 ------"这是一个障碍-避让情境,应该立即进入防御态势"-29。
WOLM内置18条因果逻辑链------需求-目标、故障-恢复、障碍-避让、冲突-化解等-28。当系统接收到"行人横穿"这个事件后,直接通过"障碍-避让"因果链,100%确定地涌现出相应的态势。它不猜,它只定-29。
3. 从"不知道"到"知道自己不知道"
这是WOLM给自动驾驶带来的最根本的变化。
传统自动驾驶没有"不确定"这个概念。它要么输出一个概率(87%),要么执行一个动作。WOLM通过U值(全局认知势) 让系统第一次拥有了"知道自己知道不知道"的能力-29。
U值是六维能量向量的统计方差。U值低,说明系统确定------可以果断执行。U值高,说明系统不确定------需要主动收敛、减速观察、或请求人类介入-28。
U值超过警戒阈值时,系统触发内生安全降级------强制保守、强制安全。这个机制是100%确定的、可解释的、微秒级响应的-。
4. 从"边缘场景失效"到"不确定时主动认怂"
传统自动驾驶在遇到边缘场景时,往往陷入困境------它不认识这个场景,但又没有"不确定"的出口,只能硬着头皮继续开。
WOLM的处理方式完全不同。当传感器数据产生矛盾时(摄像头说"前方畅通",雷达说"前方有障碍物"),U值会迅速升高-28。系统不需要判断"哪个传感器是对的",它只需要感知到"内部矛盾了",就主动进入安全状态-29。
它不需要见过这个场景,不需要规则覆盖这个场景,不需要训练数据包含这个场景。它只需要知道:"我不确定,所以我收敛。"
这正是钱学森所说的"鲁棒性"------系统在面对不确定因素时保持预定品质的能力-1。
六、钱学森的"不可靠元件→可靠系统"在自动驾驶中的实现
钱学森在《工程控制论》中指出:"我们有办法利用不十分可靠的元件做出非常可靠的系统 "-8。
自动驾驶正是这句话的最佳注脚。每一个传感器都可能出错,每一种算法都有盲区,每一个边缘场景都可能让系统困惑------它们都是"不十分可靠的元件"。但整个自动驾驶系统必须是可靠的。
WOLM提供的,正是让这些"不可靠元件"组成"可靠系统"的系统级设计:
-
感知层:各个传感器独立工作,各自输出事件
-
判断层:WOLM接收所有事件,在64卦完备态势空间中涌现态势
-
U值监测:持续评估系统的确定程度
-
安全降级:不确定时自动收敛,危险时强制安全
这个设计的精妙之处在于:它不需要每一个元件都可靠,它只需要系统知道"什么时候该信任元件,什么时候该怀疑元件" 。
这正是钱学森所追求的------系统不是被外部规则"控制"的,而是根据自身动力学特性"自主运动"的。
七、结语
钱学森在1954年写下了《工程控制论》,把控制论从一门理论学科变成了一门可以指导工程实践的技术科学-。他深刻指出,控制论的基本问题就在于存在各种不确定因素,而解决之道在于反馈、鲁棒性和系统级设计-1。
七十多年后的今天,自动驾驶技术已经发展到了钱学森难以想象的高度。但他所指出的核心问题------不确定性------依然是自动驾驶走向真正无人化的最大障碍-。
WOLM不是要替代自动驾驶的感知技术或执行技术。它是在现有技术之上,给自动驾驶装上了一个它一直没有的东西:判断力-。
让自动驾驶从"能开"变成"敢坐",让自动驾驶从"概率预测"变成"确定性判断",让自动驾驶在不确定时"主动认怂"而不是"硬着头皮继续开"------这正是钱学森工程控制论思想在自动驾驶领域的当代实践。
正如钱学森在《工程控制论》中所期望的------"给人们提供一个更加广阔的视野和更加系统的解决问题方法"-1------WOLM把工程控制论关于"不确定性、反馈、鲁棒性"的核心思想,与当代自动驾驶的实际工程经验结合起来,让自动驾驶第一次拥有了真正意义上的判断力。