为什么自动驾驶不敢真正无人化?钱学森早就说过了

一、一个令人不安的现实

2026年,自动驾驶正处于一个微妙的时刻。

技术层面,一切看起来都在高歌猛进。激光雷达、摄像头、毫米波雷达的感知精度不断提升,算力平台从几百TOPS迈向几千TOPS,算法模型从规则驱动走向端到端神经网络-。政策层面,深圳、天津等城市相继出台自动驾驶商业化试点新政,L4级自动驾驶不再强制要求安全员-。

但如果你仔细观察,会发现一个令人不安的事实:几乎所有的"无人驾驶",背后都还有人。

无人驾驶出租车在城市道路上运行,远程监控室里坐着安全员-。L3级自动驾驶在特定场景下移交驾驶权给系统,但随时需要人类接管-。行业里有一句心照不宣的话:"无人驾驶,只是把安全员从车上搬到了监控室。"

为什么?

因为谁都不敢真正把方向盘交给机器。

二、自动驾驶的"三秒钟困境"

2025年,行业发生了一起引起广泛关注的事故。一辆配备高阶智驾的车辆在道路维修场景下,系统对工况的识别一步步失效,从碰撞到接管只有2-3秒的窗口期-。

2-3秒,对机器来说是一千年,对人来说只是一瞬间。

问题出在哪里?行业专家指出,当前智驾评测技术面临的最大挑战,主要来自于人工智能模型的黑箱特性以及边缘场景的安全长尾问题-。AI模型是通过大量数据训练得到的神经元网络,其工作机理并不透明------工程师只能通过测试来了解它的性能,而无法真正理解它"为什么这么判断"-。

更糟糕的是边缘场景。自动驾驶系统在常见的、被大量数据覆盖的场景中表现良好------高速公路巡航、城市道路跟车、标准十字路口转弯。但一旦遇到训练数据中没有覆盖的场景------道路维修、前方车辆突然"消失"、儿童突然窜出、异形工程车------系统的表现就变得不可预测-。

一家头部自动驾驶公司的CEO坦率地承认:"系统无法识别静止车辆、缓慢行驶的工程车、异形挂车等场景------这些'不能'恰恰暴露了当前技术的真实边界。"-

三、本质问题:它能"看见",但不能"理解"

那么,为什么自动驾驶的识别能力越来越强,却依然不敢真正无人化?

因为**"识别"和"理解"是两回事。**

今天的自动驾驶系统,本质上是一个巨大的统计模型。摄像头拍到的每一个像素、雷达返回的每一个点云、毫米波雷达捕捉的每一个信号,都转化为数字,输入神经网络。网络输出的是概率------这个物体有95%的概率是行人,那个物体有87%的概率是车辆。

然后呢?

然后系统根据这些概率,执行预设的操作------刹车、转向、加速。如果概率超过某个阈值,就踩刹车;如果低于某个阈值,就继续行驶。

它从来没有问过自己三个最根本的问题:

  1. 现在是什么情况? ------它不知道"现在"是一个"需要极度谨慎"的情境,还是一个"可以正常行驶"的情境。它只知道"概率"。

  2. 我对此有多确定? ------它不知道自己的判断是可靠的还是不可靠的。95%的概率和55%的概率,在它那里都是"数字",它没有"确定"和"不确定"的感受。

  3. 这安不安全? ------它不知道"安全"是什么。安全不是一个可以计算的概率,它是一个需要综合判断的价值概念。

用一个比喻:自动驾驶就像一个极其博学的盲人------他能说出每一件物体的名字,却不知道它们之间的关系,也不知道自己身处何处。

他能"看见"前方有行人、有车辆、有路障,但他"理解"不了这是一个"行人突然横穿"的危险情境、那是一个"道路维修"的复杂场景。没有"理解",就没有"判断"。没有"判断",就不敢真正放手。

四、钱学森的预见:灵境------扩展感知的认知界面

1990年11月27日,钱学森给时任国家"863计划"智能计算机专家组组长汪成为写了一封信-。信中提到一个VR的译名建议:

"Virtual Reality,此词中译,可以是1.人为景境;2.灵境。我特别喜欢'灵境',中国味特浓。" -1-9

"灵境"不是随便起的名字。1998年,87岁的钱学森专门写了一篇短文《用"灵境"是实事求是的》,解释为什么选这两个字:"我们传统文化正好有一个表达这种情况的词:'灵境';这比'临境'好,因为这个境是虚的,不是实的。"-1-9

但钱学森对"灵境"的思考,远比一个译名要深远得多。

他看到了"灵境"最本质的价值:扩展感知。

1993年7月3日,钱学森在给汪成为的信中写道:"我对灵境技术及多媒体的兴趣在于,它能大大扩展人脑的知觉,因而使人进入前所未有的新天地,新的历史时代要开始了!" --1-9

注意这句话里的三个关键词。

第一,"扩展人脑的知觉"。 钱学森认为,灵境技术最大的价值不是"造一个虚拟世界给人玩",而是"扩展人感知世界的能力"。感知不只是"看见",更是"理解"------理解自己身处什么情境、理解这个情境意味着什么、理解自己应该怎么做。灵境的价值是让感知从"被动接收信息"变成"主动理解情境"。

第二,"进入前所未有的新天地"。 钱学森预见到,当人的感知被扩展之后,人类将进入一个全新的认知境界------一个"人机共同感知、共同判断"的境界。

第三,"新的历史时代要开始了"。 这不是随口的感叹。钱学森认为这是一个文明级的变化。

1994年10月,钱学森在给戴汝为、汪成为、钱学敏的信中进一步断言:"灵境技术是继计算机技术革命之后的又一项技术革命。它将引发一系列震撼全世界的变革,一定是人类历史中的大事。" -1-9

他还亲手绘制了一张导图,阐释灵境技术的广泛应用将引发的全方位变革-1-9

五、从"人机结合"到"人机融合"

钱学森对"灵境"的思考,与他整个"人机结合"的思想一脉相承。

他明确区分了人机关系的两个阶段--18

第一阶段是 "结合" ------人和机器合作,但彼此是独立的。人在电脑的辅助下学习、工作,是"浅层次、合作性"的结合-9。今天的大模型、自动驾驶,都处在这个阶段。机器是工具,人是使用者。

第二阶段是 "融合" ------人和机器在同一个认知空间中共同感知、共同判断。钱学森指出,"大成智慧"只是人机结合的初期阶段,因为人机还没有真正合一,只是结合互补而已。而从"灵境"系统开始的这种结合,才是"融合"-。

钱学森在1996年给汪成为的信中进一步设想,人机结合的最终形态是 "人机融合" ------人在机器的帮助下变成"超人"-9-3。他强调,如果存在进化,那进化的一定是人类-9-3

"融合"意味着什么?意味着机器不再只是一个工具,它要参与到人类的感知和判断过程中来。它要有能力感知情境、评估确定度、判断安全性。它要成为人类判断的延伸,而不是人类指令的执行者。

今天回头看,钱学森的预见有多么精准------

自动驾驶最需要的,恰恰就是这个 "扩展感知" 的能力。不是扩展"看见"的能力------摄像头已经看得够远了。而是扩展"理解"的能力------理解"现在是什么情境、我有多确定、这安不安全"。

而这,正是"灵境"要解决的问题:它不是让人进入虚拟世界,而是让机器进入人的认知世界,和人一起感知、一起判断。

六、把钱学森的方向变成工程

三十多年前,钱学森看到了自动驾驶今天面临的困境的本质------缺乏"扩展感知"的能力,缺乏"人机融合"的判断机制。

他给出了方向:灵境技术将扩展人脑的知觉,使人机从"结合"走向"融合"。

但他没有给出工程路径。不是他不能,而是他那个时代的技术条件不具备------没有大模型、没有端到端神经网络、没有车规级算力芯片。

今天,技术条件已经成熟。我们要做的,就是把钱学森的方向变成工程。

我们构建的"判断力引擎",本质上就是钱学森"灵境"思想的工程化实现

灵境要"扩展人脑的知觉"------判断力引擎用六十四卦完备态势空间,让机器拥有一个"态势参照系",能够从整体上感知"现在是什么情境"。灵境要实现"人机融合"------判断力引擎用U值(全局认知势)让机器"知道自己知道不知道",在不确定时主动收敛、主动请求人类介入。灵境要"引发一系列震撼全世界的变革"------判断力引擎让自动驾驶第一次拥有了"停下来想一想"的能力,在感知和行动之间插入了一个独立的判断环节。

钱学森说灵境将"大大扩展人脑的知觉"。判断力引擎,正是把这个"扩展"做成了可以运行的代码、可以部署的芯片。

七、结语

今天的自动驾驶,能"看见"一切,却"理解"不了任何事。它能识别行人、车辆、路标,但理解不了"这是一个危险情境"还是"这是一个安全情境"。所以它不敢真正无人化。

三十多年前,钱学森就已经看到了这个问题的本质。他用"灵境"这个词,指向了一个方向:扩展感知,让人和机器在同一个认知空间中共同感知、共同判断。

他管这个叫"人机融合"。

今天,我们终于可以把"人机融合"做成可以运行的代码了。我们给自动驾驶装上了"判断力"------不是让它算得更快,而是让它学会"停下来想一想"。

钱学森说"新的历史时代要开始了"。

对自动驾驶来说,这个时代就是:从"能开"到"敢坐"的时代。