为什么自动驾驶不敢真正无人化？钱学森早就说过了

一、一个令人不安的现实

2026年，自动驾驶正处于一个微妙的时刻。

技术层面，一切看起来都在高歌猛进。激光雷达、摄像头、毫米波雷达的感知精度不断提升，算力平台从几百TOPS迈向几千TOPS，算法模型从规则驱动走向端到端神经网络-。政策层面，深圳、天津等城市相继出台自动驾驶商业化试点新政，L4级自动驾驶不再强制要求安全员-。

但如果你仔细观察，会发现一个令人不安的事实：几乎所有的"无人驾驶"，背后都还有人。

无人驾驶出租车在城市道路上运行，远程监控室里坐着安全员-。L3级自动驾驶在特定场景下移交驾驶权给系统，但随时需要人类接管-。行业里有一句心照不宣的话："无人驾驶，只是把安全员从车上搬到了监控室。"

为什么？

因为谁都不敢真正把方向盘交给机器。

二、自动驾驶的"三秒钟困境"

2025年，行业发生了一起引起广泛关注的事故。一辆配备高阶智驾的车辆在道路维修场景下，系统对工况的识别一步步失效，从碰撞到接管只有2-3秒的窗口期-。

2-3秒，对机器来说是一千年，对人来说只是一瞬间。

问题出在哪里？行业专家指出，当前智驾评测技术面临的最大挑战，主要来自于人工智能模型的黑箱特性以及边缘场景的安全长尾问题-。AI模型是通过大量数据训练得到的神经元网络，其工作机理并不透明------工程师只能通过测试来了解它的性能，而无法真正理解它"为什么这么判断"-。

更糟糕的是边缘场景。自动驾驶系统在常见的、被大量数据覆盖的场景中表现良好------高速公路巡航、城市道路跟车、标准十字路口转弯。但一旦遇到训练数据中没有覆盖的场景------道路维修、前方车辆突然"消失"、儿童突然窜出、异形工程车------系统的表现就变得不可预测-。

一家头部自动驾驶公司的CEO坦率地承认："系统无法识别静止车辆、缓慢行驶的工程车、异形挂车等场景------这些'不能'恰恰暴露了当前技术的真实边界。"-

三、本质问题：它能"看见"，但不能"理解"

那么，为什么自动驾驶的识别能力越来越强，却依然不敢真正无人化？

因为**"识别"和"理解"是两回事。**

今天的自动驾驶系统，本质上是一个巨大的统计模型。摄像头拍到的每一个像素、雷达返回的每一个点云、毫米波雷达捕捉的每一个信号，都转化为数字，输入神经网络。网络输出的是概率------这个物体有95%的概率是行人，那个物体有87%的概率是车辆。

然后呢？

然后系统根据这些概率，执行预设的操作------刹车、转向、加速。如果概率超过某个阈值，就踩刹车；如果低于某个阈值，就继续行驶。

它从来没有问过自己三个最根本的问题：

现在是什么情况？ ------它不知道"现在"是一个"需要极度谨慎"的情境，还是一个"可以正常行驶"的情境。它只知道"概率"。
我对此有多确定？ ------它不知道自己的判断是可靠的还是不可靠的。95%的概率和55%的概率，在它那里都是"数字"，它没有"确定"和"不确定"的感受。
这安不安全？ ------它不知道"安全"是什么。安全不是一个可以计算的概率，它是一个需要综合判断的价值概念。

用一个比喻：自动驾驶就像一个极其博学的盲人------他能说出每一件物体的名字，却不知道它们之间的关系，也不知道自己身处何处。

他能"看见"前方有行人、有车辆、有路障，但他"理解"不了这是一个"行人突然横穿"的危险情境、那是一个"道路维修"的复杂场景。没有"理解"，就没有"判断"。没有"判断"，就不敢真正放手。

四、钱学森的预见：灵境------扩展感知的认知界面

1990年11月27日，钱学森给时任国家"863计划"智能计算机专家组组长汪成为写了一封信-。信中提到一个VR的译名建议：

"Virtual Reality，此词中译，可以是1.人为景境；2.灵境。我特别喜欢'灵境'，中国味特浓。" -1 -9

"灵境"不是随便起的名字。1998年，87岁的钱学森专门写了一篇短文《用"灵境"是实事求是的》，解释为什么选这两个字："我们传统文化正好有一个表达这种情况的词：'灵境'；这比'临境'好，因为这个境是虚的，不是实的。"-1 -9

但钱学森对"灵境"的思考，远比一个译名要深远得多。

他看到了"灵境"最本质的价值：扩展感知。

1993年7月3日，钱学森在给汪成为的信中写道："我对灵境技术及多媒体的兴趣在于，它能大大扩展人脑的知觉，因而使人进入前所未有的新天地，新的历史时代要开始了！" --1 -9

注意这句话里的三个关键词。

第一，"扩展人脑的知觉"。 钱学森认为，灵境技术最大的价值不是"造一个虚拟世界给人玩"，而是"扩展人感知世界的能力"。感知不只是"看见"，更是"理解"------理解自己身处什么情境、理解这个情境意味着什么、理解自己应该怎么做。灵境的价值是让感知从"被动接收信息"变成"主动理解情境"。

第二，"进入前所未有的新天地"。 钱学森预见到，当人的感知被扩展之后，人类将进入一个全新的认知境界------一个"人机共同感知、共同判断"的境界。

第三，"新的历史时代要开始了"。 这不是随口的感叹。钱学森认为这是一个文明级的变化。

1994年10月，钱学森在给戴汝为、汪成为、钱学敏的信中进一步断言："灵境技术是继计算机技术革命之后的又一项技术革命。它将引发一系列震撼全世界的变革，一定是人类历史中的大事。" -1 -9

他还亲手绘制了一张导图，阐释灵境技术的广泛应用将引发的全方位变革-1 -9。

五、从"人机结合"到"人机融合"

钱学森对"灵境"的思考，与他整个"人机结合"的思想一脉相承。

他明确区分了人机关系的两个阶段--18：

第一阶段是 "结合" ------人和机器合作，但彼此是独立的。人在电脑的辅助下学习、工作，是"浅层次、合作性"的结合-9。今天的大模型、自动驾驶，都处在这个阶段。机器是工具，人是使用者。

第二阶段是 "融合" ------人和机器在同一个认知空间中共同感知、共同判断。钱学森指出，"大成智慧"只是人机结合的初期阶段，因为人机还没有真正合一，只是结合互补而已。而从"灵境"系统开始的这种结合，才是"融合"-。

钱学森在1996年给汪成为的信中进一步设想，人机结合的最终形态是 "人机融合" ------人在机器的帮助下变成"超人"-9 -3。他强调，如果存在进化，那进化的一定是人类-9 -3。

"融合"意味着什么？意味着机器不再只是一个工具，它要参与到人类的感知和判断过程中来。它要有能力感知情境、评估确定度、判断安全性。它要成为人类判断的延伸，而不是人类指令的执行者。

今天回头看，钱学森的预见有多么精准------

自动驾驶最需要的，恰恰就是这个 "扩展感知" 的能力。不是扩展"看见"的能力------摄像头已经看得够远了。而是扩展"理解"的能力------理解"现在是什么情境、我有多确定、这安不安全"。

而这，正是"灵境"要解决的问题：它不是让人进入虚拟世界，而是让机器进入人的认知世界，和人一起感知、一起判断。

六、把钱学森的方向变成工程

三十多年前，钱学森看到了自动驾驶今天面临的困境的本质------缺乏"扩展感知"的能力，缺乏"人机融合"的判断机制。

他给出了方向：灵境技术将扩展人脑的知觉，使人机从"结合"走向"融合"。

但他没有给出工程路径。不是他不能，而是他那个时代的技术条件不具备------没有大模型、没有端到端神经网络、没有车规级算力芯片。

今天，技术条件已经成熟。我们要做的，就是把钱学森的方向变成工程。

我们构建的"判断力引擎"，本质上就是钱学森"灵境"思想的工程化实现。

灵境要"扩展人脑的知觉"------判断力引擎用六十四卦完备态势空间，让机器拥有一个"态势参照系"，能够从整体上感知"现在是什么情境"。灵境要实现"人机融合"------判断力引擎用U值（全局认知势）让机器"知道自己知道不知道"，在不确定时主动收敛、主动请求人类介入。灵境要"引发一系列震撼全世界的变革"------判断力引擎让自动驾驶第一次拥有了"停下来想一想"的能力，在感知和行动之间插入了一个独立的判断环节。

钱学森说灵境将"大大扩展人脑的知觉"。判断力引擎，正是把这个"扩展"做成了可以运行的代码、可以部署的芯片。

七、结语

今天的自动驾驶，能"看见"一切，却"理解"不了任何事。它能识别行人、车辆、路标，但理解不了"这是一个危险情境"还是"这是一个安全情境"。所以它不敢真正无人化。

三十多年前，钱学森就已经看到了这个问题的本质。他用"灵境"这个词，指向了一个方向：扩展感知，让人和机器在同一个认知空间中共同感知、共同判断。

他管这个叫"人机融合"。

今天，我们终于可以把"人机融合"做成可以运行的代码了。我们给自动驾驶装上了"判断力"------不是让它算得更快，而是让它学会"停下来想一想"。

钱学森说"新的历史时代要开始了"。

对自动驾驶来说，这个时代就是：从"能开"到"敢坐"的时代。