一、一个令人不安的现实
2026年,自动驾驶正处于一个微妙的时刻。
技术层面,一切看起来都在高歌猛进。激光雷达、摄像头、毫米波雷达的感知精度不断提升,算力平台从几百TOPS迈向几千TOPS,算法模型从规则驱动走向端到端神经网络-。政策层面,深圳、天津等城市相继出台自动驾驶商业化试点新政,L4级自动驾驶不再强制要求安全员-。
但如果你仔细观察,会发现一个令人不安的事实:几乎所有的"无人驾驶",背后都还有人。
无人驾驶出租车在城市道路上运行,远程监控室里坐着安全员-。L3级自动驾驶在特定场景下移交驾驶权给系统,但随时需要人类接管-。行业里有一句心照不宣的话:"无人驾驶,只是把安全员从车上搬到了监控室。"
为什么?
因为谁都不敢真正把方向盘交给机器。
二、自动驾驶的"三秒钟困境"
2025年,行业发生了一起引起广泛关注的事故。一辆配备高阶智驾的车辆在道路维修场景下,系统对工况的识别一步步失效,从碰撞到接管只有2-3秒的窗口期-。
2-3秒,对机器来说是一千年,对人来说只是一瞬间。
问题出在哪里?行业专家指出,当前智驾评测技术面临的最大挑战,主要来自于人工智能模型的黑箱特性以及边缘场景的安全长尾问题-。AI模型是通过大量数据训练得到的神经元网络,其工作机理并不透明------工程师只能通过测试来了解它的性能,而无法真正理解它"为什么这么判断"-。
更糟糕的是边缘场景。自动驾驶系统在常见的、被大量数据覆盖的场景中表现良好------高速公路巡航、城市道路跟车、标准十字路口转弯。但一旦遇到训练数据中没有覆盖的场景------道路维修、前方车辆突然"消失"、儿童突然窜出、异形工程车------系统的表现就变得不可预测-。
一家头部自动驾驶公司的CEO坦率地承认:"系统无法识别静止车辆、缓慢行驶的工程车、异形挂车等场景------这些'不能'恰恰暴露了当前技术的真实边界。"-
三、本质问题:它能"看见",但不能"理解"
那么,为什么自动驾驶的识别能力越来越强,却依然不敢真正无人化?
因为**"识别"和"理解"是两回事。**
今天的自动驾驶系统,本质上是一个巨大的统计模型。摄像头拍到的每一个像素、雷达返回的每一个点云、毫米波雷达捕捉的每一个信号,都转化为数字,输入神经网络。网络输出的是概率------这个物体有95%的概率是行人,那个物体有87%的概率是车辆。
然后呢?
然后系统根据这些概率,执行预设的操作------刹车、转向、加速。如果概率超过某个阈值,就踩刹车;如果低于某个阈值,就继续行驶。
它从来没有问过自己三个最根本的问题:
-
现在是什么情况? ------它不知道"现在"是一个"需要极度谨慎"的情境,还是一个"可以正常行驶"的情境。它只知道"概率"。
-
我对此有多确定? ------它不知道自己的判断是可靠的还是不可靠的。95%的概率和55%的概率,在它那里都是"数字",它没有"确定"和"不确定"的感受。
-
这安不安全? ------它不知道"安全"是什么。安全不是一个可以计算的概率,它是一个需要综合判断的价值概念。
用一个比喻:自动驾驶就像一个极其博学的盲人------他能说出每一件物体的名字,却不知道它们之间的关系,也不知道自己身处何处。
他能"看见"前方有行人、有车辆、有路障,但他"理解"不了这是一个"行人突然横穿"的危险情境、那是一个"道路维修"的复杂场景。没有"理解",就没有"判断"。没有"判断",就不敢真正放手。
四、钱学森的预见:灵境------扩展感知的认知界面
1990年11月27日,钱学森给时任国家"863计划"智能计算机专家组组长汪成为写了一封信-。信中提到一个VR的译名建议:
"Virtual Reality,此词中译,可以是1.人为景境;2.灵境。我特别喜欢'灵境',中国味特浓。" -1-9
"灵境"不是随便起的名字。1998年,87岁的钱学森专门写了一篇短文《用"灵境"是实事求是的》,解释为什么选这两个字:"我们传统文化正好有一个表达这种情况的词:'灵境';这比'临境'好,因为这个境是虚的,不是实的。"-1-9
但钱学森对"灵境"的思考,远比一个译名要深远得多。
他看到了"灵境"最本质的价值:扩展感知。
1993年7月3日,钱学森在给汪成为的信中写道:"我对灵境技术及多媒体的兴趣在于,它能大大扩展人脑的知觉,因而使人进入前所未有的新天地,新的历史时代要开始了!" --1-9
注意这句话里的三个关键词。
第一,"扩展人脑的知觉"。 钱学森认为,灵境技术最大的价值不是"造一个虚拟世界给人玩",而是"扩展人感知世界的能力"。感知不只是"看见",更是"理解"------理解自己身处什么情境、理解这个情境意味着什么、理解自己应该怎么做。灵境的价值是让感知从"被动接收信息"变成"主动理解情境"。
第二,"进入前所未有的新天地"。 钱学森预见到,当人的感知被扩展之后,人类将进入一个全新的认知境界------一个"人机共同感知、共同判断"的境界。
第三,"新的历史时代要开始了"。 这不是随口的感叹。钱学森认为这是一个文明级的变化。
1994年10月,钱学森在给戴汝为、汪成为、钱学敏的信中进一步断言:"灵境技术是继计算机技术革命之后的又一项技术革命。它将引发一系列震撼全世界的变革,一定是人类历史中的大事。" -1-9
他还亲手绘制了一张导图,阐释灵境技术的广泛应用将引发的全方位变革-1-9。
五、从"人机结合"到"人机融合"
钱学森对"灵境"的思考,与他整个"人机结合"的思想一脉相承。
他明确区分了人机关系的两个阶段--18:
第一阶段是 "结合" ------人和机器合作,但彼此是独立的。人在电脑的辅助下学习、工作,是"浅层次、合作性"的结合-9。今天的大模型、自动驾驶,都处在这个阶段。机器是工具,人是使用者。
第二阶段是 "融合" ------人和机器在同一个认知空间中共同感知、共同判断。钱学森指出,"大成智慧"只是人机结合的初期阶段,因为人机还没有真正合一,只是结合互补而已。而从"灵境"系统开始的这种结合,才是"融合"-。
钱学森在1996年给汪成为的信中进一步设想,人机结合的最终形态是 "人机融合" ------人在机器的帮助下变成"超人"-9-3。他强调,如果存在进化,那进化的一定是人类-9-3。
"融合"意味着什么?意味着机器不再只是一个工具,它要参与到人类的感知和判断过程中来。它要有能力感知情境、评估确定度、判断安全性。它要成为人类判断的延伸,而不是人类指令的执行者。
今天回头看,钱学森的预见有多么精准------
自动驾驶最需要的,恰恰就是这个 "扩展感知" 的能力。不是扩展"看见"的能力------摄像头已经看得够远了。而是扩展"理解"的能力------理解"现在是什么情境、我有多确定、这安不安全"。
而这,正是"灵境"要解决的问题:它不是让人进入虚拟世界,而是让机器进入人的认知世界,和人一起感知、一起判断。
六、把钱学森的方向变成工程
三十多年前,钱学森看到了自动驾驶今天面临的困境的本质------缺乏"扩展感知"的能力,缺乏"人机融合"的判断机制。
他给出了方向:灵境技术将扩展人脑的知觉,使人机从"结合"走向"融合"。
但他没有给出工程路径。不是他不能,而是他那个时代的技术条件不具备------没有大模型、没有端到端神经网络、没有车规级算力芯片。
今天,技术条件已经成熟。我们要做的,就是把钱学森的方向变成工程。
我们构建的"判断力引擎",本质上就是钱学森"灵境"思想的工程化实现。
灵境要"扩展人脑的知觉"------判断力引擎用六十四卦完备态势空间,让机器拥有一个"态势参照系",能够从整体上感知"现在是什么情境"。灵境要实现"人机融合"------判断力引擎用U值(全局认知势)让机器"知道自己知道不知道",在不确定时主动收敛、主动请求人类介入。灵境要"引发一系列震撼全世界的变革"------判断力引擎让自动驾驶第一次拥有了"停下来想一想"的能力,在感知和行动之间插入了一个独立的判断环节。
钱学森说灵境将"大大扩展人脑的知觉"。判断力引擎,正是把这个"扩展"做成了可以运行的代码、可以部署的芯片。
七、结语
今天的自动驾驶,能"看见"一切,却"理解"不了任何事。它能识别行人、车辆、路标,但理解不了"这是一个危险情境"还是"这是一个安全情境"。所以它不敢真正无人化。
三十多年前,钱学森就已经看到了这个问题的本质。他用"灵境"这个词,指向了一个方向:扩展感知,让人和机器在同一个认知空间中共同感知、共同判断。
他管这个叫"人机融合"。
今天,我们终于可以把"人机融合"做成可以运行的代码了。我们给自动驾驶装上了"判断力"------不是让它算得更快,而是让它学会"停下来想一想"。
钱学森说"新的历史时代要开始了"。
对自动驾驶来说,这个时代就是:从"能开"到"敢坐"的时代。