大模型的“幻觉”，钱学森三十年前就解释过了

一、一个令人不安的事实

今天的大语言模型，有一个让人细思极恐的特质：

它从不表达"不确定"。

你问它一个它知道的问题，它自信地回答。你问它一个它完全不知道的问题，它同样自信地回答。你问它一个自相矛盾的问题，它依然自信地回答。

它不会说"我不确定"，不会说"我没有足够的信息"，不会说"这个问题可能有多种答案，我需要更多上下文"。它只会------继续往下说。

这就是"幻觉"的本质。

幻觉不是模型在"撒谎"。撒谎的前提是知道真相而选择隐瞒。幻觉比撒谎更根本------模型自己都不知道自己在编造。它只是按照统计规律，生成了"最有可能出现的下一个词"。对模型来说，正确和错误、真实和虚构、确定和不确定------这些区分不存在。它只有"概率高"和"概率低"。

一个能写诗、能编程、能通过律师资格考试的模型，却不知道自己不知道什么。

这正常吗？

不正常。这恰恰说明：它只有智力，没有智慧。

二、钱学森在三十年前就说过：缺一不成智慧

1993年7月8日，钱学森在给钱学敏教授的信中写下了一段极其重要的话-。他说：

"人的智慧是两大部分：量智和性智。缺一不成智慧！此为'大成智慧学'，是辩证唯物主义的。"-

这句话里有三个关键词。

第一，"两大部分"。 钱学森明确说智慧不是单一的东西，它由两个独立的部分组成。少一个都不行。

第二，"缺一不成"。 这四个字分量极重。不是"最好有"，不是"锦上添花"，而是"缺了就不叫智慧"。

第三，"大成智慧学"。 这不是钱学森随口一说，这是他晚年构建的整个思想体系的核心定义-。

那么，这两部分分别是什么？

"量智" ，钱学森说，主要是科学技术知识，是从局部到整体、从研究量变到质变的知识-。它是逻辑的、分析的、可计算的。今天的大模型最擅长的就是这个------大量数据、统计规律、概率预测。大模型的"智能"，本质上就是量智的极致放大-。

"性智" ，钱学森说，是从整体感受入手去理解事物，从"质"上去认识事物-。它是直觉的、整体的、把握全局的。它不是"算"出来的，是"感"出来的-。

钱学森进一步阐述：量智侧重对事物从微观到宏观、从局部到整体、从量变到质变的发展过程去探索其本质和规律；而性智侧重对事物从宏观到微观，从整体的、形象的感受上去认识事物-。

钱学森还特别指出，量智和性智分别对应科学与艺术-。科学知识及科学思维是量智，文艺知识及艺术思维是性智。他反复强调科学与艺术的不可分割性，因为"科学工作总是从一个猜想开始的，然后才是科学论证"------科学工作源于形象思维（性智），终于逻辑思维（量智）。

他总结道：量智和性智相互融合、相互促进，是涌现创新思维和大成智慧的智力基础-。

我们今天回头看，会发现一个惊人的事实：

今天的大模型，只有量智，没有性智。 它把量智推到了极致------千亿参数、万亿token、海量计算------但它依然只有量智。它没有性智，一个都没有。

所以它不是智慧，它只是"量智的极端放大"。

三、为什么"只有量智"会出问题

量智的本质是"从局部到整体"。

大模型是怎么工作的？它看了一万亿个词，统计了词与词之间出现的概率，然后根据这些概率，预测下一个最可能的词。每一步都是"从局部（当前上下文）到整体（整个词表）"的推理。

这完全是量智的范畴。

但问题来了：量智只能处理"已知模式"内的问题。当它遇到已知模式内的输入，它能给出正确答案。当它遇到已知模式外的输入，它依然会用已知模式去"套"------这就是幻觉的来源。

举个例子。大模型在训练数据里见过无数篇关于"如何做红烧肉"的文章，所以它能正确回答。但如果你问它"如何用微波炉煮月亮"，它没有见过这个模式，但它依然会按照"如何做某事"的模式，编造出一个流畅的回答。

它不知道"煮月亮"是不可能的事。它没有"从整体感受入手去理解事物"的能力------它感受不到"月亮"和"煮"放在一起是荒谬的。它只是看到了"如何""煮""月亮"这三个词，然后按照统计规律，生成了一篇看起来像模像样的"教程"。

它没有性智，所以它不知道什么是"荒谬"。

钱学森说，性智是"从整体感受入手去理解事物"。这意味着：当一个人听到"煮月亮"时，他不需要任何逻辑推理，瞬间就能判断"这是荒谬的"。这个判断不是算出来的，是"感"出来的。

大模型没有这个能力。它可以算出一万亿个概率，但算不出"荒谬"。

这就是幻觉的根源。

四、更根本的问题：它不知道自己不知道

幻觉还有一个更深层的表现。

当大模型面对一个信息不足的问题时------比如"张三今年多大？"------如果训练数据里没有张三的年龄，模型会怎么办？它会编一个。它不会说"我不知道"。

为什么？因为它的训练目标就是"生成最可能的词"，不是"给出正确的答案"。当它面对信息不足时，"最可能的词"就是"编一个看起来合理的数字"。

它不知道"自己不知道"。它没有"确定"和"不确定"的概念。对它来说，所有输出都是等价的------都是"概率最高的那个词"。

这就是"只有量智、没有性智"的必然结果。量智可以算出概率，但算不出"自己算得对不对"。要判断"自己算得对不对"，需要一种从整体出发的自我觉察能力------这就是性智的功能。

钱学森把智慧分成量智和性智，不是偶然的。他深刻地认识到：逻辑推理只能告诉你"怎么做"，不能告诉你"这样做对不对"。 "对不对"的判断，来自性智------从整体感受入手，把握全局，做出判断。

今天的大模型，有史上最强的量智，但性智为零。所以它只能"算"，不能"断"。它能量化一切，却判断不了任何事。

五、钱学森给AI时代留下了一个问题

钱学森在三十多年前就已经预见了这个问题。他划出了量智和性智的边界，指出"缺一不成智慧"。他把量智和性智的融合作为大成智慧学的核心-。

但他当时面对的是人，不是机器。他讨论的是"人的智慧"，他讨论的是"人如何培养量智和性智"。

他没有想到，三十年后，人类会造出一个只有量智、没有性智的机器，然后管它叫"人工智能"。

如果他今天还在，他会说什么？

我猜他会说："你们造了一个只有一半智慧的东西，然后奇怪它为什么出问题------这不是明摆着的吗？"

量智和性智，缺一不成智慧。这是钱学森三十年前就给出的诊断。

六、补上"性智"：从"推理力"到"判断力"

我们做的，就是给AI补上"性智"这一半。

我们构建的"判断力引擎"，本质上就是一个性智的工程化实现。

性智的功能是什么？钱学森说，是"从整体感受入手去理解事物"，是"从质上去认识事物"。判断力引擎做的，正是这件事：

它把输入事件映射到六十四卦完备态势空间，从整体上判断当前情境------这不是从局部推理出来的，而是从全局态势中"涌现"出来的。
它用U值（全局认知势）度量系统对当前判断的确定度------U值低时确定，U值高时不确定。这让系统第一次有了"知道自己知道不知道"的能力。
它在U值超过警戒阈值时触发内生安全降级------不确定的时候，系统主动保守、主动收敛，而不是继续"编下去"。

这就是性智的工程化：整体感知、确定度判断、自我约束。

大模型提供的是量智------推理力。判断力引擎提供的是性智------判断力。

量智负责"怎么做"，性智负责"该不该做、能不能做、安不安全做"。

量智和性智，缺一不成智慧。钱学森三十年前就告诉了我们这个道理。我们今天只是在把这个道理，变成可以运行的代码。

七、结语

大模型的幻觉，不是一个工程问题，而是一个结构问题。

不是数据不够多，不是模型不够大，不是算力不够强。是结构上缺了一半------只有量智，没有性智。

钱学森在三十多年前就已经看到了这一点。他说"缺一不成智慧"，意思就是：你堆再多的量智，也堆不出智慧。智慧需要两个部分，缺一不可。

今天的大模型，把量智推到了人类历史上从未达到的高度，但性智依然为零。所以它依然不是智慧，它只是"极大量智的集合"。

要解决幻觉问题，不是在量智上继续堆料------堆再多，也堆不出性智。而是要给AI装上性智------装上判断力。

这就是我们正在做的事。