一、一个令人不安的事实
今天的大语言模型,有一个让人细思极恐的特质:
它从不表达"不确定"。
你问它一个它知道的问题,它自信地回答。你问它一个它完全不知道的问题,它同样自信地回答。你问它一个自相矛盾的问题,它依然自信地回答。
它不会说"我不确定",不会说"我没有足够的信息",不会说"这个问题可能有多种答案,我需要更多上下文"。它只会------继续往下说。
这就是"幻觉"的本质。
幻觉不是模型在"撒谎"。撒谎的前提是知道真相而选择隐瞒。幻觉比撒谎更根本------模型自己都不知道自己在编造。它只是按照统计规律,生成了"最有可能出现的下一个词"。对模型来说,正确和错误、真实和虚构、确定和不确定------这些区分不存在。它只有"概率高"和"概率低"。
一个能写诗、能编程、能通过律师资格考试的模型,却不知道自己不知道什么。
这正常吗?
不正常。这恰恰说明:它只有智力,没有智慧。
二、钱学森在三十年前就说过:缺一不成智慧
1993年7月8日,钱学森在给钱学敏教授的信中写下了一段极其重要的话-。他说:
"人的智慧是两大部分:量智和性智。缺一不成智慧!此为'大成智慧学',是辩证唯物主义的。"-
这句话里有三个关键词。
第一,"两大部分"。 钱学森明确说智慧不是单一的东西,它由两个独立的部分组成。少一个都不行。
第二,"缺一不成"。 这四个字分量极重。不是"最好有",不是"锦上添花",而是"缺了就不叫智慧"。
第三,"大成智慧学"。 这不是钱学森随口一说,这是他晚年构建的整个思想体系的核心定义-。
那么,这两部分分别是什么?
"量智" ,钱学森说,主要是科学技术知识,是从局部到整体、从研究量变到质变的知识-。它是逻辑的、分析的、可计算的。今天的大模型最擅长的就是这个------大量数据、统计规律、概率预测。大模型的"智能",本质上就是量智的极致放大-。
"性智" ,钱学森说,是从整体感受入手去理解事物,从"质"上去认识事物-。它是直觉的、整体的、把握全局的。它不是"算"出来的,是"感"出来的-。
钱学森进一步阐述:量智侧重对事物从微观到宏观、从局部到整体、从量变到质变的发展过程去探索其本质和规律;而性智侧重对事物从宏观到微观,从整体的、形象的感受上去认识事物-。
钱学森还特别指出,量智和性智分别对应科学与艺术-。科学知识及科学思维是量智,文艺知识及艺术思维是性智。他反复强调科学与艺术的不可分割性,因为"科学工作总是从一个猜想开始的,然后才是科学论证"------科学工作源于形象思维(性智),终于逻辑思维(量智)。
他总结道:量智和性智相互融合、相互促进,是涌现创新思维和大成智慧的智力基础-。
我们今天回头看,会发现一个惊人的事实:
今天的大模型,只有量智,没有性智。 它把量智推到了极致------千亿参数、万亿token、海量计算------但它依然只有量智。它没有性智,一个都没有。
所以它不是智慧,它只是"量智的极端放大"。
三、为什么"只有量智"会出问题
量智的本质是"从局部到整体"。
大模型是怎么工作的?它看了一万亿个词,统计了词与词之间出现的概率,然后根据这些概率,预测下一个最可能的词。每一步都是"从局部(当前上下文)到整体(整个词表)"的推理。
这完全是量智的范畴。
但问题来了:量智只能处理"已知模式"内的问题。当它遇到已知模式内的输入,它能给出正确答案。当它遇到已知模式外的输入,它依然会用已知模式去"套"------这就是幻觉的来源。
举个例子。大模型在训练数据里见过无数篇关于"如何做红烧肉"的文章,所以它能正确回答。但如果你问它"如何用微波炉煮月亮",它没有见过这个模式,但它依然会按照"如何做某事"的模式,编造出一个流畅的回答。
它不知道"煮月亮"是不可能的事。它没有"从整体感受入手去理解事物"的能力------它感受不到"月亮"和"煮"放在一起是荒谬的。它只是看到了"如何""煮""月亮"这三个词,然后按照统计规律,生成了一篇看起来像模像样的"教程"。
它没有性智,所以它不知道什么是"荒谬"。
钱学森说,性智是"从整体感受入手去理解事物"。这意味着:当一个人听到"煮月亮"时,他不需要任何逻辑推理,瞬间就能判断"这是荒谬的"。这个判断不是算出来的,是"感"出来的。
大模型没有这个能力。它可以算出一万亿个概率,但算不出"荒谬"。
这就是幻觉的根源。
四、更根本的问题:它不知道自己不知道
幻觉还有一个更深层的表现。
当大模型面对一个信息不足的问题时------比如"张三今年多大?"------如果训练数据里没有张三的年龄,模型会怎么办?它会编一个。它不会说"我不知道"。
为什么?因为它的训练目标就是"生成最可能的词",不是"给出正确的答案"。当它面对信息不足时,"最可能的词"就是"编一个看起来合理的数字"。
它不知道"自己不知道"。它没有"确定"和"不确定"的概念。对它来说,所有输出都是等价的------都是"概率最高的那个词"。
这就是"只有量智、没有性智"的必然结果。量智可以算出概率,但算不出"自己算得对不对"。要判断"自己算得对不对",需要一种从整体出发的自我觉察能力------这就是性智的功能。
钱学森把智慧分成量智和性智,不是偶然的。他深刻地认识到:逻辑推理只能告诉你"怎么做",不能告诉你"这样做对不对"。 "对不对"的判断,来自性智------从整体感受入手,把握全局,做出判断。
今天的大模型,有史上最强的量智,但性智为零。所以它只能"算",不能"断"。它能量化一切,却判断不了任何事。
五、钱学森给AI时代留下了一个问题
钱学森在三十多年前就已经预见了这个问题。他划出了量智和性智的边界,指出"缺一不成智慧"。他把量智和性智的融合作为大成智慧学的核心-。
但他当时面对的是人,不是机器。他讨论的是"人的智慧",他讨论的是"人如何培养量智和性智"。
他没有想到,三十年后,人类会造出一个只有量智、没有性智的机器,然后管它叫"人工智能"。
如果他今天还在,他会说什么?
我猜他会说:"你们造了一个只有一半智慧的东西,然后奇怪它为什么出问题------这不是明摆着的吗?"
量智和性智,缺一不成智慧。这是钱学森三十年前就给出的诊断。
六、补上"性智":从"推理力"到"判断力"
我们做的,就是给AI补上"性智"这一半。
我们构建的"判断力引擎",本质上就是一个性智的工程化实现。
性智的功能是什么?钱学森说,是"从整体感受入手去理解事物",是"从质上去认识事物"。判断力引擎做的,正是这件事:
-
它把输入事件映射到六十四卦完备态势空间,从整体上判断当前情境------这不是从局部推理出来的,而是从全局态势中"涌现"出来的。
-
它用U值(全局认知势)度量系统对当前判断的确定度------U值低时确定,U值高时不确定。这让系统第一次有了"知道自己知道不知道"的能力。
-
它在U值超过警戒阈值时触发内生安全降级------不确定的时候,系统主动保守、主动收敛,而不是继续"编下去"。
这就是性智的工程化:整体感知、确定度判断、自我约束。
大模型提供的是量智------推理力。判断力引擎提供的是性智------判断力。
量智负责"怎么做",性智负责"该不该做、能不能做、安不安全做"。
量智和性智,缺一不成智慧。钱学森三十年前就告诉了我们这个道理。我们今天只是在把这个道理,变成可以运行的代码。
七、结语
大模型的幻觉,不是一个工程问题,而是一个结构问题。
不是数据不够多,不是模型不够大,不是算力不够强。是结构上缺了一半------只有量智,没有性智。
钱学森在三十多年前就已经看到了这一点。他说"缺一不成智慧",意思就是:你堆再多的量智,也堆不出智慧。智慧需要两个部分,缺一不可。
今天的大模型,把量智推到了人类历史上从未达到的高度,但性智依然为零。所以它依然不是智慧,它只是"极大量智的集合"。
要解决幻觉问题,不是在量智上继续堆料------堆再多,也堆不出性智。而是要给AI装上性智------装上判断力。
这就是我们正在做的事。