16-2 演绎心理学（AGI基础理论）

《智能的理论》全书转至目录****

不同AGI的研究路线对比简化版：《AGI（具身智能）路线对比》，欢迎各位参与讨论、批评或建议。

从逻辑学的角度看，在演绎推理中，结论的有效性是由推理形式决定的，与推理的具体内容无关。其中，推理形式如"p⟷ ¬¬p"等重言式，推理内容即命题内容，如p="地球是圆的"。但是，大量的演绎推理心理学研究发现，人们在实际推理活动中并不完全依据形式逻辑的相关原理进行推理，他们在实际推理活动中的表现经常受到非逻辑因素的影响，如，推理内容、时间压力等。

一.推理偏差

1.范畴三段论

在三段论推理任务中的反应既受推理的逻辑形式的影响，也受被试已有知识或信念的影响，前者是推理形式，后者是推理内容，这种现象也称之为"内容效应"（Evans和Curtis-Holmes，2005）。所谓内容效应是指面对具有同样逻辑形式的推理问题，当使用不同的具体内容时，人们解决问题的正确率会发生很大变化。信念偏差是指对命题有效性的评估基于一个人是否认同结论，而不是基于命题是否能从前提中逻辑有效推导出的倾向（Evans，2005）。它是演绎推理中内容效应的一种，是指被试基于对推理题目内容的理解，结合原有的知识经验背景而形成一定信念，进而使推理判断发生偏差的认知加工现象

如下任务中，结论有效是指能从前提中推出结论，结论可信是指该结论从人常识的角度来说是一个真命题（如（b）的结论，人们普遍认为香烟都是成瘾物质，因此"一些成瘾物质不是香烟"不可信的）。根据有效性和可信性的结合，可将推理任务分为四种（Evans，Barston和Pollard，1983）：

（a）结论有效并可信推论（无冲突）

前提：没有香烟是便宜的，

一些成瘾物质是便宜的；

结论：因此，一些成瘾物质不是香烟。

（b）结论有效但不可信推论（有冲突）

前提：没有成瘾物质是便宜的，

一些香烟是便宜的；

结论：因此，一些香烟不是成瘾物质。

（c）结论无效但可信推论（有冲突）

前提：没有成瘾物质是便宜的，

一些香烟是便宜的；

结论：因此，一些成瘾物质不是香烟。

（d）结论无效且不可信推论（无冲突）

前提：没有香烟是便宜的，

一些成瘾物质是便宜的；

结论：因此，一些香烟不是成瘾物质

实验中，被试普遍受到结论可信性及结论有效性的双重影响。当有冲突时（即逻辑和信念的冲突，包括：结论有效但不可信，结论无效但可信），被试反应时间变慢，判断准确率下降；当无冲突时被试反应时间更快，准确率更高。

2.语用因素

其中一个例子是，在承诺和威胁条件下使用"如果-那么"的推理形式，如"如果你吃晚饭，那么就会有餐后甜点吃"。这个句子经常在日常对话中用到，虽然表面上这是一个"如果-那么"的条件句，但实际上人们通常会把它当成"仅且如果...，那么..."的推理形式。这句话的意愿很明显，即"如果你不吃晚饭，你就不会有餐后甜点吃"（Byrne，1989）。

3.四色卡问题

通过下面的例1可以发现，具体问题比抽象问题更加简单。一些理论认为，这可能是因为人们利用了关于日常生活的图式解决问题（Cheng和Holyoak，1985）。

例1

（1）抽象问题

问题描述：有四张卡片，每张卡片的一面有一个字母，另一面有一个数字。四张卡片摆放在一起，只能看到其中一面，如图1。实验任务是指出需要翻动哪几张卡片来检验下面的规则："如果卡片的一面是元音字母，则另一面的数字是偶数"。（Wason，1966）

图1

结果与分析：在实验中，有53%的被试指出要翻动卡片E。这是正确的，因为翻动卡片E可以直接检验这条规则。然而，为了全面验证卡片规则，还需要再翻动一张卡片。46%的被试指出，还需要翻动卡片4。这种回答的问题在于，如果数字4卡片的另一面是元音字母，这符合规则，但如果另一面是辅音字母，也不违反规则。因为卡片的一面是辅音字母，另一面是偶数也不违反规则。因此翻动卡片4是无效的。仅4%的被试给出了完全正确的回答，即翻动卡片7。因为如果卡片7的背面是元音字母的话就能证伪该规则。

（2）具体问题

问题描述：四张卡片如图2所示，每张卡片的一面写着年龄，另一面写着饮品名称。假设你是一位警官，正在检查人们是否遵守规则："如果一个人喝啤酒那么此人必须已满19周岁。"那么需要翻动哪几张卡片来检验人们是否遵守了这一规则？（Griggs和Cox，1982）

图2

结果与分析：除了使用日常用语（啤酒、苏打水、年龄）替换掉数字和字母之外，两个版本的四卡片问题完全相同。而实验的结果是有73%的被试做出了正确的回答：需要翻转的卡片"啤酒"和"16岁"。

4.条件推理

条件推理是一种最简单的演绎推理形式。通常是用"如果...，那么..."（If...，Then...）的句型来表达，也就是先给被试呈现一个"如果 P，那么 Q"的大前提，然后呈现四个不同的小前提（P、Q、-P、-Q），以此来让被试判断结论的正确与否。因此条件推理存在四种形式：

（a）肯定前件式（MP）：

前提：如果天下雨了，那么地就会湿。

天下雨了

结论：地湿了。

（b）否定前件式（DA）：

前提：如果天下雨了，那么地就会湿。

天没有下雨

结论：地没有湿。

（c）肯定后件式（AC）：

前提：如果天下雨了，那么地就会湿。

地湿了

结论：天下雨了。

（d）否定后件式（MT）：

前提：如果天下雨了，那么地就会湿。

地没有湿

结论：天没有下雨。

然而，在四种推理形式里面，只有MP 和MT两种推理形式才是逻辑有效的，推理能得出逻辑有效的结论，是有效推论；而DA和AC两种推理形式不能得出唯一逻辑有效的结论，是一种不确定的推理形式，是无效推论，因此，如果接受DA和AC 这两种推理形式也就意味着人们范了逻辑错误。

5.认知反思测试

认知反思测试是用来测量个体反思性推理倾向的测试，经典的球棒和球问题就是CRT的一种。题目内容的大致意思是，一根球棒和一个球总共花了1.1美元，已知球棒比球贵了1美元，请问球多少钱？在回答这一问题时，研究者们发现部分答题人会出于思考便利性原则（De Neys和Pennycook，2019），偏向采用直觉加工，从而落入"逻辑陷阱"，给出的答案为:1.1-1=0.1美元；而采用分析加工的答题人会发现冲突，识破"逻辑陷阱"，给出0.05美元的正确答案（Pennycook，Cheyne，Koehler和Fugelsang，2016）。

二.心理学模型

鉴于这些推理偏差的存在，心理学家提出了很多关于演绎推理的心理模型，主要有以下几种。

1.心理逻辑理论

心理逻辑理论主张人类以命题或语言来表征前提, 并通过对形式规则的操作进行推理。形式规则是关于一些逻辑表达式的心理操作，如将三段论"大前提：pⅤq→r，小前提：p；结论：r"的心理操作化。人类的推理过程包括以下三个组成部分：（1）一组形式规则；（2）一种以形式规则为工具的推理程序，即如何控制一个证明的构造方式，如何选取形式规则并在证明的不同阶段加以运用，如何从上一步骤转入下一步骤；（3）理解成分，推理前将前提解码为某种逻辑形式。通过推理程序的推理后，再将结论转译为前提的内容领域。在这个理论中，推理问题的难度由得出结论所需要的规则数量和每条规则的难度决定，当推理难度过高时，就容易发生推理偏差（Braine和O' Brien，1998；Rips，1994）。

2.心理模型理论

与心理逻辑理论不同，心理模型理论认为，推理不需要应用形式规则，也不使用逻辑命题，而是通过对心理模型的建构与操作实现。心理模型是一个真实的或想象的事件状态的类似表征。这种类似表征即不是命题结构，也不是表象（表象是对事物的知觉信息），但其结构与被表征的事件状态是相似的。虽然心理模型理论不以命题表征为基础，但心理模型理论并不反对命题表征。它把命题表征看成是某种加工的输入，根据这种加工，人们可以建立与言语描述情境相符合的心理模型（Johnson-Laird和Byrne，1991）。在该理论中，心理模型的数量决定了推理问题的难度（Byrne和Johnson-Laird，1989；张小将，刘昌和刘迎杰，2010）。

心理模型的推理包含三个阶段。第一，理解阶段，即人们利用他们自己已经掌握的语言知识和一般知识理解前提，即建构一个与前提描述相符的心理模型；第二，描述阶段，人们试图在已建构的心理模型中寻找某个有待证明的结论，如果没有结论，那么，他们就会做出"不存在有效结论"的判断。如果存在有待证明的结论，则进入第三阶段；第三，有效检验阶段，人们会构建其他符合前提的可能模型对该结论进行证伪，如果无法对该结论证伪，那么就会接受该结论。否则，人们就会重新返回到第二个阶段，去看在他们建构的所有的模型中是否存在其他有待证明的结论，如此反复进行下去，将所有可能的模型穷尽（Johnson-Laird，1983；Johnson-Laird和Byrne，1991）。

下面通过两个例子对心理模型理论作出说明。

例2

前提"所有养蜂人都是艺术家"和前提"没有化学家是养蜂人"能得出什么结论呢？首先，推理者理解第一个前提，并建构如下直观形式（见左列）；把第二个前提的信息加入这一直观形式中，于是构成了一个包容两个前提的模型（见中列）。在第二阶段，根据中列被试可能会得出这样的结论"没有化学家是艺术家"（当然也可能得出其他结论）；然而在第三阶段，进行有效性检验时，所构建的其他模型可能会搜索到反例（有些人搜索到，有些人搜索不到）（见右列，同样符合前提）。当遇到反例时，返回第二阶段，被试可能会得出这样的结论"一些化学家不是艺术家"...（刘茨，2002）。

添加图片注释，不超过 140 字（可选）

（括号中内容指不是养蜂人的艺术家，它是有可能存在的）

（整个推理过程无须运用任何逻辑规则）

例3

空间推理是涉及空间领域的推理，它是演绎推理中关系推理的一种特殊形式，通常要求从描述空间关系的前提中推出隐含其中的结论。空间推理问题可以分为确定问题和不确定问题。确定问题只有一种心理模型（如问题 1和2），也被称为单模型。不确定问题至少有两种或两种以上的心理模型（如问题3和4），也被称为多模型问题。无论是确定问题还是不确定问题，都可能包含对结论没有影响的无关前提（如问题1和3中的第一条前提）。在不确定问题中，有些问题可以从前提中得到结论（如问题3）, 而有些问题无法从前提中得到结论（如问题4）。Byrne与Johnson-Laird (1989) 比较了推理的步骤数量（即心理逻辑理论的推理程序）和模型数量在推理问题的难度方面的差异。研究结果表明, 多模型问题比单模型问题更难，而需要更多推理步骤的问题并不比需要更少步骤的问题难，因此证明了推理的前提表征是心理模型而非命题（张小将，刘昌和刘迎杰，2010）。如图3。

图3

3.双重加工过程

心理逻辑理论和心理模型理论的主要关注点在于前提的表征形式，前者认为前提表征是逻辑命题，后者认为是心理模型。双重加工模型则不同，它关注的是系统1和系统2在推理过程中的作用。有大量关于双重加工的研究，下面列举几种主要的模型，默认干预模型、平行竞争模型、逻辑直觉模型和三阶段双重加工模型（艾炎和胡竹菁，2018）。

4.默认干预模型

该模型是Evans和Stanovich（2013）提出的。如图4，在这一模型中，系统1（T1）对应直觉加工，根据结论的可信性判断推理正确性。其特点是加工是快速的，不需要努力的，且不需要工作记忆资源；系统2（T2）对应反思性加工，通过推理的有效性判断推理正确性。其特点是加工则是慢速的，需要工作记忆资源的。这一模型假设：推理过程中直觉加工先被激活，并产生一个默认结论，如果反思性加工不进行干预，默认结论将被确认；若反思性加工加以干预，基于直觉加工的默认结论就可能被否定掉，并由基于反思性加工生成的结论所取代。Evans认为人类推理中的偏差的产生，是由于人们大部分的行为受直觉加工所控制。只有当反思性加工介入干预才能修改默认的直觉结论，而反思性加工是否介入受多种因素影响，如完成困难程度、任务的新奇程度，工作记忆资源的多少、时间压力以及个人认知倾向等。

该模型得到如下实验的验证（Evans和Curtis-Holmes，2005）。在实验中，让被试完成四类三段论推理任务：有效可信、有效不可信、无效可信以及无效不可信。比较被试在有时间限制和无时间限制两种条件下的表现，结果发现相比无时间限制组，有时间限制组内容效应反应增加，逻辑反应减少（即被试根据推理有效性的判断减少，根据结论可信性的增多）。根据默认干预模型的假设：T1 加工是快速的，不需要努力的，且不需要工作记忆资源；而T2加工则是慢速的，需要工作记忆资源。被试在大部分的推理任务中，T1 阶段首先快速的产生一个有偏差反应（根据可信性），而限制反应时间抑制了反思性加工的参与（有效性），使被试没能成功修改偏差反应。

图4

5.平行竞争模型

Handley和Trippas（2015）认为在T1阶段中人们基于知识信念和基于问题逻辑结构的加工是同时激活的，但根据命题复杂程度其中一个加工会被抑制。对于复杂命题，以知识信念为基础的加工快于基于问题逻辑结构的加工。此时，T2加工会抑制T1中的直觉逻辑的反应，并产生基于知识信念的反应；对于简单问题，直觉逻辑加工快于基于知识信念的加工。此时，T2加工会抑制T1中的知识信念反应，并产生基于问题逻辑结构的反应。如图5。

图5

根据平行竞争模型，直觉加工和分析加工是同时被激活的，当两者的反应结果一致时就没有冲突产生，个体可以直接快速做出判断给出反应。但是当两者反应结果不一致时，个体就会检测到冲突，从而处于冲突状态，难以得出最终答案，导致反应变慢（Stupple和Bal，2008）。另外，只要冲突客观存在，个体就可以检测到冲突，但分析加工的参与并不意味着可以纠正直觉加工产生的错误反应。

6.三阶段双重加工模型（Pennycook，Fugelsang和Koehler，2015）

该模型包含三个阶段，如图6：

（a）第一阶段，在T1阶段，多种"直觉"反应被产生，这些反应不需要工作记忆或执行功能。"直觉"反应之间可能存在着冲突和矛盾，且一些反应可能会比另一些更快、更流畅。比如人格描述诱发的刻板印象与比率信息引发的反应就可能存在矛盾与冲突，但由于两者信息强度的不同，刻板印象反应更快、更流畅。

（b）第二阶段，是对初始阶段T1反应间的冲突进行探查，如果没有探查到冲突（可能不存在冲突, 或是冲突探查失败），初始阶段的反应继续进入第三阶段，T2加工粗略地对此分析并接受这一反应。这一过程畅通无阻且几乎不需要认知努力。但如果探查到了冲突, 那么T2的分析性加工就会介入其中。

（c）第三阶段，有两种不同的T2加工过程，分别是合理化和解耦。合理化是T2加工的一种形式，当探查到冲突时，推理者没有仔细思考，就致力于去证明或论证初始加工，于是就给出直觉反应。这也可以解释在很多的研究中尽管被试明显增加了T2加工的时间，但依然给出偏差反应。这很可能是因为被试花费了许多时间合理化刻板反应。T2加工的第二种形式是解耦，这是最典型的分析性加工，在过去的研究中占了主导地位。解耦是对直觉反应进行抑制, 并逆转和修改它，最终产生替代性的反应。该过程有两种可能：其中一种反应被选择，其余反应被抑制；另一个是新的反应产生。

图6

7.逻辑直觉模型

随着双加工理论的发展，研究者们始终无法解释为什么个体可以在直觉反应阶段产生基于逻辑规则的反应结果。这个问题引导着研究者们提出的理论模型不再局限于直觉加工和分析加工两个过程，Pennycook等人（Pennycook，Fugelsang和Koehler，2015）提出的三阶段模型就引入了冲突检测作为一个新的阶段介于直觉加工和分析加工之间。并开始发现传统双加工理论中对直觉加工和分析加工的二分似乎并不是不可动摇的，他们开始思考传统双加工理论对于直觉加工和分析加工的特征描述可能并不是完全绝对的，这让原本水火不容的直觉加工和分析加工变得可以交融了起来。也正是如此，一些原本难以解释的问题随着直觉和分析加工的壁垒打破而变得清晰，逻辑直觉就是在这个背景下破壳而出的。

逻辑直觉模型是De Neys（2012；2014；2015）提出的，其核心的思想是直觉反应阶段会包含两种直觉反应，其中一种是基于信念、刻板印象的传统启发式直觉，这也是传统双加工理论中对直觉加工的描述；另外一种是基于逻辑规则的逻辑直觉，也就是个体可以在直觉阶段得出基于逻辑规则的结果的原因。如图7所示，逻辑直觉模型认为所有个体都会拥有这两种直觉，只是在解决问题时每个个体的启发式直觉和逻辑直觉的强度是不同的，所以冲突最先发生在直觉反应阶段，这两种直觉会先产生冲突，当冲突无法被解决时，分析加工才会介入并进行干预，生成最终的反应。当两者出现矛盾冲突时，个体会对直觉启发式反应产生疑问感。但人们并不能说不清这种疑问感是怎么回事，也解释不了他们为什么会对他们的答案有疑问。而且两种直觉的强度差异越小，冲突就会越剧烈，分析加工介入后初始反应也越可能被改变，反之，强度差异越大，冲突敏感性就会越低，分析加工介入的程度也越低，保留最初反应的概率也越大。逻辑直觉模型融合了之前几种双加工理论模型的观点，其遵循了默认干预模型先是直觉加工阶段再是分析加工阶段的序列模式，同时在直觉加工阶段又吸纳了平行竞争模型(新平行加工模型)和三阶段模型的理论，认为两种直觉是同时被激活的，只是强度的不同导致了最后得到的直觉反应不同。逻辑直觉模型不同于其他几种模型的关键在于其认为个体对逻辑规则的判断不是在分析加工阶段才产生的，而是在直觉加工阶段中以逻辑直觉的形式出现，这一观点弥补了其他模型无法解释在直觉反应阶段为什么个体可以做出基于逻辑结构的反应的漏洞。

图7