《智能的理论》全书转至目录****
不同AGI的研究路线对比简化版:《AGI(具身智能)路线对比》,欢迎各位参与讨论、批评或建议。
我们在日常生活中每天都要面临一个又一个的问题。学生面对的问题是怎样完成家庭作业,我们面对的问题是晚饭吃什么,怎样组织一个聚餐晚会,春节买什么酒,当吸尘机坏了时如何修理。问题几乎无处不在。
一.基本概念
1.定义
Anderson曾经说过:"问题解决被定义为任何指向目标的认知操作程序"(Anderson,1980)。问题解决起始于一个问题的表述,从表述中得到问题开始时的情景称为"初始状态";而问题需要达到的情景称为"目标状态";从起始状态到目标状态的过程称为解决程序,它包括问题解决的算子和限制条件两方面。算子即,从问题中的一个状态转变到另外一个状态的行为。限制条件是解决问题过程中对算子的限制。可分为物理的限制和人为规则的限制,比如物体不能瞬间从一个地方移动到另外一个地方,这是物理限制;驾驶汽车需要遵守交通规则,这是人为规则的限制(Newell和Simon,1972)。以"从家里到公司"为例说明这些概念,假设你定了一个"从家里如何去公司"的问题。这时,"在家里"是这个问题的初始状态,"在公司"是目标状态,"乘车"、"开车"和"步行"等是解决程序的算子,而花费时间不能太长是解决问题的限制条件。
目标状态由个体的动机系统产生。那起始状态如何确定呢?一个个体在同一个时刻有多个状态,如身高178cm,体重60公斤,位置在家里。但不是所有的状态都能作为起始状态。仅与目标状态在同一维度上的状态才能作为起始状态。如"在家里"和"在公司"都是关于个体的位置的维度,因此"在家里"才被选为起始状态。
2.构成成分(程良道和廖洁敏,2002)
问题解决一般由认知、态度和操作三种成分构成。认知成分是指问题解决者对问题的理解、表征、及对问题解决的评价、监控等认知活动。态度成分是指问题解决者接受问题,并愿意采取各种策略和方法,努力解决问题的态度。它包括动机、情感、意志等具有动力性的心理活动。操作成分是指问题解决者的操作活动。
例如:一位猎人带着一匹狼、一只羊和一筐白菜过河(羊会吃菜,狼会吃羊),如果每次过河猎人只能带一种东西,那么猎人该怎样顺利地过河?该问题的认知成分是理解该问题的初始状态(由一位猎人、一匹狼、一只羊、一筐白菜、河组成的问题情境),目标状态(猎人要顺利地过河)和心理表征(猎人、狼、羊、白菜、河之间的关系,制约条件及所要达到的目标);态度成分是猎人愿意解决这个问题并相信自己有能力解决这一问题;操作成分是猎人把这一问题的解决过程明确地说出来、写出来或做出来。
3.问题类型
对于不同类型的问题,其解题特点有所不同,因此分析问题类型是有意义的。划分一个问题种类的维度主要有3个,分别是知识需求、定义信息和目标信息,可以通过例1进行说明(Robertson,2001)。
例1
(a)做一个原函数的反函数。
(b)解方程:3(x+4)+x= 20
(c)圆点排列问题(图1):对第一行圆点重排,使其变为第二行。其中,一个圆点只能移到相邻的空位上,且一个圆点只能跳过另一种颜色的一个圆点。白色圆点只能向右移,灰色圆点只能向左移。

图1
(d)16根火柴棍如图2左的摆放方式构成5个正方形。要求移动其中的3个火柴棍形成 4个正方形(答案在图2右)。

图2
(e)我怎样写一本任何人都能看懂的问题解决的教科书?
(f)政府应该采用什么政策减少犯罪?
(1)知识需求
如果一个问题需要大量的知识储备,那么这类型的问题称为"知识丰富型"问题。如例1(a)需要有一定的数学知识;例(e)需要有关于问题解决相关的心理学、计算机科学和神经科学的知识;例(f)需要犯罪诱因方面的知识,可能还涉及到政治学、社会学、犯罪法规、心理学等方面。对于这方面的问题,如果你有这方面的知识,那么问题解决起来就很简单。如果您是一个新手,就会感到非常困难。例(c)和例(d)所有的规则都表明在问题中,无需额外知识,这类型的问题称为"知识贫乏型"问题。例(b)需要少量很简单的一些数学知识,处于知识丰富型和知识贫乏型之间。
(2)定义信息
问题本身限定了解决问题的全部算子和限制条件,这样的问题就是"定义明确"问题。例1(c)和例(d)就是定义明确问题,其起始状态和目标状态清晰,问题的算子清晰(如例(c)的"一个圆点只能移到相邻的空位上"),限制条件清晰(如例(d)的"不能移动3根以上的火柴")。当问题本身不提供任何问题规则,也无明确限制条件时。这类问题就是"定义不明确"问题。如例(e)和例(f)并无告诉我们怎么去做,解决这类问题需要额外的知识作为解题规则和限制条件。对于例(b),如果你已经知道"加号"、"括号"等运算符号的意义,那么这就是一个定义明确问题,反之则不是。当然,也可能存在一些中间状态,即仅给出部分规则和部分限制条件。
(3)目标信息
即目标状态是否明确。例1(c)的目标在问题中是明确给出的,因此是目标清晰,另外"从家里去上班"的目标状态也是清晰,即"在公司"。例(b)和例(d)的有标准答案,但它们不像例(c)在问题中直接展示出来,需要在完成解题后得到。例(e)和(f)是目标不清晰的问题,因为它们没有标准答案,并且很难对给出的答案作出标准评价。
二.问题表征
表征问题就是分析问题和理解问题。包括分析问题的起始状态、中间状态和目标状态,了解问题的算子和各种约束条件,通过算子和约束条件发现状态与状态之间的联系。一个充分的表征应该至少能令你明白如何采取行动,并开始向目标进发。好的表征有助于问题解决,不好的表征则妨碍问题解决。问题表征在问题解决之前并非一定是完全的,如果你对问题已经有了完全的表征,那么你也就没问题了(姜子云和邓铸,2008;Robertson,2001)。为了更清楚的说明问题表征,先从问题空间开始。
1.问题空间(Newell和Simon,1972)
(1)定义
在解决问题时,可能会有很多方法到达目标,即从起始状态到目标状态的不同路径,而这些路径上又有很多中间状态。状态之间的转移需要在算子和限制条件的约束下进行。所有的这些路径和状态合起来叫作问题空间。
下例2用河内塔问题进行说明,图3(a)左边所示的是问题的开始状态(图4中的状态1),其右边所示的是目标状态(图4中的状态20)。在算子和限制条件下所得到的其他状态是中间状态(图4中的其他状态)。其中,算子是图3(b)的规则(a),限制条件是图3(b)的规则(b)和规则(c)。从图4中可见,从初始状态到目标状态的路径有很多,比如1->2->4->6->10->12->16->20;也可以是1->3->5->9->11->14->18->24->23->22->21->20或1->3->5->9->8->7->6->10->12->16->20,...。从路径的长度看,第一条路径是最优的。图显示了所有路径和所有状态之间的转移,该图也是该问题的问题空间(Kotovsky,Hayes和Simon,1985;Dunbar,1998)。
例2
河内塔问题。将图中左柱的3个圆盘转移到右柱上(如图3(a),从起始状态到目标状态),其中规则如下:
(a)圆盘可以从一个柱移动到另一个柱上,但一次只能移动一个。
(b)圆盘上面没有其他圆盘时才能移动。
(c)大的圆盘不能放在小的圆盘上面。

图3

图4
(2)问题空间的分析
河内塔问题是一个知识贫乏、定义明确和目标清晰的问题。该问题的路径数量和目标状态都是有限的。如果解决一个问题的路径(方法)有无限种,或者目标状态有无限种(比如"写一本任何人都能看懂的问题解决的教科书"),这类型的问题空间显然是无穷大的。当然,路径有限,目标状态有限,其状态空间的复杂度也可能是非常高的,比如围棋状态空间的复杂度为3361。
对于很简单的问题,如果该问题的问题空间有限且很小(比如工作记忆以下)。那么在这种情况下,个体能站在上帝视角,知晓各种解决方法和中间状态,清楚里面的各种算子和限制。但现实情况是,绝大部分问题的问题空间是很难被我们穷尽的。一个原因是个体解决问题的方法或手段有限;二是如果状态空间很大甚至无穷大,它会导致记忆资源的枯竭。因此,被我们表征的并不是问题空间,问题空间只是描述问题的一种理想化模型。
2.问题空间到问题表征
问题空间是关于问题的一种理想化模型,它包括从起始状态到目标状态的所有路径。而现实中,人们解决问题时的心理表征可能会是这样:(a)知晓某一种或几种正确路径;(b)知晓一种或几种错误的路径(即这些路径无法到达目标状态);(c)知晓一些正确路径和错误路径;(d)仅知晓某些状态到另外一些状态的子路径(如图4中的"1->2->4->6")。当然,这些子路径可能是正确的,也可能是错误的;(e)没有任何解决办法(包括没有错误的解决方法)。这些问题解决的心理表征都是问题表征,如图5。

图5
一个问题解决的路径可能由多个状态组成(如路径"1->2->4->6->10->12->16->20"由8个状态组成),由于记忆容量是有限的,很多时候我们只能注意到这个路径的某些路段(如"2->4->6")。换句话说,在某一时刻,你的工作记忆可能仅存储着两三个先前状态,焦点上的问题状态是当前正在活跃的认知状态(Robertson,2001)。
另外,问题表征不一定在问题解决开始前就构建完毕,而也可能是在解决问题的过程中动态构建。比如,我们不可能一开始就知道河内塔问题的最佳路径"1->2->4->6->10->12->16->20",这条路径可能是被我一步步试出来的。就如同人走在迷宫中一样,有些路必须走过才知道迷宫中的道路是怎么样的,哪里有分岔路,哪里有死路。
在路径探索的过程中,每一步骤的结果都会提供反馈信息。这种反馈信息会导致问题表征的改变。假如在一台并不熟悉的电视上寻找某个频道,上面有两个按键分别为"-P"和"+P"。这时,你面临着两个选择:按"-P键"和按"+P键"。这个就是你目前的问题表征。根据这个表征你可以采用试误法,即按其中一个键。当按"+P键"时,一个新频道出现了,且屏幕左上方标有频道号码,这个号码比原有号码大一个数字,因此你可能推测出"+P键"以升序调出频道。因此,仅使用一次试错法就足以使你对问题重新表征。又通过试错法,得出按"-P键"是以降序调出频道。另一方面,如果按按键的策略失败了,即屏幕上什么也没变化,这时你或许改变问题表征,比如找遥控器或找个熟悉这台电视的人(Robertson,2001)。
3.问题表征的形式
(1)信息形式
问题表征的信息形式包括符号、图形等(Matlin,2014)。不同的信息形式适合不同的问题,一般来说,如果需要演绎推理来解决问题,则使用符号表征;而需要表象操作解决问题,则使用图形表征。
(a)符号
符号是一种有效的问题信息形式。如下例3使用的二元方程解决问题(方程是使用符号表示的)。
例3
Mary的年龄比Susan的年龄的两倍少10年。5年后,Mary将比Susan大8岁。请问Mary和Susan分别多大。
解
设x为Mary的年龄,y为Susan的年龄。可以得方程组:
x=2y-10
x+5=y+5+8
解方程得x=26,y=18。
(b)图形
即便问题用文字陈述,但是在解决问题时人们会根据文字的表述在大脑中构建起图形表象,甚至产生一些在问题陈述中没有的信息。例如,设想有一个矩形,四个顶点分别以a、b、c、d表示。长边是短边的两倍,从a到c是一条对角线,还有一条竖线ef连接两条长边的中点。现在问对角线ac与竖线ef是否相交?由于这些信息在被试的表象中被构建出来,因此被试能回答"是"。但是"相交"是问题陈述所没有的,即该信息是被试在表象操作中另外得到的新信息。下面再添加一条线bf,表象中能否看到bf与ac相交?该例的答案如图6所示(被试不能画图,只能在脑中想象)(Simon,1983)。

图6
(c)混合模式
有很多情况是,两种形式同时出现。如例4所示,这是一道小数数学题。在阅读题目的时候,会不自主的构建起问题的场景表象,并抽象出符号进行解题。
例4
在一条河的旁边,河水以5英里/小时的速度流过。在上游1英里处有一个木筏在随波逐流而下,上面有两个无助的男孩。在下游1英里处,孩子的父母正乘着木筏,朝着上游的方向救他们。假设孩子父母能以4英里/小时的速度前进,那么经过多长时间才能到达孩子们身边?(Hayes,1998)
(2)情景形式
在解决问题的时候,个体通常会将表征设定在问题表述的情景中,并且在情景中进行操作。如例5,在解决"残缺棋盘问题"时,对问题的反应一般为使用试错的方式"操作多米诺骨牌摆放棋盘"。因此很少会注意到"一张多米诺骨牌占一个黑方格和一个白方格"这一关键解题特征。"舞池问题"与"残缺棋盘问题"是"异形同构问题",即虽然它们的表述完全相反,但它们有同样的解题结构,即利用相同结构的关键特征解决问题(舞池问题的关键特征为"一个男人和一个女人配对,有30个女人和32个男人,因此62人无法完全组成异性舞伴"),如例6。这两个问题相比,显然舞池问题要更加简单。这是因为,用于解决问题的关键特征,就在问题表征所在的情景中。
例5
残缺棋盘问题。
(a)问题描述
假设有张棋盘,上面有64个黑方格和白方格。还有32张多米诺骨牌,每张多米诺骨牌在棋盘上占两个方格,这样就可以用32张骨牌摆满整张棋盘。现在,假设把棋盘上一条对角线的两个方格去掉,得到62个方格,如图7。问,怎样才能用31张多米诺骨牌摆满这62个方格呢?(Kaplan和Simon,1990)

图7
(b)结论与分析
在解决这个问题时,你可能会动手尝试如何在棋盘上摆多米诺骨牌。过了一会你就会发现有很多摆放方式,以至于你无法记住所有摆放方法。事实上,正确的方法是需要注意到一个关键特征,即"一张多米诺骨牌要占一个黑方格和一个白方格。如果有31张多米诺骨牌,这些多米诺骨牌就应该占31个黑方格和31个白方格"。但是,现在只有30个黑方格和32个白方格,所以你无法用31张多米诺骨牌摆放。该问题无解。
例6
舞池问题
在舞池中,有32对舞伴,包括32个男子和32个女子。如果其中的两个女子离开,剩下的62个人能完全组成异性舞伴吗?(Gick和McGarry,1992)
4.顿悟问题与非顿悟问题
(1)非顿悟问题
"非顿悟问题",又称常规性问题或分析性问题。对于这类问题通常一开始人们就会朝向"他所认为正确"的方向努力,其解决过程是渐进发生、逐渐接近目标的,既从初始状态按部就班的通往目标状态(吕凯,2014)。这种过程称为常规性分析。如下例7就是非顿悟问题,即使不能立即给出答案,也能按部就班的解决。
例7
(a)231*31=?
(b)组织一个家庭聚会。
(c)从深圳到华山旅游。
(2)顿悟问题
顿悟问题无法通过常规性分析进行解答,而需要通过"灵感的闪现"获得问题的解决方法。对于非顿悟问题,人们常常能够意识到自己离正确答案越来越近;而对于顿悟问题来说,则没有这种逐渐累加的感觉,问题答案是突然出现在面前的。残缺棋盘问题就是一个顿悟问题。
顿悟主要包括两个部分,一是,在问题解决过程中,存在明显的问题表征的转化和重构;二是,在解题过程中伴随着强烈、突然的顿悟体验。传统意义上对于顿悟体验的定义是伴随着题解闪现所产生的惊奇感,表现为"啊哈体验"(Gick和Lockhart,1995)。顿悟问题解决共分为具体五个阶段:初始表征阶段、问题空间搜索阶段、僵局阶段、表征重组阶段以及题解闪现阶段。初始表征阶段是个体对问题空间中初始状态和目标状态等信息进行表征的过程,但该阶段的初始问题表征通常是无效的(否则个体就能按部就班的解答,属于非顿悟问题了);问题空间探索阶段是 个体对当前问题进行求解的过程,由于前一阶段的表征在顿悟问题中是错误的,这也导致该阶段的前进方向是错误的;僵局阶段是个体在求解过程中由于思维定式等原因,陷入僵局的过程。在该阶段个体无法解决问题;表征重组阶段则是突然地打破之前形成的僵局,对问题表征进行重新建构;题解闪现阶段,对问题表征的重建使个体对问题有一种突然性的理解,问题的答案往往是突然闪现在个体面前的(Gick和Lockhart,1995)。题解闪现阶段往往伴随着顿悟体验的产生。有学者认为,顿悟体验是区别顿悟与否最核心的特征(Ash和Wiley,2006; Weisberg,2013)。
(3)预热判断
大量实验表明,顿悟问题解决过程和非顿悟问题解决过程存在许多不同之处。例如,Metcalfe和Weibe(1987)采用预热判断技术,比较了非顿悟问题与顿悟问题中的体验。所谓预热判断,是指要求被试在问题解决过程中定期对离问题最终解决还有多少距离(还需多少步骤)进行主观判断。结果发现,被试在非顿悟问题解决中的判断很准确,即预热判断结果能够预测问题解决过程;但在顿悟问题中,预热判断结果却无法预测解决过程,被试通常在顿悟产生前的短暂时刻,才能预测到问题解决的发生。
三.非顿悟问题的解决(Robertson,2001;Simon,1983)
这类解决方法出现在非顿悟问题或顿悟问题的初始表征阶段中。主要有以下几种。
1.算法式策略
算法式策略是一种系统化的方法,用于解决问题时将所有可能的解决方案逐一尝试,直到找到正确答案。这种策略的特点是有规则、有固定的操作步骤,尽管可能耗时较长,但可以保证成功。一个算法式的简单例子是"找数个苹果中找到最好的一个",方法是每个苹果的看一次。
2.假设-检验法
顾名思义,这种方法先进行假设,然后再判断行为结果是否符合假设。符合即假设成立,反之则假设不成立。通过下例8进行说明。这个问题的一种解决方法是,为每个字母假设任意一个数字,并代入公式进行检验。当发生矛盾时就重新安排字母和数字之间的配对,再重新代入公式计算。如指定0=O,1=N,2=A,5=D,...直到9=T,但计算到D+D=5+5=10,而不是9时,就知道这个假设错了。这时就需要为字母重新指定数字,并再作计算。
例8
这是密码题,下面这个密码题的上、中、下三行各是一个人名。已知D=5,要求:
(a)把字母换成数字;
(b)字母换成数字后,最下面一行的数字必须等于第一行与第二行的数字之和。

图8
3.爬山法
与假设检验法一样,爬山法也是一种试错的方式。其基本思想是,虽然通往目标状态的路径并不清楚。但在当下这一步中,看上去至少是更接近目标的。这就像在一座不熟悉的山上爬一样,虽然不知道前方道路,但只要一点点地往上爬,就有可能走到最高点。但这种方法并不一定能通往最高峰(如图9中A点),有时候也可能是一个局部最高点(如图中B点),这时就需要个体下来,并重新往另一上坡爬。因此,爬山法只能保证当下是往上爬,而不能保证最后一定能到达至高点。

图9
爬山法的一个例子如例9。按照爬山法的原则,每一步都需使左岸的人数变少,右岸的人数变多(更接近目标)。但有时在约束条件下,或为了最终能达到目的的情况下,需要偶尔往回调。
例9
三个传教士和三个野人在一个渡口过河,他们找到了一只船,但船太小,一次最多只能乘上两个人。如果岸上或船上的传教士的人数低于野人的人数(不包括等于),则野人会吃掉传教士。找出一个过河方案,以保证所有的传教士和野人都能平安过河。假定船上的乘客在下一步活动之前都得先上岸,并且每次过河的船上至少有一个人(Reed,Erns和Banerji,1974)。
正确的方法如图10。

图10
4.手段-目的分析法
与爬山法的不同之处在于,该方法将一个问题分解为若干个子问题,每一个子问题解决一个中间状态。这就好比,我一步走不完,那么就分成多步走。一般来说,子目标的分解从目标状态,为了达到目标状态(目标),需要先达到某个中间状态(子目标1),而为了达到这个中间状态又需要达到另外一个中间状态(子目标2),...,直到回溯到初始状态。这种子目标分解方法也被称为逆向工作法(Simon,1975)。如例10。
例10
假如你目前在韶关的家中,你需要去夏威夷度假,你可以按下面的方式来思考问题:由于夏威夷是海外的岛屿(目标状态);去夏威夷需要在上海机场乘坐飞机,那么需要先去到上海机场(子目标1);上海机场在上海,那么需要先去上海(子目标2);从韶关去上海需要乘坐火车,因此需要先从家里去韶关火车站(子目标3)...。
目标状态:你在夏威夷
中间状态1:你在上海机场
中间状态2:你在上海
中间状态3:韶关火车站
起始状态:你在韶关的家中
5.启发式搜索
利用窍门、有关知识和过往经验解决问题,将会大大提升问题解决的效率。这种方法称作启发式搜索。例如,在一个有许多珠宝的保险柜上,有10个数码转盘锁,每个转盘上有100个数。一个小偷要想打开保险柜,如果他每个数字试一次,那么需要试10010次。如果小偷很有经验,他发现当某个盘转到合适的位置时就会"咔嗒"地响一声。利用这种听觉信息可以大大减少尝试的次数,也许只需要几百次或几千次就能把保险柜打开。
6.各种方法的混合
现实生活中人们更常用的是同时采用多种方法解决问题。以算术题为例,由于D=5,根据以有信息利用D+D=T得到T=0。通过已有信息向目标更进一步,因此属于爬山法。第二列L+L=R,没有提其他何信息,因而采用假设-检验法。先假定L=1,R就等于1+1再加进位的1,即R等于3。但在第六列D+G=R,由于D=5是给定的,5+G肯定大于或等于5,那么R就必须大于5了。因此遇到矛盾,L=1和R=3的假设就是错的。再回头看第二列R=2L十1,根据奇数和偶数的知识,R显然是一个奇数,又因为R大于5,因此R必然为7或9。利用有关知识解决问题的方法属于启发式搜索。目前还能利用的信息就是O+E=O和A+A=E,向目标进发的局部方法属于爬山法。由O+E=O可以得知,E要么是0要么是9(后一列可能进一),利用有关知识分析属于启发式搜索。假设E=0,那根据A+A=E得A=5,这与D=5矛盾,因此E=9,这是假设检验法。由于E=9,那么R应该等于7,这是爬山法...。
四.顿悟问题的解决
1.问题的重新表征
顿悟问题的解题关键在于问题的重新表征。根据问题表征的定义,对问题的重新表征也即找到其他从初始状态通过目标状态的方法。
以计算从1加到100为例(1+2+3+4+5+...+100)。一个方法可以使用爬山法,每个数两两相加,最终获得一个数。但这显然不是一个好方法,第二种方法是要注意到第一位数与倒数第一位数的相加是101,第二位数与倒数第二位数的相加也是101,...。该式子一共可以分为50组相加为101的数字对。因此,式子的和为50*101=5050(Gilhooly,1996)。解决该问题的关键在于发现问题中"数字对相加为101"的关键特征,并用于解答问题。
另外一个例子如图11,这个问题要求求出图中X的长度。要解决该问题,需要构造出一个矩形。这个矩形的一条对角线是X,而另外一条对角线是半径r,因此X的长度等于r(Goldstein, 2011)。

图11
"六火柴问题"(Scheerer,1963)向被试提供六根火柴棒,要求构造四个等边三角形,如图12所示。由于大多数被试的问题表征是在平面上构造三角形,因此陷入困难。正确的解法是构建一个等边三角锥。

图12
2.固着与定势(Goldstein, 2011;Robertson,2001)
在顿悟问题中,人们通常只关注问题的特定方面,这种倾向会使人们形成错误的问题表征,阻碍其找到问题的解决方案,即固着和定势。固着是将一个客体的使用方式限定在其熟悉的用途上,而忽略了它在其他方面的属性。关于固着的例子有双绳问题和蜡烛问题。定势是指,一种事先形成的、关于如何着手处理问题的观念,这种观念受人们经验的影响。固着其实就是一种定势。定势的例子有水壶问题。
(1)双绳问题(Maier,1931)
任务描述
在Maier的实验中 被试在一间挂有两条绳子的房间,房间地板上还有钳子,被试的任务是将两条绳子系在一起。但是,他们发现握住一根绳子时另一根根本够不到。唯一的方法就是用地板上的物件。在被试经过一番努力仍未解决后,Maier将给出两点提示。第一个提示是,故意甩动绳子使之摆动。如果第一个提示未成功,则把钳子给被试并告诉他可用它来解决问题。如图13。
结论与分析
这个实验想说明的是,被试之所以在一开始不能解决问题,是因为大部分被试只想到了钳子的日常功能,当实验者给出提示后,激发了被试关于"摆钟"的顿悟,即钳子可以作为绳子摆动的钟摆。从而重构了问题,问题的解决方法就此产生了。
对物体属性完整表征的失败导致了功能固着。一般情况下,当单独思考到某个物体时,首先想到的是它最典型的特征。比如当想到臭融时,就会联想到臭味;当想到钳子,就会联想到那种可以紧夹小物体的、由铁制成的东西;当想到一个盒子,首先联想到容器等等。如果这些物体与环境放在一些时,那么脑中浮现的将会是物体与环境有关的信息,比如当单独思考到青蛙时,想到的可能仅仅是它的形象而非食用属性。但当在一家法国餐馆中读到青蛙时,可被人食用的念头就会变得活跃起来。如果这些与问题解决无关的属性被突显,那么对解决问题的关键属性就容易被"忽略",从而导致问题解决的失败。

图13
(2)蜡烛问题(Duncker,1945)
任务描述
被试的任务是把蜡烛固定在门上且不能使蜡油滴在地板上。该实验有两种条件,如图。第一种条件,桌面放有三个空盒子、火柴、图钉和三根蜡烛;第二种条件下,三个盒子分别装有火柴、图钉和三根蜡烛。如图14。

图14
结论与分析
解决这个问题的关键是,需要被试认识到盒子除了可以用做容器也能用作支撑物。即用图钉将盒子固定在门板上,然后再用它支撑蜡烛。该实验发现,第二组比第一组更难。Adamson(1952)重复了Duncker的实验并得到了同样的结果:第一种实验条件中成功解决问题的人数是第二种实验条件的两倍。这是因为把盒子看作容器会阻碍人们把它当作支撑物来使用的想法。
(3)水壶问题(Luchins和Luchins ,1959)
任务描述
给被试三个不同容量的水壶,让被试利用这些水壶量出特定容量的水。例如,如果水壶A可盛18升水,水壶B可盛43升水,水壶C可盛10升水,如何量取5升水呢?答案是在水壶B中盛满43升水,从中倒出一些水盛满水壶A,接着再用水壶B的水盛满水壶C两次(水在盛满后倒出),最后水壶B所剩的水就是5升。这个解决方案可以用公式"B-A-2C"来阐明。
可以对不同水壶设置不同的容量数,如图15。被试从第一组开始,一直往下计算。通过计算可得,第一组、第二组和第三组都遵循"B-A-2C"的计算方式。而第四组只需"A-C"即可。

图15
结论与分析
在实验中发现,当被试完成前三组后,在计算第四组时,被试容易受到"B-A-2C"的影响,即对比起没有进行前三组计算的人,他们所花的时间更多。
3.表征转换理论和进程监控理论
表征转换理论和进程监控理论是目前关于顿悟解释的比较有名的理论。
(1)表征转换理论
该理论认为认为,由于在一开始对问题形成了错误的表征,导致问题解决者在解决问题时遇到障碍。而问题解决中产生的顿悟是由于他们变换了对问题的初始表征。那问题解决者是如何改变表征的呢?而根据 Ohlsson(1992)对表征转换理论的阐释,顿悟问题中的僵局是由于个体没有能够从长时记忆中提取出正确的相关算子才导致的。而长时记忆的提取过程是一个激活扩散过程,顿悟问题激起的初始表征难以激活扩散到正确算子所涉及的知识,因此顿悟问题才难以解决。而表征转换则是通过解除抑制等机制让个体对于问题情境和解决标准进行重新知觉,从而产生与先前表征足够不同的新表征------这些新表征可以激活扩散到正确的算子。该理论认为主要包括解除抑制和组块分解两种机制(Knoblich,0hlsson和Haider,1999)。
解除抑制,固着和定势对问题设置了不适合的约束,通过解除这些约束,减少不必要的知识的激活, 从而达到表征变化。心理成规理论认为人们会反复地在那些无效的思路上进行尝试,这种徒然的努力会起到相反的作用,它使得这条错误通路的激活程度越来越强,并同时降低了问题解决者探索其它有效途径的可能性。因此,当遇到障碍时一直纠结这个问题可能不是一种好的解决办法(Smith,1995)。通过深入分析大量有关科学发现的轶事记录,提出了著名的顿悟四阶段论,包括:准备期,即个体积初次索问题的过程;酝酿期,即在探索失败后,暂时离开当前问题并从事无关活动的过程;豁然期,即突然找到问题解决方法甚至发现答案的过程;验证期,即对问题解决方法或答案进行检验的过程。其中,酝酿期是顿悟问题解决的一个必要阶段,而豁然期则是顿悟问题解决特有的过程(Seifert,Meyer,Davidson和Patalano等人,1994)。因此,解除抑制的一种办法是,暂时离开当前问题,使错误通路的激活程度变弱,然后通过激活扩散的方式,使得其他问题解决通路得到激活的可能。
组块分解,指个体对一组客体或事件进行加工之后形成一个组块,当这个组块不能促成问题解决时就可能产生障碍。这时,若将组块分解成为更小的单元,就能为问题解决提供可能途径。如"火柴数学问题"(Knoblich,Ohlsson和Haider等人,1999),它是指呈现由若干根火柴组成的以罗马数字表示的无法成立的数学方程式,要求被试通过只移动一根火柴使这些方程式变得成立。例如,呈现"IV= III +III",这是一个不成立的方程。该方程式可以通过将V前的I移动到V的后面,从而获得一个合法的方程式,即"VI=III+III"。
促进和诱发自动化知觉组块效应的因素是阻碍组块分解的障碍源。一方面,物理结构上相邻、相似、连续、闭合的刺激会被知觉为一个组块(知觉组织(9-13:视知觉组织));另一方面,随着知识经验的积累,知觉组块效应的自动化程度也会趋于增强。所以,组块破解过程必须克服组块的紧密性以及知识经验的障碍,而且这些多重障碍源还可能还会发生交互作用,产生叠加效应。(黄福荣,和美和罗劲,2017)
(a)组块的紧密性
组块的紧密性是是指组块的内部元素之间镶嵌或捆绑的紧密程度。如果组块的基本构成元素有意义、可以独立存在,那么该组块属于松散组块;如果组块的基本构成元素没有任何意义、也不能作为独立单元而存在,那么该组块属于紧密组块。
Knoblich等人(Knoblich,Ohlsson,Haider和Rhenius,1999)采用火柴数学问题为实验材料,探明了组块分解的认知加工规律。其中,算式问题划分为两类:第一类是松散水平组块破解,例如问题"Ⅳ=Ⅲ+Ⅲ"(答案是"Ⅵ=Ⅲ+Ⅲ"),问题解决者只需要把"Ⅳ"拆分成"l"和"V",并且把"l"移动到"V"的右边,其中"l"和"V"本身都是有意义的组块、可以独立存在;第二类是紧密水平组块破解,例如问题"XI=Ⅲ+Ⅲ"(答案是"Ⅵ=Ⅲ+Ⅲ"),这里问题解决者需要必须把"Ⅺ"拆分成"\"和"/"和"I",并且重组成数字"Ⅵ"才能构建出正确的等式,其中"\"和"/"在罗马数字中本身没有任何意义、不能独立存在。实验发现,相对于松散水平的组块破解,紧密水平的组块破解的成功率更低、反应时间更长。基于此,Knoblich总结出了两条认知规律:第一条是,组块破解的难度与组块内部元素的紧密程度成正比;第二条是,组块破解有优先级差异,组块破解是从松散水平开始的,只有当松散水平的组块破解持续失败之后才会考虑紧密水平的组块破解。
除此之外,Knoblich等人(Knoblich,Ohlsson和Raney,2001)还比较了松散水平和紧密水平的组块破解的动态进程,实验中采用眼动技术记录了被试解决火柴数学问题过程中的注视轨迹,然后把整个问题解决进程划分成3个均等的时间段,分别计算每一个时间段内,问题解决者对各个问题元素(数字、运算符号)的注视时间分布,实验发现:相对于松散水平的组块破解,紧密水平的组块破解过程中的凝视时间更长,尤其是在临近成功的第三阶段。凝视意味着认知加工出现了停滞,它说明紧密水平的组块破解过程中经历了更多的僵局;在紧密水平的组块破解的第一和第二阶段,问题解决者对于关键元素的注视时间都不长,但是第三阶段对关键元素的注视时间出现了陡增,说明问题解决者突然转移注意力完成了问题表征的转换。
(b)组块的熟悉性
知识经验是引导自动化知觉组块效应的重要因素,也是阻碍组块破解的主要障碍源。刺激的熟悉性越强,知识经验引导的自动化知觉组块效应越强,组块拆分的难度就会越大。(Gobet,Lane,Croker和Cheng等人,2001)
(c)多重障碍假说
Wu等人(Wu,Knoblich和Luo,2013)在实验中同时操纵了组块的熟悉性和紧密性。形成4种组块破解条件,分别是:熟悉&松散水平、不熟悉&松散水平、熟悉&紧密水平和不熟悉&紧密水平。实验结果显示,熟悉水平比不熟悉水平的组块破解的正确率低、反应时间更长;紧密水平比松散水平的组块破解的正确率低、反应时间更长,其中"不熟悉&紧密水平"的正确率最低,反应时间最长。这说明组块的熟悉性和紧密性能叠加影响组块分解,既顿悟的多重障碍假说。
(2)进程监控理论
进程监控理论认为顿悟问题难在个体在庞大的搜索空间内未能成功运用合适的启发法找到问题解决的方法,因而在庞大的问题空间内恰当地运用不同启发法才是顿悟问题解决的关键。进程监控理论包括"部分合理原则"和"标准失败"两个内容。部分合理原则是基于爬山法的思想,即问题解决的过程就是问题解决者最小化当前状态和目标状态之间差异的过程。对于顿悟问题,虽然个体无法直接使用算子达到目标状态,但是他们能够使用部分合理原则来评估所使用算子的合理性,即评估该算子能否减小当前状态与某些中间状态之间的距离(不一定是目标状态),当满足该条件时则使用该算子(Chronicle,MacGregor和Ormerod,2004)。当目前的状态和目标状态存在巨大差异,且只剩下数目不多的操作时,会产生标准失败。标准失败是指无法跨越当前状态与目标状态之间的差异,简单点说就是个体发现用这个方法不能解决眼前的问题。当标准失败发生时,个体就会寻求其他方法,为问题解决创造条件(Weisberg和Alba,1981;Ormerod,MacGregor和Chronicle,2002)。
如例11,九点问题。如果按照表征转换理论的说法,这个问题的难点在于,被试形成了一种思维定势,即假定他们划的线段必须在这九个点所构成的正方形之内。然而Weisberg和Alba(1981)发现,即便给予"可以超出点外"的提示(打破思维定势),也只有20%的被试能得出正确答案。因此表征转换理论无法解释这个问题。相反,MacGregor等人(MacGregor, Ormerod和Chronicle,2001)发现问题解决者采用了爬山法,他们在解决问题的过程中通常寻求"每条线划掉的点的数目最大化",如第1条线划掉3个点,第2、3条线分别划掉2个点。在这个例子中,部分合理原则体现在每条线要尽可能地多连一些点。在前三步中,因为当前状态(剩余没划的点)和剩余的操作(剩余线段)未出现巨大的差异,所以未达到标准失败条件。在划第4条线时,被试就发现无法用该方法解决问题,标准失败才出现。只有当问题解决者达到标准失败时,他们才可能意识到一些直线要超越方框。
例11
九点问题。画四条连续的线段(四线相连),使图16左九个点连接起来(答案在图16右)。

图16(a)

图16(b)
(3)区别与联系
两种理论的争论核心在于顿悟的达成是否需要经历某个特殊认知过程。表征转换理论的支持者认为顿悟涉及某个特殊的、与一般问题解决过程不同的认知过程;而进程监控理论的支持者则认为顿悟问题解决与一般问题解决没有实质区别,都可以通过分析式思维达成(Weisberg,2006)。
已有研究证明,这两种理论的适用条件是不同的。Jones(2003)等人将顿悟问题分为"单步骤问题"和"有限步骤问题"。他提出,表征转换理论更多适用于单步骤问题,而进程监控理论更多适用于有限步骤问题。
4.酝酿效应(王千如,2016)
(1)定义
在日常生活中,我们往往会遇到一些令我们束手无策的难题,无论我们怎么努力也无法找出答案,于是我们将问题搁置一边,不去管它。直到有一天,当我们在做其他事的时候,这个令我们百思不得其解的问题答案突然出现在我们的脑海中,正如《游山西村》中的一句诗所指的那样"山重水复疑无路,柳暗花明又一村"。这个从我们将问题搁置一边,先进行其他的活动,在一段时间后当个体重新思考这个问题时,问题答案突然出现的过程就是"酝酿效应"。
(2)研究范式
研究酝酿效应的范式目前有两种,"延时酝酿"范式和"即时酝酿"范式。"延时酝酿"范式将被试分为实验组和对照组,实验组的被试先是被要求在给定时间内思考并尝试解决目标任务,然后插入一个时间固定的内插任务作为酝酿期,且此任务与目标任务无关,最后要求被试回去继续解决目标任务。而对照组的被试则要求一直思考并尝试解决目标任务。研究者通过比较两组被试在目标任务上的表现来研究是否存在酝酿效应。大量研究发现,这种延时酝酿对被试在目标任务上的表现是有积极影响的,特别是在解决发散问题的情况下,因此该范式有效的证实了酝酿效应的存在(Mednick,Mednick和VMednick,1964)。
在"即时酝酿"范式中,被试同样分为实验组和对照组,实验组被试听完目标任务指导语后立即进入酝酿阶段,即进行一段时间的内插任务(酝酿期),然后再去做目标任务。对照组被试则是在听完目标任务指导语后就开始进行此任务,且给定的时间与实验组中被试进行目标任务所用的时间相同。结果同样发现实验组被试在决策和创造性问题解决中的表现显著好于对照组(Dijksterhuis和Meurs,2006)。
(3)酝酿效应的理论假设
前人提出了几个颇具影响力的假设来解释酝酿效应对问题解决的积极影响。
(a)良性遗忘理论(Khon和Smith,2009)
这一理论认为对问题进行思考并试图解决而未能解决后,很有可能产生思维定势,从而对问题解决造成阻碍。而在酝酿期,个体将之前未能解决的问题放到一边去进行其他任务,恰好可以促进个体遗忘旧的或错误的想法,削弱思维定势。所以当重新回到原来的问题时,有利于个体对问题解决产生新的观点。研究人员使用远距离联想任务(18-1:无意识思维)对酝酿效应进行了研究,他们通过操纵线索将被试分为两组,固着组和非固着组,他们给固着组的被试呈现误导线索,用以诱发对错误答案的固着。非固着组的被试没有收到任何误导线索,因此他们并没有对错误答案产生固着。接着,研究者又设置了两种可能产生酝酿效应的条件:完全中断和部分分心。在完全中断条件下,被试在酝酿期进行一项数字监控任务。在部分分心条件下,当被试进行数字监控任务的同时,远距离联想任务的词组依旧显示在屏幕上。研究结果显示,被试在完全中断条件下产生了酝酿效应,而部分分心条件下的被试并没有产生酝酿效应。研究进一步发现,在完全中断条件下,只有固着组的被试产生了酝酿效应,非固着组被试并没有产生酝酿效应。这一研究支持了酝酿效应的良性遗忘理论。然而这一理论观点并不能解释"即时酝酿"范式。在"即时酝酿"中,由于被试听完目标任务后便直接进入酝酿期,并没有机会在酝酿前对问题进行思考并产生思维定势或者功能固着,因此不存在忘记错误想法这一可能性。
(b)疲劳缓解理论(Seifert,Meyer,Davidson和Patalano等人,1995)
该理论认为被试对目标任务经过长时间的思考,导致心理认知疲劳,从而降低了问题解决的能力,而酝酿可以让被试放下之前的任务,使心身得以放松,认知得以缓解,当被试重新回到原先问题后就会有较好的表现。同样的,该理论无法解释即时酝酿效应。
(c)无意识加工
在酝酿期间激活语义网络(20-3:长时记忆)的节点可以自动地无意识地传播到远距离但相关的节点,从而积极影响顿悟加工(Dijksterhuis和Meurs,2006)。这一理论符合Hélie和Sun(2010)的外显内隐交互作用模型,该模型认为意识层面的外显加工过程和无意识层面的内隐加工过程是相互平行的。在酝酿期间,内插任务主要在意识层面进行外显加工,而目标任务则依旧在无意识层面进行内隐加工。该理论能对"即时酝酿"范式提供证明,即在"即时酝酿"范式中,被试听完指导语后立刻进入酝酿期,并且被试无法产生错误的定势或者使认知疲劳(Dijksterhuis和Meurs,2006)。
五.类比迁移
前面两部分分别介绍了非顿悟问题和顿悟问题的相关理论和方法。这里要介绍的类比问题解决,它即可属于解决非顿悟问题的方法,又可属于解决顿悟问题的方法。
1.基本概念
(1)定义
当人们遇到一个新问题时,人们往往会想起一个过去已经解决的相似的问题,并运用相似问题的解决方法去解决新问题,这一问题解决策略被称之为类比迁移。其中,被借用的旧问题被称为源问题,而待解决的目标问题被称为靶问题(Robertson,2001)。关于非顿悟问题的类比迁移例子,比如你学会了在软件上购买火车票,就能通过类比迁移到如何利用软件购买飞机票。之所以能发生迁移,是因为购买火车票和购买机票这两个问题有一些共同要素,如选择目的地和出发地,选择班次和时间,对比价格...。这些共同要素是类比迁移的基础。顿悟问题解决的类比迁移的例子如棋盘问题和舞伴配对问题。同样的,这两个问题有相似的解题结构,这个结构由源问题向靶问题迁移。再如例12中的(a)和(b),它们分别是源问题和靶问题,假设一个一年级学生在解靶问题(b)时,可以借用源问题a=b*c的规则。这就是一个类比迁移的过程。
例12
(a)1斤苹果5块钱,要买10斤苹果,需要花多少钱?
(b)一辆小轿车以平均每小时64千米的速度行驶5小时。它走了多远?
(2)过程
关于类比迁移的过程有多少阶段?虽然不同的学者有不同的划分,但是他们基本在下面四个阶段上达成一致(曲衍立,张梅玲,2000):
(a)编码,对靶问题进行编码,提取问题的特征(问题情景和问题的信息)(比如,例(b)的问题情景是关于物体位移的,其信息包括速度和时间)以及问题的结构(即特征与特征之间的关系)(如时间和速度是相乘的关系)。
(b)检索,根据靶问题的特征及结构,从长时记忆中提取相关的源问题,如提取了例的问题(a)。
(c)映射,把源问题应用到靶问题。如问题(a)使用了"金额=单位价格*重量",那么应用到问题(b)时将使用"距离=速度*时间"。
(d)图式归纳,即对解决方法的总结,并形成一个抽象的图式,如总结出图式"a=b*c"。当图式已被形成时,该图式可以直接应用在其他同类问题上。
关于类比迁移的认知理论,主要有结构映射理论、实用图式理论等。
2.结构映射理论
结构映射理论 (Gentner,1983)认为类比迁移是一个通过提取源问题各因素之间的关系,即结构,并用于解决靶问题的过程。其理论可以总结为表征假设和映射过程假设。
(1)表征假设
表征假设解决的问题是知识如何在心理上得到表征。Gentner假设知识是以命题网络的形式表征的,在这个命题网络中存在4种层次的知识(16-4:类比):
(a)实体:原子核、太阳、原子
(b)属性:黄色的(太阳)、炎热的(太阳)
(c)关系(初级关系):围绕旋转(地球,太阳)
(d)结构(高级关系):因果[吸引(太阳,地球),围绕旋转(地球,太阳)]
(2)映射过程的假设
映射过程假设解决的是源问题如何映射到靶问题上,它包括如下三点。
(a)产生类比迁移的第一步就是从长时记忆中检索源问题。该理论认为,靶问题的表面特征(实体和属性)、关系特征和结构特征都能在检索之初提供线索,但表面相似对检索源问题的影响更大。
对例13和例14进行对比,在例13中,源问题和靶问题的表面特征不相似(结构特征相似),仅有30%的被试能得到正确答案;在例14中,源问题和靶问题的表征特征相似(结构特征相似),有81%的被试能得到正确答案。这说明了表面特征相似性对源问题的提取有更大影响力。即使两个问题在结构上相似,但如果表面特征不相似,也很难从记忆中提取相关源问题,从而无法产生类比迁移。虽然结构特征与问题解决方法更为相关(如例12中的结构"a=b*c",而非表面特征如"速度、时间、重量"等),即迁移的是结构而非表面。但事实上,表面特征之间的匹配对类比迁移也是有一定益处的。Vosniadou(1989)发现显著的表面特征是重要的,因为人们本质上倾向于在表面和结构之间建立一个因果关系。例如,一个红色的西红柿(红色是表面特征)与潜在特征"成熟"之间存在因果关系。又如一位美国总统在演讲台上找不到下台阶,然后,根据这件事来判断他是否适合当总统。以表面特征为基础接受结构特征是进化论中的一种古老机制,这是一种非常快且有效的思维方式(启发式),即使它有时会导致错误结论(Gentner,Rattermann和Forbus,1993)。
表面特征对原问题的检索影响相对比较大,但如果结构不一致源问题也难以被提取,如例15。
例13
辐射问题
问题描述
一个患了胃部恶性肿瘤的病人。对这个病人动手术是不可能的,可如果不消灭肿瘤,病人就会死。现在有一种辐射技术可以消灭肿瘤。如果辐射强度足够高,肿瘤就会被消灭。但现在另外一个问题是,高强度的辐射会损害其经过的健康组织;低强度的辐射对健康组织无害,但它也无法消灭肿瘤。那么有什么办法可以在不损伤健康组织的前提下消灭肿瘤呢?(Gick和Holyoak,1980;1983)
结论分析
这个问题的正确解决方案是用许多来自不同方向的低强度的辐射射向肿瘤,这样可以保证在消灭肿瘤的同时不损害辐射经过的健康组织,如图17。在Gick和 Holyoak的实验中发现,只有10%的被试能找到该解决方案。为了研究类比迁移,Gick和Holyoak设置了另外一种实验条件。在这个条件中,被试需要先读完城堡故事再解决辐射问题。城堡故事和辐射问题具有相同的结构(但有完全不同的表面特征),可以利用该结构解决问题。结果发现在阅读城堡故事后能解决该问题的被试上升到30%。
需要注意的是,这里有70%的被试在阅读了类比源故事后依然不能解决问题,即很多人仍然不能在源问题和目标问题之间建立联系。然而,当Gick和Holyoak提示被试想想他们读过的故事时,他们的成功率达到了75%。这说明,类比信息已经储存在被试的记忆中,但不太容易被回忆起来。

图17
源故事:堡垒故事
一个小国家受制于一个独裁者建立的堡垒。这个堡垒处在国家的中心,周国是农场和村庄,其中有很多通向堡垒的道路。一位革命将军宣告要占领这个堡垒。这个将军得知独裁者在每条路上都安置了地雷。不过因为独裁者需要从堡垒中来回运送军队和工人,所以地雷的设置是可以让少数人安全通过,当人数多了导致的重压就会引爆地雷,这样会炸了周围的路和附近的村庄。然而,将军设计了一个精妙的计划。他把军队分成多个小队,每一小队到不同道路上。当所有军队在堡垒集结好后,再发起总攻的信号。用这种方法,将军占领了堡垒并推翻了独裁者。
例14
灯泡问题(玻璃易碎版本)
问题描述
一个物理实验需要用到一种特殊的灯泡,它的价格非常昂贵。一个早上,研究人员露丝发现这个特殊灯泡不能正常工作了。她注意到灯泡里的灯丝分成了两部分,而灯泡周围的玻璃是密闭的,没办法打开。露丝也知道如果用一个高强度的激光能使灯丝的两部分熔融为一体,这样灯泡就能正常工作。然而,高强度的激光也会破坏灯丝周围的玻璃。用较低强度的激光虽然不会损坏玻璃,但也不能使灯丝熔融在一起。那么有什么办法可以在不破坏玻璃的前提下使灯丝熔融在一起呢?(Holyoak和Koh,1987)
结论分析
Holyoak和Koh(1987)的研究采用辐射问题作为源问题,灯泡问题作为目标问题。被试分为两组,第一组了解过辐射问题,第二组没了解过。结果发现,第一组被试有81%的人能解决灯泡问题,而第二组只有10%。Holyoak和Koh认为,被试之所以能够很好地从辐射问题类比迁移到灯泡问题,是因为两个问题有很高的表面相似性(一个是辐射,另外一个是激光)。
例15
灯泡问题(强度不足版本)
问题描述
研究人员露丝发现这个特殊灯泡不能正常工作了。她注意到灯泡里的灯丝分解成了两部分,用激光能使灯丝的两部分重新融为一体。但这里只有低强度的激光,而熔融灯丝需要更高强度的激光。(注意,问题并无提及关于玻璃的限制)(Holyoak和Koh,1987)
结论分析
这个问题的解决方法同样是在灯泡周围放置几束激光将灯泡围住,在同一时间里从几个方向同时给予低强度的激光束。这些激光束聚焦的力量足以熔融灯丝。研究者发现,即使被试在解决问题之前就知道辐射问题,但也仅有33%的被试成功解决问题。虽然辐射问题和该问题有相似的表面特征,但是由于它们的结构是不同的,前者在于其限制"不能沿一条路径安全地应用全部力量",而后者描述的是"没有一条路径能容纳足够力量"。从而影响了被试的类比迁移。
(b)源问题被提取出来后,源问题的表面特征会被抛弃,只有关系和结构被保留。换句话说,表面特征只在源问题的提取阶段起作用,但在解决阶段,只有关系和结构被匹配。比如,在"原子像太阳系"的类比中,太阳的属性,"黄色的()、炎热的()、巨大的()"等被丢弃。而关系"围绕旋转(地球,太阳)"等将被保留。
(c)高级关系比它低级的关系更容易发生映射,且在问题解决中起主要作用,即所谓的系统性原理。复杂关系制约低级关系,那些孤立的或与高级关系矛盾的关系将被抑制。在"原子像太阳系"这个例子中,相比低级关系"较...热(X,Y)"、"吸引(X,Y)"和"围绕旋转(Y,X)",高级关系"因果[吸引(X,Y),围绕旋转(Y,X)]"更容易被映射。又因为低级关系"较...热(X,Y)"孤立于被映射的高级关系中,因此该低级关系被抛弃。通过下例16进一步说明。
例16
在一项实验中,要求大学生检查这两张图片后决定下图中的哪个物体与上图中的男人最相配(图18)。当孤立地考虑这一单独映射时,人们通常基于感知和语义相似(表面特征),被试会指出下面图片中的男孩与上面图片的男人最匹配。然而,当要求人们不仅仅匹配一个物体而是三个时,他们倾向于基于结构进行匹配。在上面的图片中,男人尝试管住一条狗未成功,狗然后就追赶一只猫。在下面图片中,树尝试绑住一条狗未成功,狗然后就追赶男孩。因此基于结构的匹配是,上图的男人、狗、猫分别对应下图的树、狗、男孩(罗蓉和胡竹菁,2009)。

图18
(3)计算模型(罗蓉和胡竹菁,2009)
使用局部到整体的调整过程以达类比源和类比目标两个表征之间的结构调整。这里以海湾战争类比二战的简单例子作为说明,如例17。
(a)在所有的相同的属性或关系间进行局部匹配。同义词等有相似语义的被视为同一属性或关系。如"...的元首"和"...的总统"有相似语义,可被转换为"...的领导","占领"和"入侵"可被转换为"攻击"。当然,仅仅是低级的局部匹配可能会引发错误。如,希特勒既可以与侯赛因匹配,也可以与布什匹配,因为他们都是"领导"。
(b)这些局部匹配逐步合并成最大化的结构。这些结构保留一对一的一致性(一致性:希特勒与布什之间的匹配与德国与美国之间的匹配是一致)。在此例中,最佳的匹配应该是希特勒-候赛因,德国-伊拉克、邱吉尔-布什和英国-美国,它们得到高级关系"引起"的映射支持,即从源域"引起[占领(德国,奥地利)反击(邱吉尔,希特勒)]"映射到"引起[攻击(伊拉克,科威特),反击(布什,侯赛因)]"。由于更高级的关系制约比它低级的关系,因此一些与高级关系孤立或矛盾的低级关系将会被抛弃。如"首相(邱吉尔英国)"与"总统(侯赛因,伊拉克)"可能会在非最大化结构中匹配,但由于在高级关系中,前者是反击方,后者是入侵方,因此该匹配在高级关系中不是一致的,从而被抑制。
例17
源:
元首(希特勒,德国)
占领(德国,奥地利)
邪恶(希特勒)
引起[邪恶(希特勒),占领(德国,奥地利)]
首相(邱吉尔,英国)
反击(邱吉尔,希特勒)
引起[占领(德国,奥地利),反击(邱吉尔,希特勒)]
靶:
总统(侯赛因,伊拉克)
入侵(伊拉克,科威特)
邪恶(侯赛因)
引起[邪恶(侯赛因),入侵(伊拉克,科威特)]
总统(布什,美国)
反击(布什,侯赛因)
引起[入侵(伊拉克,科威特),反击(布什,侯赛因)]
3. 实用图式理论
实用性图式强调映射过程需服务于当前目标、主观意图或知识背景。它反映了人们在推理时不仅关注结构和语义的匹配,还会根据实际需求调整映射策略。它通常与任务目标、社会文化背景、个人偏好等因素密切相关。
(1)为什么实用图式重要
首先,该理论认为提取相关的源问题可以根据表面特征的重叠程度,或者根据实用图式的匹配。依靠问题间相似的表面特征,仅仅对来自同一领域的问题有用,因为同一领域的问题可能存在大量相似的表面特征;而对于不同领域的问题,由于两个问题间很少或没有共同的表面元素,因而类比迁移将依赖实用图式;其次,映射不仅受相关的属性、关系和结构相似性支配,而且受类比者的目标支配(Holyoak,1985)。人们抽取类比不是为了找相似而找,而是为了获得能解决目标的推论。
在Spellman和 Holyoak(1996)的一项研究中,大学生需要阅读关于两个行星上的国家的科幻故事。行星1包括三个国家,"Afflu"在经济上比"Barebrute"更富裕,而后者在军事上比"Compak"强。行星2包括四个国家"Grainwell"比"Hungeral"更富裕,"Millpower"在军事上比"Mightless"强。然后就问他们一些映射问题,两个行星之间的国家关系如何对应,如行星1的Barebrute对应行星2的哪个国家。如果是按照经济方面,Barebrute对应Hungerall(都是经济弱的);如果是按照军事,Barebrute则对应Millpowerl(都是军事强的)。因此这个问题有两个同等的受结构相似性限制的竞争映射。研究者发现那些加工目标偏向于经济关系的被试倾向于把Barebrute映射为Hungerall,而那些加工目标偏向于在军事关系的被试偏向Millpower。这些发现的一个解释是与目标相关高的命题,更早被考虑,而且更多地被考虑。因此,支配了映射加工。
在真实世界中,实用图式类比有着很强的现实意义,例如,如果将1991年海湾危机类比为二战,萨达姆映射为希特勒。因其隐含"正义对抗邪恶"的叙事,符合支持战争的政治目标。有着说服公众接受战争的正当性,强调"阻止独裁者扩张"的紧迫性。如果将海湾危机类比为越南战争,因其暗示美国陷入战争泥潭而失败的风险,可能削弱公众支持。
(2)如果使用实用图式
由于实用性图式服务于当前目标或主观意图。因此,实用图式的实质是与目标相关的关系或者结构。换句话说,并不是所有关系或结构都属于实用图式,只有与目标相关的关系和结构才是,这些关系和结构与目标有因果关系。
Holyoak认为每一种类比物就是一种包括初始状态、解答计划和结果这样有因果联系的问题图式。Gick和Holyoak(1983)使用辐射问题对这一理论进行了研究。两种类比物问题图式在最大程度上的对应即是最佳的表征,可以被概括为聚合图式。初始状态的子成分与解决计划都有因果关系,"目标"是解决计划的理由,"资源"是它的前提,"条件"限制使它不能选择其它的计划,"结果"就是执行解决计划的结果。显然,要想发现源问题和靶问题之间的联系,首先需要两个问题在目标上存在相似性,然后逐步在起始状态中寻找其他相似性。如例18。
例18
(a)堡垒问题
起始状态
目标:用军队来夺取堡垒
资源:大量充足的军队
操作:部队分组、前进、进攻
限制:所有部队不能集中在同一道路上
解决计划:
所有小组沿着不同道路出发,最后同时在堡垒发起总攻
结果:
堡垒被军队夺取
(b)放射问题
起始状态
目标:用辐射破坏肿瘤
资源:足够力量的辐射
操作:减弱辐射强度,移动辐射源,提供辐射
限制:不能在一个方位提供高强度辐射
解决计划:
在不同的方位同时提供低强度辐射,使肿瘤被辐射破坏
结果:
肿瘤被辐射破坏
(c)聚合图式
起始状态
目标:用力量实现主要目标
资源:拥有很大的力量
限制:不能沿一条路径安全应用全部力量
算子:减少力量强度,迁移力量的源泉,应用力量
解决计划:
沿多条道路同时应用较弱的力量
结果:
用力量实现了主要目标
4.多重限制理论
Holyoak和Thagard(1989)提出的多重限制理论认为,类别问题解决受三种约束的共同作用,分别为语义相似性、结构一致性和语用中心性。该理论是实用图式理论的进一步延伸(除了使用实用图式,还考虑到表面相似性和结构相似性)。
(1)三种约束
(a)语义相似性
语义相似性也即表面相似性(16-4:类比),选择那些在意义上相似的谓词(完全相同或具有共同的上位词)进行映射,如"攻击"和"进攻"。
(b)结构一致性
该理论的结构描述的元素包括:实体(例如,伊拉克);谓词(包括一元谓词(如"跑"),二元或多元谓词或关系(如"攻击"),还有将命题相互关联的结构(如"导致"(继续加入气体会导致气球爆炸));命题,它将谓词与论元绑定在一起,其中论元可以是对象(例如,"伊拉克攻击了科威特"),也可以是命题(例如,"伊拉克对科威特的攻击导致了美国对伊拉克的攻击")。
结构一致性要求,如果目标命题映射到某个源命题,那么前者的谓词和论元也应分别映射到后者的相应谓词和论元。例如,如果"伊拉克攻击科威特"映射到"德国攻击波兰",那么伊拉克应映射到德国,科威特应映射到波兰,攻击应映射到攻击,以此保证类比双方在结构上的合理性和连贯性。
(c)语用中心性
语用中心性即关于实用图式的相似性。实用中心性将会导致人们更倾向于选择那些对于目标特别重要的关系。
(d)一个例子(肖桂香,周丽霞,2009)
该理论的核心主张是,类比问题解决源自三个基本约束条件的相互作用。用于阐述观点的例子是:小女孩Aeron每次受伤后,她哭着喊疼。妈妈就会过来亲亲受伤的部位,对她说:"没事了,没事了",这样她就感觉好多了。有一天,她妈妈不小心手碰到桌子上,她"哎哟"一声喊疼。Aeron就走过来,亲亲她妈妈的手,对她说:"没事了,没事了"。研究者解释到:当Aeron听到她妈妈手受伤后喊疼,她联想到她自己受伤喊疼的情景。接着小女孩就把她自己的情景和她妈妈的情景一一对应,如"她受伤------她妈妈受伤;她喊疼------她妈妈喊疼"。再接着她想到她妈妈亲她,她感觉好多了。那么她该怎么减轻妈妈的疼呢?答案是,她也亲一下她妈妈。
这个类比同时受三个相似性的约束,首先源域的"受伤"与目标域的"受伤"属于语义相似约束;"因为我受伤;所以我喊疼"与"因为妈妈受伤;所以妈妈喊疼"属于结构一致约束;"妈妈亲我导致我不疼了"中,"亲"属于算子,"不疼了"属于目标,它们能组成这个问题的实用图式。通过实用图式的类比,就得到了"我亲妈妈导致妈妈不疼了"。
在这个类比迁移可以分为4个步骤:检索、匹配、映射(或迁移)和图式归纳。检索,即给定靶问题,根据语义相似性从记忆中提取源问题;匹配,在源问题和靶问题中,对相似表面、相似关系、相似结构和相似目标间建立联系;映射,即解决方法的迁移,将源问题的解决方法迁移到靶问题中。图式归纳,如果类比产生了一个解答,那么就要从两个类比物中概括出一个抽象的问题图式。中Aeron例子中,该过程可以表示如下图19。

图19
(2)约束之间的互相作用(Spellman和Holyoak,1992)
下面先介绍一下实验和实验结果,然后再介绍从中得到的一些结论。
(a)实验及其结果
在Spellman等人的实验1中,要求被试完成一项海湾危机与第二次世界大战的类比任务。他们询问一群大学生,假定候赛因与希特勒类似,不管大学生是否相信该类比是否恰当,要求他们随之写下二战情境中伊拉克、美国、科威特、沙特阿拉伯、法国、布什和丘吉尔最本质的匹配。
在这个类比任务中存在两种合理的类比,一个是"布什映射到罗斯福,美国(911版)映射到美国(二战版),沙特阿拉伯映射到英国";另外一个是"布什映射到丘吉尔,美国(911版)映射到英国,沙特阿拉伯映射到法国"。实验结果显示,被试要么选择两种可能中的一种,要么选择两种。因此,这是一个摸棱两可的类比,被称为双稳态映射,如图20。
研究者继续进行第二项实验,该实验通过控制被试的阅读材料影响被试的类比倾向。被试所阅读的材料的背景相同,但是内容的侧重点不同。比如"丘吉尔"版本描述的是丘吉尔如何激励英国人民以及如何领导盟军;而"罗斯福"版本描述的是罗斯福如何希望美国参战以及如何向盟军提供武器。结果显示,阅读邱吉尔版本的人倾向于把布什映射为邱吉尔,美国映射为英国;而那些阅读罗斯福版本的人倾向于把布什映射为罗斯福,美国映射为美国。

图20
(b)类比的前后一致性
即便类比常常是摸棱两可的,但类比前后一致性的约束可使类比源和目标问题组合成一个整体的解释。比如,将美国(911版)映射到美国(二战版)的被试更有可能将布什映射到罗斯福而不是丘吉尔;将美国(911版)映射到英国的被试更有可能将布什映射到丘吉尔而不是罗斯福。这样类比的结果是能得到一个更为连贯和合理的意义。前者描述罗斯福如何希望美国参战以及如何向盟军提供武器,后者描述了丘吉尔如何激励英国人民以及如何领导盟军。
(c)一对一映射
由于前后一致性,人们倾向于一对一的对应关系。如如果英国被映射为美国(911版),那么它就不会再被映射为沙特阿拉伯。同时,这又会迫使沙特阿拉伯转而对应到法国。
尽管实验对象倾向于生成一对一的映射关系,但偶尔也会出现一对多的映射反应,尤其是在多个备选源元素均未被其他目标元素捕获的情况下。例如,被试可能会将科威特同时映射到波兰和奥地利。其中的一个原因是,参与海湾战争的其他国家与这两个源国之间都没有很强的对应关系。
(c)约束冲突
研究者将这三种约束条件视为类比过程中的"压力"(促使类比的"力"),而非必要条件。因此,这些约束条件有时可能会相互冲突,需要进行平衡。比如在第二个实验中,从语义相似性的角度看,美国(911版)与美国(二战版)更为一致,被试更应该对两者进行映射;但由于被试所阅读的材料不同,并激活了不同的知识背景,因此根据语用中心性阅读丘吉尔版本的被试更应该将美国(911版)映射为英国。这里出现了一种冲突,美国(911版)映射为美国(二战版)还是映射为英国,从结果看语用中心性压过了语义相似性,即阅读丘吉尔版本的被试更倾向于选择英国。
总的来说,当三种约束发生冲突时,多数人最终选择"结构性和语用性的组合",并牺牲部分语义相似性。
5.样例理论
样例是指以逐步呈现解题步骤的形式为个体提供学习问题解决方法的例题。它是问题解决规则的具体应用形式,是联结知识领会与实际应用的纽带和桥梁。样例理论(Ross,1989)的主要观点是:先前学习过的例子,在类比迁移中起着决定性的重要作用。在类比迁移中,图式不可避免地要从具体事例中归纳推理出来。
图21至图24用于说明一个图式如何被归纳的过程。在图21中,A表示一个问题,B表示一个解决方案,S表示一个解决问题的内隐图式,S与B的区别是前者是后者抽象(S:如例的聚合图式),后者是前者的具体(B:如例中的堡垒问题或放射问题)。这个内隐图式可被应用于解决一系列相似问题。在一类新的问题中,其内隐图式通常是不完善的。在图22中,假设A是这类问题的第一个例题,当遇到一个新问题C时,C使你进人到相关的源例题A,在"A和B的关系概括到C和D的关系"的过程中(或者说,用A和B对比C和D),一个不完善的内隐图式S产生,这里使用源问题到靶问题的虚线P表示。当问题解决者再次面对同一类型的问题时,他很可能唤起以前的例题A、例题C和那个不完善的图式S,如图23。通过大量的重复练习,这个内隐图式S变得日臻完善。此时,类比迁移变为实线,如图24。最终,问题解决者能直接唤起直唤起图式以解决问题(Robertson,2001)。Ross(1984;1987;1989)提出类比问题的学习分为两种情况。一种情况是,问题解决者通过比较当前问题的特征与特征之间的联系。可能会激活起与当前问题有关的一个内隐图式,这个图式比较完善,可以用于解决问题。另外一种情况是,对该类问题还不熟悉的情况下,问题解决者会使用靶问题的表面特征获得源问题,并且从源问题那里模仿如何行动以解决靶问题。

图21

图22

图23

图24
另一种样例理论,多痕迹模型(Nadel,Samsonovich,Ryan和Moscovitch,2000)认为人的每种经验或实例都会产生它自己的情景性记忆痕迹。因此,多痕迹模型认为类比迁移中源问题与靶问题的表面或结构内容都被编码保存下来,并且具有同等的重要性。多痕迹理论还认为,图式归纳有两种方式,既有自动的加工,也有控制的加工。当提取存储样例时,图式归纳在很大程度上是自动的。靶问题会平行地激活多个样例痕迹,激活水平由与靶问题的相似性程度决定。被激活的样例既能在表面信息上与靶问题相似,也能在结构信息上相似。如当呈现肿瘤问题时,被试可能会激活所有的与其表面信息相一致的医疗事件;或激活具有共同结构特征的问题,如消除中心障碍物的问题。但是,如果对多个样例进行概括或比较精细的编码,则图式归纳就变成了一种控制加工,这种有意识地归纳所产生的图式,作为一个新的记忆痕迹被存储,进而可以被直接应用于其他问题的解决中去(张庆林,王永明,1998)。
6.图式归纳
图式是知识结构的基本单元,是指具有一定格式和组织的知识结构,它是全部信息加工所依据的基础成分。图式归纳是指,关于问题解决的图式(聚合图式)的形成和归纳。一个类比问题不足以形成一个图式,因为没有机会和其它类比问题建立映射关系。因此图式的归纳需要建立在多个问题之上。
目前关于图式归纳存在几点争议(曲衍立,张梅玲,2000):
(a)图式归纳是自动的还是策略的?实用图式理论认为图式归纳是策略的,需要通过两个或更多问题之间的相似性进行比较,对问题的深层结构进行有目的有意识地编码,问题图式才能产生。而结构映射理论则认为图式归纳是自动的。只要提供几个相似的问题,认知系统会自动地检测到它们的重叠程度,然后把这些重叠的特征作为独立的问题表征储藏起来。
(b)图式归纳是保守性的还是消除性的?实用图式理论认为图式归纳是保守性的,图式归纳之后的某些表面信息与因果图式一起保存在记忆中。问题的表面特征的相似性能够促进迁移,缺乏相似性会导致迁移困难。结构映射理论认为图式归纳是消除性的,图式归纳之后,只有结构信息(图式)保存在记忆中,那些孤立的低级关系以及事物的属性将被遗忘。
7.类比的多样性问题
Keane(1988)提出,当存在两个相互冲突的目标情境时,人们可能会对目标的不同偏向给出不同解答。举例来说:辐合问题就是一种目标冲突情境,它存在两个目标。目标1是用辐射消灭肿瘤;目标2是避免辐射损伤健康组织。如果人们偏向目标1,那么就以目标1为限制条件,找出一些满足目标2的办法。即为利用高强度辐射消灭肿瘤,在使用的过程中,采取措施避免伤害到健康组织。如果偏向目标2,那么就以目标2作为限制条件,找出一些办法满足目标1。即利用低强度的射线保护健康组织,在使用的过程中,采取措施使辐射尽量达到可以消灭肿瘤的高强度。
另外,在一项实验中,Spellman和Holyoak(1992)询问一群大学生,假定候赛因与希特勒类似,要求他们写下二战和海湾战争的最本质的匹配。在匹配开始前,会先让被试阅读源类比知识(二战)。结果发现,不同的源知识可以左右人们的映射偏好。阅读"邱吉尔"故事的人倾向于把布什映射为邱吉尔,美国映射为英国;而那些阅读"罗斯福"故事的人倾向于把布什映射为罗斯福,美国映射为美国。
8.学习迁移(张艳芬,2002;张裕鼎,2008)
学习迁移即学习一种知识对学习另一种知识的影响。只要有学习,就有迁移。类比迁移包括学习迁移和类比问题迁移,它们都是将某种结构从源域迁移到靶域中。类比的问题迁移是指从一个问题解决迁移到另外一个问题解决中,而学习迁移是指某种技能或知识迁移到另外一种技能或知识中。学习迁移的一个例子是,学会一种编程语言(如C语言)后,再学习另外一种编程语言(如Java)会觉得更简单。
(1)学习迁移的种类
(a)正迁移,一个情境中的所学能促进另一不同情景中的学习。比如学会开小汽车后,学开大客车会更简单。
(b)负迁移,一个情境中的所学阻碍或延缓另一不同情景中的学习。比如,习惯用安卓手机的人,在第一次用苹果手机时会有一种不习惯的感觉。
(c)垂直迁移,知识可以分为上位层次,基础层次和下位层次,即抽象与具体之分。垂直迁移即抽象向具体的迁移,如在学习金属知识后对学习铁知识的促进。
(d)水平迁移,指同一层次的迁移,比如学习数学后对学习物理的促进。
(e)特殊迁移,特殊迁移指某种学习内容只在特定范围内产生影响。如熟练掌握跳水的基本动作,对学习新的跳水项目的促进。
(f)一般迁移,移指某种学习内容对广泛范围学习内容的影响。比如,学会了"如何学习",可以促进对大部分不同种类的新知识的掌握。
(2)关于学习迁移的认知理论
(a)共同要素假说(Robertson,2001):这个假说认为可以通过两个领域的共同要素预测迁移效果。当源域与靶域存在部分重叠时,则存在部分迁移,如图25(a);当两个域完全重合时,存在完全迁移,如图(b);当源域是一个更加复杂的领域,并且包含靶域的全部要素时,源域能直接帮助靶域完成任务,如图(c);相反,当靶域比源域更加复杂时,源域只能部分的帮助靶域完成任务,如图(d)。在一项研究中,以大学生为被试,实验材料包括90个大小不同的平行四边形,首先训练他们判断平行四边形面积的能力,对被试者进行充分训练,直到他们能准确估计每个平行四边形的面积为止。再对他们进行测验。测验内容有两项:一项是判断与训练图形相似的长方形的面积,另一项是判断三角形或圆形的面积。结果表明,被试者对长方形面积的判断能力提高了,而三角形、圆形面积的判断能力没有提高。

图25
(b)认知结构说:学习者已有的认知结构是影响学习迁移的重要因素。因为,一切有意义的学习都是在原有认知结构的基础上产生的,学习者积极地利用旧知识理解新知识,把新知识纳入到已有的认知结构中,这个过程实际上就是有效的迁移过程。
六.问题的计算模型
1.陈述性知识和程序性知识
Anderson(1980)将知识分为陈述性知识和程序性知识。陈述性知识主要回答"是什么"和"为什么"之类的问题。它在头脑中既可以用词语和表象来表征,也可以用命题来表征。程序性知识是关于怎样行动的知识,它规定着一套行为或活动的程序,它主要回答"如何做"之类的问题。有些"如何做"是难以用语言表述的。比如许多人都会骑自行车,但却难以把骑自行车的程序性知识清楚地表述出来。程序性知识在头脑中用"条件"和"动作"来表征的,即当具备某种条件时,相应的动作便会发生。以"条件-动作"表征的程序性知识叫产生式,由若干个产生式构成的系统叫产生式系统(冉苒,2009)。
2.ACT理论(张积家,1991)
(1)陈述性知识和概念网络
ACT理论认为,可以用一个命题网络模型来表征陈述性知识。每一个命题由一个椭圆来表征,椭圆又由带标签的箭头连结它的关系和实体。命题、关系和实体叫做网络组织的节点,箭头叫做连结。
在ACT里,命题由一个主词的连结(标为S)和一个谓词的连结(标为P)构成。例如,图26(a)代表命题"知更鸟是黄色的",图(b)代表命题"凯撒死了",图(c)代表命题"狗是动物"。在ACT中,可以限定一个命题是真、是假、还是偶然。例如,图27(a)代表的命题"考试是容易的",将这一命题表示为"偶然的"可以表示为图(b)("考试是容易的"被"偶然的"修饰,也可以被"假的"、"真的"等副词修饰)。ACT还有一种结构是"关系-论证结构"。ACT理论还可以表示三元谓词,如图28代表的命题"John给Mary礼物"。

图26

图27

图28
(2)陈述性知识的特点
那么,ACT的命题网络如何应用以及它怎样同程序性知识相互作用呢?ACT作出了如下假定:
(a)陈述性知识在长时记忆中。在某一时刻,在长时记忆里只有一小部分节点处于激活状态,其它节点都处于不活动状态。
(b)从节点发出的每一条连结都有特定的强度,且某些连结比其它连结更强。连结的强度取决于其使用次数。一个刚形成的连结强度较弱,但随着连结的被使用,它的强度将不断增加。
(c)活动节点的激活总是向它所连结的不活动的节点扩散。两个节点之间的连结越强,激活就越有可能沿着这条连结扩散。激活扩散的总容量是有限的。所以,激活的连结越多,每个被激活节点所分得的容量就越少,搜索时间也越多。另外,如果一个源节点所激活的节点越多时(被注意到的节点),由于要对这些被激活的节点进行逐个排查以判断是否目标节点(序列搜索),检索时间也会更多。
(d)没有被激活的节点都会被抑制。
(e)激活表是ACT的工作记忆。ACT假定,在激活表里最多可保持10个节点,这些节点都是被激活的。
(3)程序性知识
在ACT里,程序性知识由一个产生式系统组成,这个系统包含了一系列的产生式。每个产生式包含两个部分:(a)条件,它将规定一系列特征;(b)行动,它规定如果条件被满足,那么将作出对应的变化。所以,一个产生式就是一个"如果一那么"结构。一个产生式系统就是由许多"如果一那么"结构组成。图29表示的是关于"越过一条街"的简单产生式系统,左边的是条件,右边的是行动,二者用箭头连接用于表示生产式。

图29
ACT的产生式具有两个特征:(a)产生式的条件既可以是知觉到的外部刺激(如红灯或绿灯),又可以是个人的内部目的和心理状态(如想越过街),这体现了人类的思想和行为是外部刺激和内部心理变量的函数;(b)行动既可以是外显的行为(如走),又可以是内隐的心理状态的变化(如改变目的)。如上例中,当个体看见绿灯之后,可采取两个行动,走过去或改变他的目的。
ACT关于程序性知识有两个假定:(a)每一产生式都有特定的强度,而且产生式每被执行一次,其强度就增值一次(条件和行动的连接强度)。因此,新形成的产生式其强度是弱的,但随着它们被使用,其强度会越来越大。(b)当所有产生式的条件同时激活时。强的产生式比弱的产生式提取(回忆)得更快。
(4)实证
这里取Anderson其中一个实验作为说明。在实验中Anderson设计了一些"一个(人)在(地点)里"形式的句子,如例19。在实验的开始阶段,被试需要先学习句子,如例(a)。然后,实验者提出一些诸如"谁在公园里?"或"嬉皮士在什么地方?"之类的问题要求被试回答。如果被试回答错误,被试就重新学习句子,直到记住全部句子的内容为止。在检验阶段里,一些检验句子在学习阶段出现过,即为真,如例(b);反之则为假,如例(c)。每个测试句子呈现之后,被试通过按按钮作出"真"或"假"的反应,并记下反应时间。句子的主项和谓项在学习阶段中有不同的出现次数,Anderson称之为"命题扇面"。比如"1-3一个律师在公园里"表示"律师"在学习句中仅出现一次,而"公园"出现过三次,其中"1-3"表示命题扇面。换句话说,命题扇面即概念的连接数。
例19
(a)学习句子
一个嬉皮士在公园里
一个嬉皮士在教堂里
一个嬉皮士在银行里
一个上尉在公园里
一个上尉在教堂里
一个消防队员在公园里
一个律师在洞穴里
一个新演员在银行里
...
(b)真的测验句子
3-3一个嬉皮士在公园里
1-1一个律师在洞穴里
1-2一个新演员在银行里
...
(c)假的测验句子
3-1一个嬉皮士在洞穴里
1-3一个律师在公园里
1-1一个新演员在洞穴里
2-2一个上尉在银行里
...
Anderson认为,在学习阶段,被试将在长时记忆中建立一个命题网络。在测验阶段里,被试将采用一个产生式系统,该系统包含4个产生式,如例20所示。例如,如果个人的当前状态是"准备",并且呈现的句子形如"一个VPER在VLOG里"(VPER代表某一个人名,VLOG 代表某一地名),那么生产式P1将被执行。此生产式的动作为将状态变化到"译码"并且复述VPER和VLOG两个名词。比如,如果呈现测验句是"一个嬉皮士在公园里",被试在大脑中将复述"嬉皮士"和"公园",这种复述把词保持在激活表里。在P1被执行之后,P2的条件就被满足,P2行动被执行,此时个体将状态改变为"检验",并且在命题网络中提取与VPER和VLOG相联系的概念,这些概念随后被分别分派到 VIDEA1(VPER(嬉皮士)相关联的概念,如"一个嬉皮士在银行里"、"一个嬉皮士在公园里"等)和 VIDEA2(VLOG(公园)相关联的概念,如"一个新演员在公园里"、"一个嬉皮士在公园里"等)里。如果在VIDEA1和VIDEA2之间发现交叉(即交集,"一个嬉皮士在公园里"),那么P3被激活;如没有发现交叉(没有交集),P4被激活。但是无论是执行P3还是P4,被试都将状态重新设为准备。
例20
产生式 条件 行动
P1 (状态=准备)和 (状态=译码)和
一个VPER在VLOG里 复述VPER和VLOG
P2 (状态=译码)和 (状态=检验)和提取与
VPER和VLOG VPER和VLOG相联系的概念,
然后将它们分派到VIDEA1和VIDEA2
P3 (状态=检验)和 (状态一准备)和按压真
VIDEA1和VIDEA2交叉
P4 (状态=检验)和 (状态一准备)和按压假
VIDEA1和VIDEA2不交叉
那么,命题扇面如何影响反应时间呢?根据ACT的激活扩散的假定,一个概念的激活将向它所连结的概念扩散,当连结越多,每个连结节点分得的激活量就越少。因此,如果一个测验句的命题扇面越大,那么它联系的节点就越多,需要搜索的节点也越多,与它相连节点的激活量也就越少,反应时间就越长。由此,ACT预言,对于命题"真"的反应,反应时间随着命题扇面的增加而增加。实验结果证实了这一结论。例如,命题扇面1-2和2-1几乎具有相同的反定时(计别为1167和1174毫秒),且都短于命题扇面2-3和3-2的反应时(分别为1233和1222毫秒)。对于命题"假"的反应有两个重要的发现:(a)对于特定大小的扇面,"假"的反应时比"真"的反应时慢;(b)反应时随命题扇面的增加而增加。根据ACT的假设,被试只有在检测完所有VIDEA1和VIDEA2没有交叉时才做出"假"的反应。而对"真"的反应是,只需发现交叉就能作出反应,而无需检测全部VIDEA1和VIDEA2。所以"假"的反应时要长于"真"的。而且,随着命题扇面的增加,VIDEA1和VIDEA2的集合大小会变大,因此反应需要花费的时间更长。实验结果与理论相符。
3.两种知识之间的转换(张二虎,2005)
陈述性知识向程序性知识的转化。这一过程可以分为三个阶段。第一阶段:知道某一规则并能陈述该规则。比如,小学数学中四则运算的法则"先乘除,后加减,先括号内,后括号外..."就是一种程序性知识,它可以指导学生进行正确的四则运算。当学生能够理解并说出"先乘除,后加减..."等话语时,表明他们已经完成了第一阶段的学习。第二阶段,通过应用和练习该规则,使规则由陈述性形式向程序性形式转化。比如,教师给出一些练习题:85+2x3-5x6=?如果学生能根据四则运算法则得出正确答案,表明学生已经开始掌握并内化该规则。但在这个阶段,学生对该规则可能还不够熟悉。第三阶段,是程序性知识发展的最高阶段,通过练习使该规则以达到相对自动化,如一看到"3*6-5"就能条件反射的开始计算。
从程序性知识到陈述性知识的转化,即将程序性知识陈述出来并记住。但并不是所有陈述性知识都能很好的被陈述出来的。