16-5 判断与决策(AGI基础理论)

《智能的理论》全书转至目录****

不同AGI的研究路线对比简化版:《AGI(具身智能)路线对比》,欢迎各位参与讨论、批评或建议。

一.判断的定义

判断是思维的基本形式之一,是"关于事物或其属性是否存在、其存在的概率是多大"的一种思维模式。比如向被试提问,甘地去世的年龄是否大于50岁、周星驰的电影票是否值30元、面前的是否熟人、大象是否比老鼠大等等。本质的,判断是对某一概念是否存在某种关系的推断。将上例中的描述换成"概念-关系"的形式可转变为:

甘地-去世的年龄-(?) (该"?"号是指关系的值,比如年龄"50岁")

甘地去世的年龄-是-(?) (同一信念可以被识解为不同的表征形式)

(甘地-去世的年龄-50岁)? (该"?"号是指概率值是否足够大以至于接受该信念)

(甘地去世的年龄-是-50岁)?

周星驰电影票-价值-(?)

周星驰电影票的价值-是-(?)

(周星驰电影票-价值-30)?

("视觉对象"-是-熟人)? (这里所指的视觉对象是一种视觉信息)

(大象的大小-大于-老鼠的大小)?

...

二.判断的形式

1.直接与非直接

根据是否能从记忆中直接获取,可以将判断分为直接判断和非直接判断。直接判断即直接从记忆中获取信念。如当你判断中国的首都是在哪个城市时,那么你肯定会毫不犹豫的说出是北京。之所以能直接回答,是因为大脑中存在这么一条关系"中国-首都-北京"。还如,当"猫-属于-动物"和"股票大跌-原因-公司领导不作为"等信念存在于大脑时,就能对问题"猫属于什么动物?"和"股票大跌的原因是什么?"作出直接判断。

当大脑没这样的关系时,或者说当对一个问题不清楚或者不太确定时,所作的判断就是非直接判断。对于这种问题,需要经过一定的直觉推理、启发式和逻辑分析才能进行判断。如"麦当劳的投资价值是否很大?","明天是否下雨?"等。

2.概念类型

在所判断的关系中(如"甘地-去世的年龄-50岁"、""视觉对象"-是-熟人"),其概念可以是不同类型的(如关系中的"甘地"和"视觉对象",前者是一种语言概念,后者是知觉概念)。在逻辑学中,判断指的是确定语言命题的真伪,其概念类型是符号。上述很多例子也是语言命题判断,但很多时候我们的判断都不需要通过语言。比如判断一个人是否熟人,判断一个声音的方位。这时,判断关系中的概念是一种知觉,而非语言符号。还有一种概念类型是数,如判断树的高度"这棵树的高度是2.16米"中的"2.16米"。当关系中的两个概念均属于数概念时,该关系是一种比较关系,如"大象的大小-大于-老鼠的大小"中的"大于"。

三.双加工理论

1.内容

双加工系统模型包括基于直觉的启发式系统和基于理性的分析系统(Sloman,1996)。启发式系统更多地依赖于直觉,并行加工且加工速度较快,不占用或占用很少的心理资源,模块化封闭运行,反应自动化,容易受背景相似性、刻板印象的影响,通常我们只能意识到其加工结果而意识不到加工过程。分析系统更多地依赖于理性,串行加工且加工速度慢,占用较多的心理资源,但分析系统不容易受背景相似性,不容易受刻板印象的干扰,主要基于规则进行,其加工过程和结果都可以被意识到。Stanovich和West(2000)分别将这两个系统称为系统1系统2。Kahneman(2011)在他的《思考,快与慢》一书中分别列举了系统1和系统2的例子(部分列举,如例1)。

例1

系统1:

确定两个物体孰远孰近。

确定突然出现的声源。

看恐怖片后作出的厌恶表情。

察觉语气中的不友善。

回答2+2=?

读广告牌上的字。

理解简单的句子。

系统2:

赛跑时随时作好起跑的准备。

在一个嘈杂拥挤的房间里关注某个人的声音。

保持比平常快的步行速度。

数出文章某页字母a的出现次数。

在狭小的空间里停车。

比较两款洗衣机的总功效。

检验一个复杂的逻辑论证的有效性。

回答17*24=?

2.两者的配合关系(Kahneman,2011)

(1)系统1推荐-系统2接受模式

系统1是自主运行的,而系统2则通常处于不费力的放松状态,运行时只有部分能力参与。系统1不断为系统2提供印象、直觉、意向和感觉等信息。如果系统2接收了这些信息,则会将这些信息转变为信念,将冲动转变为自主行为。通常情况下,一切都会顺利进行,系统2会稍微调整或毫无保留的接受系统2的"建议"。所以你一般会相信自己的最初印象,并依这种想法行动。如遇到"2+2=?"的问题时,系统1给出4的答案,然后系统2选择接受它。

(2)系统2的干预条件

当遇到下面一些情况时,系统2会作出干预,即任务由系统2接管:

(a)当系统1遇到麻烦时,系统2会出面解决。比如遇到"17*24"这样的问题时,系统1无法解决,大脑就会调动注意使用系统2来解决。系统1遇到的麻烦可以用认知放松度衡量。认知放松度可以看作一个刻度盘测量。认知放松度介于"放松"和"紧张"之间。放松是事情进展顺利的标志,没有障碍、没有新情况、没必要转移注意力或投入更多精力。感觉属性的、感觉真实的、感觉良好的、毫不费力的都可能造成认知放松。

认知紧张说明存在某种问题,且需要不断调动系统2参与其中。如若事情进展不顺利,你便处于认知紧张状态中。当付出的努力越多且不能获得满足时,也会造成认知紧张。

认知放松度是由系统1提供的。也就是说"任务进展是否顺利,是否有障碍、是否轻松..."并不是完全基于客观因素,也可以是基于主观的,即个体所认为的。举个例子,在某科目的课后练习中经常会出现题型A,因此学生对这种题型有较强的熟悉感,解题时也较为轻松。但在期末考试时,考题中有一道题型B,题型B与题型A十分相似。一些考生由于对题型B有一种熟悉感,很容易在未严格审题的情况下就将题型B误认为是题型A,并用了题型A的解题方法。正是这种主观上的熟悉感,让考生产生认知放松,从而未调用系统2进行严格审题,最终造成错误。

(b)自主反应(系统1)和控制意图(系统2)之间可能会存在冲突,这时系统2会抑制系统1所产生的冲动,即自我控制。比如在拥挤的派对中,一个突然的响声可能会引起你的注意,并自动的引起你对它的定位(系统1),但由于此刻你正在跟别人谈论一件重要的事情,所以你可以对该响声置之不理,甚至连头也没转(系统2)。同样在该派对中,面前的美食引起你想吃的欲望(系统1),但还是因为谈论重要的事情,因此你没立即去吃它,而是做你该做的(系统2)。另外,当遇到违反系统1设定的事物时,如使人吃惊的事,系统2会被激活并尝试作出解释。如猫发出狗的叫声、方块3变梅花A等等。

(c)认知努力:在日常行为中,努力无处不在,并且在目标导向行为中发挥重要作用。努力可以分为认知努力,比如在截止日期前完成一篇论文;体力努力,如把商品从仓库搬到超市。这里主要关注的是认知努力。认知努力是个体根据任务完成可能性和动机强度来决定认知资源的投入的调节过程。在个体进行任务时,付出的认知成本(耗时、误差可能性)、动机水平(认知需要、奖赏)、任务难度、认知疲劳等因素均会对认知努力的支出程度造成影响。

关于认知努力如何影响价值,目前有两种不同的争议。一种观点被称之为努力折扣理论,认为认知努力的付出是为了得到奖赏,人们对努力消耗资源具有厌恶性,因此往往避免付出努力。传统的经济学视角认为,付出的努力越多,获得的奖赏价值越低,因而努力作为一种成本,能够降低目标价值。具体的说,通过权衡努力的成本与收益来决定努力支出水平,成本与收益之间的差值称为净值,当价值越高(净值越大),决定付出的努力就越高;相反价值越低(净值越小),决定付出的努力就越少。该过程在一个额叶网络进行加工。在个体进行努力的净值评估时,这片脑区处于活跃状态。另观点是努力增强理论,该理论认为努力可以增加价值,个体更加珍视通过努力获得的结果,越是努力获得的东西,它们被赋与的价值越大。这两种理论均从认知努力的属性出发,对努力意义进行阐释。一些研究发现,人们在努力投入前表现出努力折扣现象;而在努力投入后表现出努力增值现象(钱一敏和潘发达,2022;姜慧萍,2023)。

认知努力与认知放松度的区别是,认知努力是对任务所需认知付出的评估,这个评估可以影响随后是否进行或如何进行该任务。比如,电视剧《三体》播放后,许多人对三体问题突然感了兴趣,但对于一些没有基础的人来说,研究三体问题需要付出巨大努力并需要学习很多东西,这种努力可能让人望而却步,也可能让某些人在业余时间关注但不会付出很多...。而认知放松度是在任务过程中,个体主观上所感觉的轻松或困难程度。

一般来说,当付出的认知努力越多且收获越少时,人们更倾向于使用系统1;相反,当认知努力越少且收获越多时,人们更倾向于使用系统2。

(d)系统2具有自我监督和控制的功能,当你就要犯错的时候系统2就会受到刺激并加速运作,如晚上开夜车的时候能够保持警惕。

注:概念解释:印象、信念和系统1的自主性

当看到下图1时,给人的第一印象是下面的线段比上面的长(系统1的印象),但事实上如果用尺子测量两条线段时会发现这么一条事实,两条线段是一样长的(系统2的信念)。即使你知道这条信念后,仍然无法控制系统1给你带来的直观感受,这说明系统1是自主的。

图1

3.系统1占优(孙彦,李纾和殷晓莉,2007)

双系统模型认为,系统1与系统2同时对决策或推理过程起作用,当系统1与系统2所判断的结果一致时,决策或推理的结果既合乎理性又遵从直觉。而当两个系统所判断的结果不一致时,两个系统存在竞争关系,占优势的系统可以控制行为结果。Kahneman(2002)认为,在两者的竞争中,系统1往往会获胜,这正是很多非理性偏差的根源。下面,首先给出例证,然后给出3种不同的解释。

(1)支持证据

下面例举了两个三段论推理的例子。当询问被试"假定每个例子的两个前提是正确的,题目给出的结论是否一定正确?"时,75%的被试认为三段论1的结论正确,而只有 10%的被试认为三段论2的结论正确(Evans,2002)。事实上,这2个三段论推理的逻辑结构是相同的,依据前提都不能推出结论。2个例子的差异在于,三段论1的结论符合人们已有经验而三段论2的结论不符合,结果是三段论1诱发了更多的非理性偏差。

从双加工模型的角度看,对于三段论1,系统2可以依据逻辑规则将其判定为错误,由于其结论与已有经验相一致,所以系统1将其判断为正确。两个系统对该三段论推理的判断不一致。但因为系统1比系统2占优势,因此大部分人认为其的结论正确。对于三段论2,系统2同样可以将其判定为错误,由于该三段论结论不符合人们的已有经验,系统2将其判定为错误。两个系统均将其判断为错误,所以大部分人认为三段论2的结论错误。如例2.

例2

三段论1:

前提: 易使人成瘾的物质没有便宜的

一些香烟是便宜的

结论:一些易使人成瘾的物质不是香烟

三段论2:

前提:警犬没有凶恶的

一些被严格训练过的犬是凶恶的

结论:一些警犬没有被严格训练过

(2)认知繁忙或认知懒惰

Petty与Wegener(1999)认为:因为决策者缺乏动机导致认知懒惰或加工负荷过高导致认知繁忙。所以,系统2很难启动被用于纠正系统1的非理性偏差。结果在两个系统的竞争中,系统1常常胜出。

(3)调整不足

一些研究(Epley和Gilovich,2006;Gilbert,2002)认为,在判断与推理的过程中,系统1因为加工速更度快,所以系统1先进行加工,随后系统2再对系统1的结果做出理性调整。但由于这种调整本身就具有内在的不充分性,所以最后的结果常常还是取决于系统1。

(4)直觉信心

Simmons与Nelson(2006)的研究发现,直觉信心才是导致这种偏差的关键:系统1产生的直觉判断越容易,其诱发的直觉信心就越强,这时如果产生偏差,就越不容易被系统2克服;系统1产生的直觉判断越困难,其诱发的直觉信心就越弱,这时如果产生偏差,就越容易被系统2克服。在他们的实验中,要求被试根据阅读的内容做出相应的判断。一组被试阅读的材料印刷较清晰,容易阅读,另一组被试阅读的材料印刷较模糊(但仍能辨别),不容易阅读,两组被试阅读的内容完全一样。但结果显示,阅读清晰印刷材料的被试直觉信心更强,系统1的作用更大,结果比阅读模糊材料的被试出现了更多的非理性偏差。

4.双系统分离的本质

双系统现象可能并不是由于真的拥有两个系统,而可能仅仅在于注意资源的差异。注意资源更多的时候表现出系统2的特性,注意资源较少时表现出系统1的特性。这里有一个例子可以说明,想象同时进行一个系统1任务和一个不太消耗注意资源的系统2任务的情况。比如一边散步一边回忆过往美好的事,散步属于系统1任务,回忆存在于我们的意识之中,因此属于系统2任务。但回忆对于我们来是一件很轻松的事,因此所占的注意资源并不会太多。此时回忆和散步可以同时进行。现在想象另外一种情况:同时进行一个系统1任务和一个消耗很多注意资源的系统2任务,比如一边心算(如23*78=?)一边散步,此时我们发现我们不能同时进行,要么停下脚步进行心算要么无法集中精神心算。之所以会这样,一个可能的原因是散步也需要注意资源(只是需要得不多)。当另外一个任务也不需要很多注意资源的时候(回忆),由于两个任务没有占满工作记忆,因此双任务能同时进行。但当另外一个任务需要大量注意资源时(心算),该任务占满了整个工作记忆,导致任务"散步"没分到半点资源,此时就会让人停下脚步。

四.直觉判断(庄锦英,2006)

直觉就是系统1的一种机制,而后面要说的可得性启发式、代表性启发式和部分锚定效应就是直觉判断的特例。可得性启发式主要依据事件或现象的频率和数量进行判断,代表性启发式主要依据事件或现象的类属进行判断,而锚定效应则是判断值的大小。

1.定义

根据韦伯国际词典的定义,直觉是指直接获得知识或获得一种确定状态而无需分析和推理,立即知晓或信服而无需分析。认知心理学家Bruner(1986)对直觉的定义则是获得一种可能的或暂时性的理论,而无需经过逐步的逻辑推理的智力能力,而这种理论经过逻辑推理的验证一般都是正确的或有效的。直觉判断实际上是一种经验判断,Epstein(2004)认为,就直觉而言,一切都是经验系统在运作。个体存在两个加工系统,一个是经验系统,它是后天学习的系统(获得的经验);另外一个是理性系统,它是逻辑推理系统,经验系统类似于系统1。而理性系统则类似于系统2。

2.透镜模型

Brunswik(1956)首先提出透镜模型,用以说明直觉经验形成的多通道模式。该模型最初是针对视知觉提出的,认为个体对物理世界的知觉来自于易出现错误的信息源,即线索。例如,我们要识别一个物体,物体的形状、光线的明暗等都是线索,多种线索帮助我们形成对物体的正确知觉。这些线索有时候可能存在错误,例如,我们一般认为朝阳或落日比日在中天时要大一些。

Hammond(1996)将Brunswik的视知觉透镜模型应用于社会和生活领域的直觉判断与决策的研究中,提出直觉判断的透镜模型。该模型将"线索"改称为"标志物"。在图2的左边,椭圆代表处在社会或物理环境中的不确定事物或状态。中间一系列椭圆代表标示物,标示物与不确定状态相联系,是反映不确定状态特点的线索,不同的标示物与不确定状态有不同的相关程度。如在判断某人的智力时,"反应速度"、"反应灵活性"、"表达逻辑"、"肢体动作"和"眼神"均是不确定状态"智力水平"的标志物。但不同标志物对智力等级具有不同的相关度,"反应速度"、"反应灵活性"、"表达逻辑"与智力相关度更高,使用这些特征判断是否高智力时其准确率更高,而"肢体动作"和"眼神"相关度则较低。我们要想知道他人内部的、不易观察到的特征或能力时,通常会借助外部的、易于获得的、可辨识的标示物进行判断。因此在图2的右边,标志物也会与个体相连接。但个体在判断时会赋予不同标志物不同的权重,即每种标示物在预测不确定事物过程中的相对重要性。如个体判断某人智力时,赋予"反应速度"和"反应灵活性"更高的权重时,表示个体在判断某人智力时会更依赖这两个特征。显然,一个正确的判断取决于个体是否将高权重赋予相关度较高的标志物上。如当赋予"反应速度"和"反应灵活性"更高的权重时,个体在判断某人智力时准确率更高;相反,当赋予"肢体动作"和"眼神"更高的权重时,准确率更低。

现实中也存在很多这样的例子,如在克林顿性丑闻事件中,克林顿向国会澄清自己,发誓说没有不正当行为时双肩微耸,这一细微线索被许多人捕捉到,并由此认为他说谎,事实证明他确实说了一个弥天大谎。我们经常会说某人"言不由衷"、"口是心非",多是从面部表情或身体动作得到与语言相矛盾的信息,因为语言可以说谎,而身体线索却不能。

图2

现实世界是不确定的,对于每一种不确定状态,都有许多线索(标示物)与之相联系,有些线索反映了不确定状态的本质,另一些线索只是不确定状态的假象或与不确定状态联系松散。个体在判断的过程中,一旦过于依赖后一类线索,就有可能作出错误判断或决策。这种判断由于对假象线索的使用,往往会导致错误的产生。但由于每个不确定状态都有大量的线索,因此,判断往往是稳定的,也就是说不会犯大错误。简单点说,就是在对一个不确定状态作判断时,因为所依赖的标志物很多,即使一些假象线索被错误利用,也可能会被其他一些线索"纠正",因此稳定性也较高。

五.启发式判断(Kahneman,2011;庄锦英,2006)

启发式被定义为一种解决问题或决策的技术,它使用少量的相关信息、过去结果和经验,在合理的时间内为问题产生可行和实用的解决方案。如在解一道数学难题时,如果这道题跟你以前做过的某些题目相似,都是同一种题型,那么你解决起来会容易很多,你会很轻易的利用之前的解题方法解决这道题。又如在2001年911恐怖袭击后的第一个月内,乘坐飞机的旅客数减少了20%,这是因为他们对飞机危险性的判断参考了这次恐怖袭击的经验。这里介绍两种主要的判断启发式,记忆可得性和代表性。

1.记忆可得性(Hastic和Dawes,2013)

记忆可得性启发式是指人们倾向于根据客观事物或现象在记忆中的获得的难易程度来估计其概率的现象。即对于那些凸显的、更容易回忆、提取更顺畅的记忆,给我们感觉其概率更高。

(1)生动的凸显信息

有时我们做出的判断取决于提取信息的凸显性(因此更可得)。比如我们正在计划一次航空旅行,这时飞机撞击世贸大楼的惨象很快闯进了我们的脑海,于是我们就改变想法了。比如,2001年"911"恐怖袭击后的第一个月内旅客乘坐飞机的数量下降了20%。另外,当询问"每年死于火车事故多还是飞机事故多"时,大多数被试会认为死于飞机多,这是因为新闻对飞机事故的过度报道,给人留下了深刻影响,由此高估了这个概率。实际上,死于火车事故的更多。

(2)近期发生的事件

对于进去发生的事件更容易被回忆。如在判断"离婚率是否在增长?"的时候,如果这时身边巧合有几个离婚的例子,那么将很容易做出离婚率很高并且一直在增长这样的判断。

(3)可想象性

Kahneman和Tversky(1973)做过这么一个实验,随机从一本英语书中取出一章,判断以R开头的单词多还是R在第三位的单词多。多数被试会认为前者比后者多,但实际上并不是。之所以出现这样的情况,是因为我们更容易回忆起R开头的单词,从而造成这种偏差。

(4)媒体传播

显然,当媒体的传播力度更大时。对于"死于肺癌的人数多还是死于车祸的人数多?"这个问题,实际上上个世纪70年代死于肺癌的美国人数是死于车祸的2倍多,但由于新闻媒体对车祸的报道更多,且不缺乏生动形象的画面。在判断死于肺癌更多还是死于车祸更多时,由于车祸画面更容易出现在被试的脑海里,因此被试通常回答死于车祸多。

(5)概率估计

事件的可想象性对事件概率估计也有相当重要的影响。请看一个实验,想象一个10个人组成的小组,然后从中选择K个人组成一个委员会,K可以为2或者8,请问K为2时委员会的组合数量多还是K为8时委员会的组合数量多?事实上两种情况的组合数量一样多(根据排列组合的数学原理),但是由于想象选择2个人组成的委员会比选择8个人的容易得多,因此凭借直觉人们会感觉2人的组合数要比8人的多。

(6)次可加性和超可加性

一项研究请了52名医生根据下面的描述估计住院病人出现不同结果的概率:(a)住院治疗期间死亡;(b)活着出院,但是一年内死亡;(c)活了1~10年;(d)活了10年以上。因为这四种情况穷尽了所有可能的结果,所以它们的概率之和应该为1。但结果是每个医生单独评估其中每一种的概率之和为1.64。这种现象被称为次可加性。出现这种结果的原因可能是因为某些事件具有较高的可得性。例如,"死于住院治疗期间"的描述使医生想到一些"死在医院中"的具体生动的例子(手术并发症、麻醉事故、术后感染等等),而其暗含的反向结果("住院治疗期间未死亡")却没有给想象提供有效的线索或联系。超可加性是一种相反的效应,是指在概率估计上整体要大于部分之和。这似乎是由于每个成分的可得性较低导致的。

(7)可得性启发式的过程

可得性启发式可被分解成几个子过程。当需要判断一类事件的概率或频率时(现在离婚率是否增高),被试首先从长时记忆中提取相关事件的回忆,如记忆中所见闻的离婚的例子;然后评估这些回忆的便捷性,即回忆项目的数量和回忆这些项目的流畅性。如能回忆到的离婚的例子是否多,或者这些例子是否很容易被回忆起来;最后根据回忆便捷性评估频率和概率,例子越多,回忆越容易,那么所评估的概率和频率就越高,反之则越低。

2.代表性

代表性启发式是指人们在作判断时可能会以判断对象特征与对象原型特征的相似性程度为基础。许多人第一直觉认为鲸鱼属于鱼类,是因为鲸鱼与鱼类具有很多相似性,比如都在水中生活,会游泳,都具有同样的流线性身型。同样的,也认为蝙蝠是鸟类,这是因为蝙蝠和鸟类一样,具有有翅膀和会飞的特征。

这种代表性启发式是忽视基础概率的。给出这样一段描述"一位大学生,朋友形容她有些不切实际,情绪化并且敏感。她会说法语和意大利语,并且游遍整个欧洲。她目前还不确定毕业后的发展方向,但是她已经证明过她有很好的才能,并获得多次书法奖。她在男朋友生日的时候写过一首诗作为礼物"。问这位学生是主修心理学还是艺术史。大部分人在这段话的诱导下会给出艺术史学生的答案,因为她很符合这类学生的特点。但是一项统计调查表明,在一所约1.8万人的公立学校中,约2300名学生主修心理学,学艺术史的仅仅15名。从基础概率上来看,是一名艺术生的概率相当低。现在看看另外一个例子,有一段描述"达林31岁,单身,说话直率并且性格开朗,她是一个哲学生,在学生时代她非常关注种族歧视和社会公平的问题,她还参加过反对核武器的游行示威"。然后给出两个答案,第一个答案是她是一个银行业务员,第二个答案是她是一个参加过女权主义运动的银行业务员。实验报表明,86%的被试认为第二个答案的概率比第一个答案的高。根据概率论,显然是"银行业务员"的概率要比"女权主义的银行业务员"的概率高,这是因为后者是前者的一个联合概率。之所以会出现这样的错误,是因为该描述与"女权主义的银行业务员"更为相似,匹配的特征更为之多(Kahneman,Slovic和Tversky,1982)。这两个例子的另外一种解释是对专业和职业的一种刻板印象。刻板印象是一种启发式判断,比如"德国人就是严谨","女生不合适学理工科"等等。这是因为严谨是德国人的代表性特征,有一种普遍舆论认为男生适合理工科,女生适合文科。

一个银币有两面,正面用H表示,反面用T表示,抛该银币6次,问序列"HHHHHH"的出现概率和序列"HTTHHT"的哪个高?事实上两个序列出现的概率一样高,均为1/2的6次方。但在这个问题中,大多数被试会认为出现第二个序列的可能性会更高。这是因为对比起HHHHHH,HTTHHT更为凌乱,而在日常生活中我们看到的序列都是凌乱的,因此HTTHHT更具有代表性,从而产生了判断偏差。

代表性启发式同样可以被分解成几个子过程。第一步是提取问题事例的特征列表,如鲸鱼的特征为"在水中生活","会游泳","流线性身型"等等;第二步是提取类别的特征列表,如鱼类的特征;第三步是匹配事例的特征和类别的特征,如匹配鲸鱼和鱼类的特征;第四步是根据匹配情况判断该事例属于该类别的可能性或概率,匹配程度越高,概率越高,反之则越低。

六.锚定效应

锚定效应是指在不确定的情况下,判断的目标值向 "锚"(即初始信息)的方向接近,从而产生估计偏差的现象(Epley和Gilovich,2001)。

1.类型

(1)传统锚定效应

锚定效应最早是由Tversky和Kahneman(1974)所发现的,在他们的实验中使用了两步式提问的方式引导出锚定偏差。实验的第一步为比较判断,通过转动幸运轮盘随机给每位被试一个随机数值(即锚值),并要求被试判断非洲国家在联合国中所占的比例是高于还是低于这个随机数值。实验的第二步为绝对判断,要求被试对所占比例的具体数值(即目标值)进行估计。幸运轮盘产生的数字被主试控制为10和65这两个数值,但被试以为是随机的。实验结果显示,当轮盘上得到数字为10时,被试估计占比的中位数是25%;当轮盘上得到数字为65时,被试估计占比的中位数是45%。这说明了锚值通过影响估计值的起点从而影响最后的估计值,使其产生了判断偏差。这种先让被试进行锚值与未知目标值之间的外显比较,接着对估计值作绝对值判断所产生的锚定效应称为传统锚定效应。因为在实验中,第一步问题(比较判断)与第二步问题(绝对判断)的情景内容(非洲国家在联合国中所占的比例)是相同的,即第一步问题可以作为第二步问题的语义启动,因此该实验范式也被称为语义启动实验范式。

另外一个实验(Tversky和Kahneman,1974)是,要求两组被试分别在5秒钟内估计数字的乘积,一组被试估计8×7×6×5×4×3×2×1的乘积;另一组被试估计1×2×3×4×5×6×7×8。结果发现,被试估计第一道题的中位数是2250,估计第二道题的中位数是512。两者的差别很大,并都远远小于正确答案40320。导致这种差异的原因可能是在时间紧迫的情况下, 大多数被试的算法是:先计算前几步,得到一个初始值(锚),然后对初始值作(不充分)调整(即增加或减少初始值,但是这种调整往往是不足的),从而得出回答。由于第一个式子的初始值较高且调整是有限的,因此得出的估计值也比较高;而第二个式子的初始值较低,因此得出的估计值自然较低。

Strack和Mussweiler (1997)的研究表明,如果比较任务的情景内容和绝对判断任务的不一致时,所产生的锚定效应会比一致的低。例如比较任务为"勃兰登堡门是高于 150 米还是低于 150米?"。当它们的情景内容一致时,绝对判断任务为"勃兰登堡门的高度是多少?";而当情景内容不一致时,绝对判断任务为"勃兰登堡门的宽度是多少?"。结果表明内容一致时所产生的锚定效应要显著高于内容不一致的。

(2)基本锚定效应

传统锚定效应的发生原因可能是语意启动效应,如果第一步仅单独呈现一个数字(没有语义背景内容,或者说前后两步的情景内容不同),那是否仍会产生锚定效应呢?Wilson等人(Wilson,Houston和Brekke等人,1996)在实验中给被试呈现一个ID号码或者让被试抄写数字,并告诉他们这个数字是随机的,之后让他们估计"本地电话簿里内科医生的人数是多少"或"大学生未来40年患癌的人数"等问题。实验结果表明,即使单独呈现数字(ID号码或抄写的数字)(这种情况没有语义启动),也不需要用该数字与目标值比较(即没有比较问题,如不要求比较ID号码与内科医生数的大小),该单独呈现的数字仍会影响被试的最终判断。即呈现高ID号的被试或抄写大数字的被试所给出估计值更高,相反则给出更低的估计值。这种现象被称为基本锚定效应,该范式被称作为数值启动范式。有研究者指出,基本锚定效应很微弱,在其他情景难以得到重复验证的(李斌等人,2010)。

(3)自发锚定效应

Epley和Gilovich(2001)在研究中发现,根据锚定值的来源,可以把它们分为两种:外部锚和自发锚。其中, 外部锚是由其他人提供的参照值,上面所述的传统锚和基本锚就是外部锚。自发锚是指个体根据自己以往经验及获得的信息线索而在内心自行产生的比较标准。如提问"华盛顿什么时候被选为总统"时,由于很多人都知道美国在 1776 年独立, 华盛顿的当选应在此后不久。因此被试就会把"1776"作为一个锚定值,然后开始往后调整,这里"1776"就是自发锚。自发锚定效应就是由自发锚导致的一种锚定偏差。

2.心理机制

锚定效应到底是由什么机制使其产生的呢?目前有以下五种解说。

(1)不充分调整模型

Tversky和Kahneman(1974)最先以不充分调整理论解释锚定效应。他们认为,在判断过程中,个体把锚值作为调整的起始点进行不断的调整,如果被试认为正确答案大于锚值,就会使估计值(从锚值)往上调整;如果被试认为低于锚值就会往下调整,直到调整到一个可以接受的数值。但通常情况下,使个体满意的数值是一个可行区间,调整过程会在可接受区间的边界终止,所得的估计值是区间边界值而非更合理的区间中间值,因此这种调整过程往往是不充分的。换句话说,由于个体并不知道准确的目标值,因此只能将目标值限定在一个范围内。当锚值在该范围外,个体就会以锚值作为起点,对估计值进行调整,当调整到估计范围的边界,就停止估计,并将该边界作为最后的估计值。但是,通常情况下范围的中间值比范围的边界值更为可取。

其后Epley和Gilovich(2006)对不充分调整的心理机制作出了更精确的解释。在判断的开始,个体首先会在锚值的基础上初步调整出一个可能的数值,然后再精确判断该数值是正确答案的可能性是多大。如果这种可能性达到个体内心的标准并让个体感到满意,则停止调整并做出判断;如果个体不满意则会继续进行调整直到一个满意可行的数值出现。但个体往往会以一个可的行数值范围作为判断标准,只要估计值踏入该范围便感到满意而停止调整。

(2)选择通达模型

Strack和Mussweiler(1997)对不充分调整理论提出质疑。不充分调整理论的前提是,当锚值在个体可接受的区间范围之外时,个体才以锚定值为基点进行心理调整。如果锚值在个体可接受的区间范围内,个体则很难再做调整。但 Strack和Mussweiler的研究却表明,即使给予的锚值在可行范围内,锚定效应也同样会发生。他们认为锚定效应的产生并不是因为不充分调整,而是前后两步问题所激发的信息通达性造成的,并由此提出了选择通达模型。该理论认为,当个体对目标值进行判断时,首先假设锚值就是目标值,并积极从长时记忆中寻求锚值就是目标值的证据。例如,当判断者思考"非洲国家在联合国所占的比例是高于还是低于65%"时,首先就从"非洲国家在联合国所占的比例是65%"的假设检验入手,由于思维的惯性或对于假设检验的语义启动,支持这一假设的证据更容易从记忆中被提取,从而造成判断偏差。

此外,Mussweiler和Strack(2000a, 2000b)认为专家知识或技能通过三种方式影响锚定效应的发生。首先,当被试知道真实的目标值时,能直接从记忆中提取目标信息并作做出正确判断。如判断中国的首都,被试能直接回答北京。其次,如果被试不知道真实的目标值,但有一些关于此类问题的其他知识。例如当要求被试判断密西西比河的长度是多少时,虽然他不知道该河的具体长度,但他可能知道(所有)河流大致的长度范围,随后他就可能运用这些知识去判断任务。这类被试受到锚定信息的影响相对较小。最后,如果被试既不知道正确的目标值,又缺乏关于这类问题的知识,被试才会选择选择通达模型进行判断,此类判断最容易受到锚定信息的影响。

(3)双重心理模型

正如Epley和Gilovich(2001,2004,2005,2006)将锚分为外部锚和自发锚。选择通达模型只适用于外部锚引起的锚定效应,但并不适用于自发锚导致的锚定效应。如果认为外部锚可能是一个正确答案,被试必定会努力思考外部锚并由此导致了选择通达性的产生。但如果锚定效应是由自发锚引起的,个体应该很清楚自发产生的锚值绝对不是正确答案,选择通达机制也不会被激发,此时被试只以自发锚作为基点进行不充分调整。因此Epley和Gilovich认为锚定效应的产生可能存在两种原因:不充分调整和选择通达性。前者存在于自发锚定效应中,后者则是外部锚定效应的心理机制。

对于数字启动下的选择通达模型,其驱动力往往来自于自动化的心理加工过程,努力思考对于这种心理过程并没有什么影响。这种额外的努力思考所能做的,是引导被试产生一些证据,用于对"锚值可能为目标值"的假设进行确认,否则这些证据有可能考虑不到。与之相反,自发锚启动了努力思考的心理加工过程,基于自发锚的调整是有意识的和深思熟虑的。因此,被试在回答自发锚的问题时,能够有意识地报告在调整过程中所进行的加工,而在标准锚定范式下则无这样的调整过程报告。

(4)自我锚定(Hastic和Dawes,2013)

当我们需要对一些我们不是很了解的人做出决策时,我们往往会进行一种以自我为中心的推断过程。在一项校园调查中,问大学生,他们是否愿意在校园中表现出一些大胆的、夸张的行为(例如,挂着写有"忏悔"大字的牌子在校园中步行30分钟)。如果他们进行了类似的行为,身边会有多少比例的学生也愿意与他们一样进行类似的行为?那些愿意挂着"忏悔"牌子在校园中步行的被访者们认为,他们身边会有63%的人做出这样的行为;而不愿做出如此夸张行为的被访者们则认为,如果自己做出这样的夸张行为,那么在身边仅会有23%的人做出这样的行为。

(5)"今"为"古"锚(Hastic和Dawes,2013)

尽管回忆是对过去实际发生过什么的过程,但它在很大程度上是以我们现有的信念和感受为"锚"的。一项研究对被试在1年后和2.5年后进行了追踪调查。在每一次调查中,受访学生都会被问及他们在之前的调查中报告自己使用了多少(烟草、酒精以及非法毒品)。结果显示,那些饮酒量在最近 2.5年内不断增加的受访者,此时对自己 2.5年前酒精使用量的估计远高于他们 2.5 年前的报告。

3.物理量

锚值不应只局限于数值形式,某些物理形式的刺激也可以作为锚定值对个体的估计判断产生偏差影响。LeBoeuf和Shafir等人(2006)以不同长度或重量的刺激作为锚值,探讨了这些刺激对个体估计判断的影响。与数值锚定值的研究结果一致,研究发现大的物理锚值使被试调整出偏大的物理量,而小的物理锚值使被试调整出偏小的物理量。

七.决策的定义(Kahneman,2011)

决策是为了达到一定目标,采用一定的科学方法和手段,从两个以上的方案中选择一个满意方案的判断过程。简单点说,它是一种带有目的性的判断。在生活中,决策无处不在。如晚饭要去哪里吃、是吃面还是吃饭、放假去哪里玩、在国内玩或者出国玩、坐什么交通工具上班不会迟到、是否做膝盖手术、工作还是读研、是否要结束恋情、杜鲁门支撑马歇尔计划的决定等等。决策对物种具有适用性的意义。这个猎物要不要捕?如果捕猎那么有可能有好的方面,如获得食物;当然也有不好的时候,比如捕获不了并且可能还会受伤;但如果不捕猎就没有食物。动物只有在各种可能性中作出最佳的决策,才能更好的生存下去。

决策(以确定型风险决策为例)可以用一个形式化的框架表示,它由三部分组成:(a)完成一件事可能有不同的可选方案,如在驾车的路途中遇到了分叉路,一条向左另一条向右,且这两条路都可以通往目的地;(b)每个可选行为都可能有多个情况,而每个情况有其对应的概率。如当选左边的分岔路,可能情况是这条路很通畅,能很快就到达目的地;也有可能很拥堵,使花费在路上的时间大大增加;同样的当选右边的分叉路,这条路可能很通畅,也可能在施工,或道路被封锁。每种情况均有其概率,假设当时间为工作日的下班时间时,左边分岔路为通畅的概率只有5%,而拥堵的概率为95%;(c)行为人对每个情况都会有一个价值评价,这个价值评价是依据行为人当前的状态和个人价值观确定的。比如,对于很赶时间的人来说,对塞车的评价会特别低,而对道路通畅的评价很高;而对于不赶时间的人来说,对塞车的评价会相对没那么低。

总的来说,可以将以上三方面结合起来,形成对一个行为的总评价,并且可以根据不同行为的评价选择出最佳的行为。如上面所述,一个行为可能存在不同的情况,每种情况有其概率与情况的评价,因此每个行为的价值函数可表示为V=∑pi*vi,其中i是该行为的第i个情况(b部分),pi表示该行为情况i的概率(b部分),vi表示该行为情况i的价值(c部分)。得到每个行为的价值后,决策的最后一步就是选择价值最大的那个行为。

这里用一个完整的例子说明。图3显示了治疗某种疾病的决策框架,(a)有两种行为方案可供选择,做手术与不做手术。(b)对于不做手术的行为方案,有膝盖恢复正常和膝盖状况不好两种情况,两种情况对应的概率分别是0.3和0.7。而对于做手术的方案,有膝盖恢复正常和手术失败两种结果,对应的概率为0.65和0.35。(c)现在对这些结果做一个评价,不做手术且自然恢复的评价是100分,不做手术且膝盖状况不好的评价是20分,手术成功且把问题解决了的评价是80分,手术了但手术失败的评价为0分。决策要做的就是对两种行为做一个综合的评价,不做手术的方案评价为0.3*100+0.7*20=44,做手术的方案评价为0.65*80+0.35*0=52,因此做手术的方案评价比不做手术的高。根据两个行为评分的比较,应该选择做手术。

图3

八.标准化决策理论-期望效用理论(Kahneman,2011;庄锦英,2006)

1.效用

(1)理性经济人假设

理性经济人假设是Adam Smith在他的《富国论》一书中提出,它包含三个命题:(a)经济人是自私自利的,即个体经济行为的根本动机是追求自身的利益;(b)经济人的行为是理性的,即他能根据市场处境判断自身的利益,并使自己的谋利行为符合从经验中学到的东西,从而使追求的利益尽可能最大化。(c)如果有良好的法律制度作保证,经济人追求个人利益最大化的自由行动会无意识地、卓有成效地增进社会的公共利益。因此,人们在做决策的时候,应该是以选择价值最大的行为为准则。如上例中,不做手术的评价为44,做手术的评价为52。V(手术)>V(不做手术),因此选择"做手术"。其中V()表示价值。当存在两个行为选择以上时,如行为A和行为B,且当V(A)>V(B)时,行为者偏向选择行为A。

(2)期望

在做决定的时候,人往往不局限于眼前。中国有句成语叫先苦后甜,即便当前的效用是负的,当将来有巨大利益时,人们也会选择接受它。比如在考虑读研和工作的决策上,虽然选择工作马上就能获得收入。但如果读研,以后的收入可能会更高。因此,价值不应该仅仅是指当前的收益,也应该是将来的。这里,价值V()进一步发展为EV(),EV()表示一个行为的预期收益。当存在两个以上的可选行为时,如行为A和行为B,当EV(A)>EV(B)时,行为者应偏向选择行为A。要注意的是,每个行为均可能有多种结果(如上例中,做手术可能会成功,也可能失败从而膝盖变得更差)。因此EV()所表示的是该行为多种情况的评价的概率平均值,如EV()=∑pi*evi,其中evi表示第i种情况的预期收益。

(3)效用

(a)圣彼得堡悖论

瑞士科学家Nicolaus Bernoulli提出一个问题。一个抛币游戏,当一个抛币者抛中正面时,将有权再投一次。如果他抛中反面,那么他将获得2n元,其中n为抛币次数。如果第一次就抛中反面,那么他将得到2元,第二次抛中反面,那么将会得到4元...。因此,该游戏的预期收益为:

EV玩游戏=2(1/2)+4(1/4)+8(1/8)+...+2n(1/2n)=1+1+1...+1=∞

即选择玩这个游戏的预期收益为∞,但当问被试愿意付多少赌金参与这一游戏时,多数人不愿意付太多的赌金,几乎不超过10元。对于一个预期获益无穷大的游戏,人们却只愿意付很少的赌金去玩,这与预期理论相违背。又因为这个悖论发表于圣彼得堡的一本杂志上,因此它又被称为圣彼得堡悖论。

(b)效用函数

早期的经济学中使用货币价值分析行为,认为人们是基于客观价值的最大化影响决策。但在后期研究中发现,同样的客观价值给每个人带来的主观感受都是不一样的。因此Nicolaus Bernoulli的堂弟数学家Daniel Bernoulli提出效用这一概念,认为价值评判所使用的不是客观价值而是效用。效用是对客观价值的主观感受,是一种心理度量。后来的经济学将效用定义为:个体在一定时期内消费一定数量的商品或获得某种服务后的满足程度。有时被广泛理解为金钱、福利、商品或服务等给人带来的满足程度。由于每个人的价值观和需求都不同,因此同样的客观价值对每个人的效用都是不同的。比如同样是100元,对一个乞丐和一个富豪来说其意义完全不同。

期望价值EV()进一步发展为期望效用EU(),这种客观价值(刺激)与主观感受(心理量)的关系符合费希纳定理(11-6:数)。因此,期望价值与期望效用的关系可以表示为EU()=lg(EV()),该关系如图4所示。当存在两个以上的可选行为时,如行为A和行为B,当EU(A)>EU(B)时,行为者偏向选择行为A。要注意的是,EU()表示某个行为多种情况的期望效用的概率平均值,EU()=∑pi*eui,其中eui表示第i种结果的预期效用。

使用效用能很好的解释圣彼得堡悖论,当将预期收益改为预期效用时:

EV玩游戏= lg(2)(1/2)+ lg(4)(1/4)+ lg(8)(1/8)+...+ lg(2n)(1/2n)=lg4

因此,玩该抛币游戏的期望效用是有限的,所以人们一般不会花很多钱玩。

图4

事实上,许多体验都能同时引起正面效用和负面效用(Coombs和Avrunin,1977)。 食物就是其中一个例子,一方面,当食物越来越多的时候,每吃一口所带来的喜悦感会逐渐降低,所谓好的东西使人生腻就是这个道理;另一方面,随着所吃的食物量增大,食物中的热量、脂肪等造成的问题也会越来越大。而且这种坏处会逐渐升级,即每天摄入超过正常水平500单位卡路里的坏处,要比摄入超过正常水平200单位卡路里的坏处的两倍要多。另外一个例子是关于度假,刚开始度假的前几天给人带来的是愉悦感,但是随着度假时间的增长这种享受开始变得没那么明显。同时,由于度假时间过长,工作挤压的也会越来越多,从而带来不好的体验。因此,对于好的评价,其收益与数量之间的关系函数有一个正的且逐渐减少的斜率;对与负的评价,损失与数量之间的关系函数有一个负的且绝对值逐渐增大的斜率。当两种评价同时叠加在一起时,总的评价就是一个单峰函数,如图5。这告诉我们,万事都要取中庸之道。东西既不要缺少,也不要太多,适量就好。

图5

对于物理量刺激(重量,气温等)的感受,需要在刺激存在的时候我们才能感受到。如对重量的感知,当我们提着重物时才能感受到其重量,而重物不存在的时候我们无法感受到这种刺激。但心理量则不同,它可以在刺激不存在的时候影响我们。比如,在吃完某种美食后,美食刺激已经不在,但是它所带来的满足感仍然留在心中。心理量还能在时间轴上累积。如果小张很喜欢吃巧克力,第一天吃它的时候小张感觉很满足,第二天吃它就没那么满足了(还有满足感),在连续吃一个星期后小张已经对巧克力无太大兴趣。这个例子的问题在于,这七天的巧克力不是同时呈现给小张的,而是在不同的时间上出现的,且心理量在不断累积。心理量的另外一个特点是,当刺激持续不在时,心理的满足量会随着时间慢慢减少,直到恢复如初。比如小张吃了一个星期的巧克力后,间隔半年他可能又会对巧克力重新抱起兴趣。

2.概率

(1)客观概率

决策中的概率可以从客观统计中获得。在一个特定试验中,某特定事件的概率等于在一系列无限"相似"试验(或观察)中该事件发生的相对频率。其公式为p=k/n,其中n是独立的相同的试验次数,p为该事件出现的次数。根据大数定律,当n趋近于无穷大时,频率p趋近于该事件的客观概率。如抛银币游戏,当抛的次数越接近无穷次时,为正面的频率越接近1/2。

(2)主观概率

在客观概率的解释中,对于"无限相似试验"这件事,往往是不可行的或不适当的。因为在现实世界中,人们遇到的不确定性事件往往都是一次性的或少数几次性的可能事件。比如在一个新城区的一个刚刚开业的商场,为了有更好的销路,小明纠结选择铺面A还是选择铺面B。当使用客观概率计算效用时,在小明的经验里(或者网上能搜到的)能遇到的相似事件极少(即无法达到大数定律的要求)。因为在这个世界上,在类似的区域开类似的商场(包括区域人口、职业分布、文化习俗、商场结构等因素都相似)这种事是极少的,客观概率很难得到。事实上,我们在做决策的时候使用的不是客观概率(起码在事件客观概率不清楚的情况下,我们仍然能做决策),而是使用另外一种心理量。这种心理量被称为事件的主观概率。

主观概率有两个特点,一是它反映了人对事件出现可能性的一种信念程度,对同一事件,不同人对它的主观概率的定量判断可能不尽相同。二是它决非是主观臆断,而是基于对事件已有信息(知识、经验、预测等等)的一种理智上的判断,也包括个体遇到过的类似情况下的事件出现频率。

3.决策准则

期望效用理论认为,个体偏好(行为效用的计算与行为的选择)的运算遵循一系列公理。这些公理是个体决策符合理性的体现,也是能够使效用达到最大化的手段:

(a)占优性:是指决策者永远不会采用被其他策略占优的策略。也就是说,决策者永远都会选择那些具有优势的策略。所谓的"占优"又分为弱式占优和强式占优。弱式占优是指一项行为至少在某一方面好于其他行为,并且其他方面也不差(即至少与其他行为相等)。如中国产品与国外产品相比,具有价格优势,且在产品质量上相差无异;强式占优是指一项行为的每一方面都比其他行为的好。比如,微创手术与传统手术相比,在恢复、创伤、价格、病人承受疼苦等方面全面占优。

(b)传递性:如果一个决策者在方案A和方案B中偏好A,在方案B和方案C中偏好B,那么在方案A与方案C中决策者肯定偏好方案A。

(c)独立性:即决策者对于两个行为或结果的选择,不会受到第三个不相干的策略影响。比如说,在商品A和商品B的选择中,消费者选择了商品A。当这两个商品和商品C捆绑销售时,即对商品A加C和商品B加C的选择时,消费者会选择商品A加C。

(d)完备性:对于任何两个结果X和Y,决策者都能给出其优先次序,要么X优于Y,要么X劣于Y,或者X和Y一样好。比如有两份求职简历A和B,要么A更合适该职位,要么B更合适该职位,或者两个人都一样合适。作选择时一定只有这三种的其中一种可能出现。

九.描述性决策理论(庄锦英,2006)

1.阿莱斯悖论

Allais(1953,1979)对期望效用理论进行研究后设计了一个实验,如下例3所示。在问题1中,大部分被试选择选项1。而在问题2中,大部分被试选择选项2。

例3

问题1

选项1:肯定获得100美元

选项2: 有10%的概率获得500美元

有89%的概率获得100美元

有1%的概率获得0美元

问题2

选项1:有11%的概率获得100美元

有89%的概率获得0美元

选项2:有10%的概率获得500美元

有90%的概率获得0美元

上述的选择可以通过计算进行分析:

在问题1中,大部分人的选择选项1。根据决策理论,选项1的效用应该比选项2的高。其中,u()为期望效用函数:

1*u(100)> 0.1*u(500)+0.89*u(100)+ 0.01*u(0)

→1*u(100)> 0.1*u(500)+0.89*u(100) (0的效用为0,因此u(0)为0)

→1*u(100)-0.89*u(100)> 0.1*u(500) (两边减去89%的概率获得100美元)

→0.11*u(100)>0.1*u(500) (结论)

在问题2中,大部分人选择选项2,因此选项2的效用应该比选项1的高:

0.11*u(100)+0.89*u(0)<0.1*u(500)+0.9*u(0)

→0.11*u(100)<0.1*u(500) (结论)

从上面的分析可以看出,问题1和问题2的结论中出现了矛盾的,这违反了期望效用理论中的独立性原则。实际上,问题2其实是由问题1演变而来的。对问题1减去"89%的概率获得100美元"后,问题1就变成问题2,简单点说就是两个问题的效用情况应该相同。这就是阿莱斯悖论。

除此之外,埃尔斯伯格悖论,偏好反转等发现同样违背了期望效用理论,这说明期望效用理论存在问题。为此,众多学者提出了一些列的替代理论,其中比较著名的就是美国经济学家Kahneman和Tversky(1979)提出的前景理论。

2.有限理性

(1)决定论

客观世界的决定论认为,世界是确定的,不确定性或概率是由于人类思维的局限。比如抛银币猜正反面,如果我们能获知硬币下落的全面的精确的信息,比如抛时精确力度、硬币重力和密度分布、空气阻力、空气流动、精确重力加速度等等,并且有计算这些信息的算力,那么我们就能知道硬币抛下后的正反面。正由于我们缺乏这样的能力,我们才会用概率表示未知事件(1/2正面,1/2反面),概率只是我们表征这个客观世界的一种工具,而非这个世界的本质。法国科学家Pierre Simon de Laplace认为,假如存在这样一种智力,它可以理解所有的自然推动力量,并且知道组成自然各要素的状态;再假如这种智力有足够大的能量可以分析这些数据,那么它就可以将大到巨大天体,小至最轻原子的运动放到同一个公式中去。对它来讲,没有什么是不确定的,将来就像过去一样摆在它的眼前。美国心理学家Robin Miles Hogarth认为,认识到我们居住在一个概率环境中是非常重要的,但是环境有其自身特点,它并不是一种概率,仅仅因为我们对环境的表征不完美,才造成环境的概率性。因此,不确定性是由我们自己造成的,而不在环境。

(2)有限理性的内涵

有限理性理论是Simon(1955)提出的。该理论认为,首先环境是复杂的,不确定的,信息是不完全的。因此人不可能掌握完备的信息(用以决策)。其次人的认知能力是有限的,人不可能洞察一切,找出全部备选方案,也不可能把所有参数都综合到一个单一的效用函数中,更不可能精确计算出所有行动方案的实施后果。因此,个体总是在自己掌握的信息范围内追求理性。现实生活中的人是介于完全理性与非理性之间的"有限理性"个体。Simon将理性区分为程序理性和结果理性。当行为过程符合规范的标准时,该行为就是程序理性。在一定的条件和限定范围内,当行为能够达到预定目标时,它就是结果理性,行为的结果理性取决于某项行为是否达到了预定目标,而不管其行为过程如何。我国学者庄锦英从感觉、知觉和记忆三方面论述有限理性。

(3)感觉

感觉的限制是有限理性的因素之一,比如人的可见光频率范围约为380~750THz。只占整个光谱范围的很小的一部分。另外一个例子是2004年12月26号东南亚地震海啸中,造成了斯里南卡2.2万人遇难,但却很少发现动物尸体。这是因为很多动物的感知能力远在人类至上,它们能感知地震海啸的危险到临,不少动物在海啸来临之前就已经逃离到安全地区...。

(4)知觉

人的知觉是有限理性的原因。知觉的选择性是指个体只能对作用于感觉器官的部分刺激进行反应。知觉的这种选择性不仅受主体经验、兴趣、爱好等主观因素的影响,还受刺激物、环境等客观因素的制约。如在下图6中一些人可能会看到一个酒杯,一些人可能会看到两个侧面,这取决于人们的注意是在黑色部分还是白色部分。这个例子说明,人不可能绝对客观的知觉一个事物,知觉具有主观性。

图6

(5)记忆

人的记忆是有限理性的原因。人的短时记忆容量大概是3-9个组块。当思考一件事时,如果需要同时兼顾多个要素,短时记忆可能是不够用的。比如对比两款手机,人们总是没办法同时兼顾品牌、价格、ram和rom等各种手机参数,即没办法同时把这些参数放在大脑中对比。有研究表明,爱因斯坦智商高的原因是因为他的短时记忆容量要比普通人的高。另外,回忆是构建的而不是提取的,并且在构建的过程中可能还会经常犯错。Bartlett(1932)曾经做过一个著名实验。实验开始,给一名被试观看一幅图片------猫头鹰(原图),半小时后,请该被试凭记忆将看过的图片绘制出来。之后,给第二名被试观看第一名被试绘制的图片,然后半小时后凭借记忆将看过的图片绘制出来,依此类推,至第10名被试时,图片已经被绘制成一只猫。如图7。

图7

(6)其他

除了这些,人们在判断的时候更倾向于使用激活程度高的概念,比如惯性思维或启动效应。人是基于知识思考的,但人总是无法穷尽所以知识,因此思考也是基于有限的知识。另外,影响决策的还有个体的情绪,风格等。因此,人并非全是理性的。

有限理性是描述性决策理论的基石。其中,最主要的描述性决策理论是前景理论。

3.前景理论(Tversky和Kahneman,1979)

前景理论包括了编辑和评价两方面。其中编辑对决策的问题进行编码,它分为框架和参考点两个部分。而评价则是在编辑的基础上,使用价值函数对每个行为进行效用分析,它可以表示为V=∑π(pi)*vi(x),其中π为概率pi权重函数,x为客观价值,vi()表示前景理论的效用函数,i表示第i个行为。

(1)框架

框架就是对问题进行表征。即对问题的表述进行识解(19-19:认知语法),不同的识解方式得到问题的表征不同。下面的一个例4用于说明框架的作用(Kahneman和Tversky,1981)。

例4:亚洲疾病问题

假设每个将要爆发一场疾病,预计会有600人感染该疾病,该疾病的治疗方案有两种,下面使用两种框架分别对这两种方案进行表述:

框架1

如果实施方案1,可以救活200人。

如果实施方案2,有1/3的概率救活全部共600人,但2/3的概率这600人会全部死亡。

框架2

如果实施方案1,会死400人。

如果实施方案2,有1/3的概率600人无一人死亡,但有2/3的概率600人会全部死亡。

实验结果显示,在框架1中,72%的被试选择方案1,表现出规避风险的倾向。但在框架2中,78%的被试则选择方案2,表现出冒险的倾向。两个框架的内容是一样的,只是框架不同而得出不同的问题表征,进而影响决策。

(a)维度

框架具有维度性,比如上述的积极和消极两个维度,当框架表现出积极维度时,个体表现出规避风险的倾向;而当框架表现出消极维度时,个体表现出冒险倾向。

(b)焦点与边界

焦点和边界是关于对问题的注意分布。注意所在的区域称为焦点,其他注意较少的区域称为边界。比如解决一个问题有两种可选方法,一种方法效果比较好,但它效率(如解决问题花费的时间和金钱)比较低;另外一种方法效率高,但它效果比较差。选那个方法,取决于决策者焦点和边界的分布。如果焦点是效果,效率是边界,那么选择第一种方法;如果焦点是边界,边界是效果,则选第二个方法。

(2)参照点

参考点是指以效用函数的某个值为比较标准。同一件事,不同人有不同参考点。比如对于乞丐和富人,捡到100块的效用是不同的。假设乞丐的财富值为0,100块对于他来说其效用的变化是很大的。根据费希纳定理,其参考点在效用函数的0点,因此斜率很大,变化100块效用变化量也会很大;对于富人而言,其参考点在效用函数的斜率很小,因此仅增加100元效用变化不大。另外,有一个现象,很多听周杰伦歌的人更喜欢听他以前的歌,而对他的新歌不太感冒。我认为,其实他近年来的歌曲并不差,甚至可以说很好听。之所以有这种现象,是由于我们以他以前的歌曲作为参考点,而这些作为参考点的歌曲的起点是相当高的。原来用100元就能买到的东西,现在突然涨价变为200元,那么不管是富人还是穷人,当涨价太多时可能都会觉得便贵。这个参考点除了与购买者的个人财富有关,还与它原来的价格有关。如果使用个人财富为参考点,或者以购买者的财富值增加为维度,那么仅涨价100元,对于富人来说效用不会有太大变化。如果以原有价格为参考点,或者以商品的价格变化量为维度,那么即便是富人,其效用可能也会有较大变化。

(3)价值函数

前景理论的效用函数为V=∑π(pi)*vi(x),它有几个特点(可用图8表示):

(a)它分为赢区和输区,当x大于0时为赢区,表现为获得收益;当x小于0时为输区,表现为损失。如例5。

例5

问题1

选项1:50%的概率获得1000元。

选项2:100%的概率得到500美元。

问题2

选项1:50%的概率失去1000美元。

选项2:100%的概率失去500美元。

(b)价值函数呈现一条S形的曲线。并在赢区呈凸型,因此决策者在赢区倾向于规避风险;在输区呈凹型,因此决策者在输区倾向于寻求风险。在问题1中,84%的被试选择了选项2;而在问题2中,70%的被试选择了选项1。我们用效用函数的计算公式得(Kahneman和Tversky,1984):

问题1,大部分人选择了选项2(大部分人想规避风险),因此选项2的效用比选项1的高:

0.5*v(1000)<v(500)

→0.5*(v(1000)+v(0))<v(500)(凸性的表现)(v(0)=0)

问题2,大部分人选择了选项1(大部分人损失更少而冒险),因此选项1的效用比选项2的高:

0.5*v(-1000)>v(-500)

→0.5*(v(-1000)+v(0))>v(-500)(凹性的表现)

(c)前景理论的的赢区和输区均呈现边际递减效应。在零点附近,个体对损益值的变化特别敏感。例如,对从5元到10元的变化比对从80元到85元的变化敏感。

(d)价值函数的赢区平缓,输区陡峭。即,人们面对同样数量的收益和损失时,认为损失更加让他们难以忍受。比如,相比起赢500块,输500块让人感觉更加明显。Kahneman和Tversky(1984)将其称之为损失厌恶。

图8

(4)权重函数

Kahneman和Tversky(2000)认为存在一个权重函数影响着对概率的判断,其中概率是自变量。权重函数有四个特点:第一,对于概率为0的事件,权重函数为0;第二,对于概率为1的事件,权重函数为1;第三,对于小概率事件权重函数会使人略高估于真实概率;第四,其他情况权重函数低于真实概率。权重函数如图9,其中实线为权重函数曲线,虚线斜率为1,用于与权重函数进行参考。这与人类总是高估低概率事件,低估高概率事件是一致的。图10中显示了对各种事件的概率估计,如人们总会高估台风等低概率事件,也会低估心脏病等高概率事件。

图9

图10

(5)满意性原则

满意性原则是指,由于现实条件和人是有限理性的,决策者并不会考虑所有可能的行为选项及其对应的结果。在现实中决策者只需要考虑几个选项,并且最终被选择的选项也不一定是这几个选项中最好的,决策者一旦感到满意就会停止选择,并最后作出决策(Simon,1955)。

十.齐当别理论(李纾,2015)

1.基于选项的选择与基于维度的选择

决策理论有许多不同的模型,按其所指信息的加工过程,可以分成基于选项的和基于维度的两类。前者认为各个候选项被独立赋予一个主观价值,主观价值最大的选项会被选择,其代表模型是前景理论;而后者则认为,决策者不会为每个选项计算总价值,而是基于各个维度对选项进行比较,在某些重要维度中比较占优势的选项会被选择(如基于价格选择、基于性能的选择、基于品牌的选择等,维度的重要性根据实际情况确定),其代表模型是齐当别理论。

2.齐当别选择模型

"齐当别"选择模型是基于Simon的有限理性观点所提出的,由于大脑的信息处理能力有限,决策者的认知能力无法胜任最优价值所需要的精确计算(需要综合各种维度)。最终的决策只会考虑到其中有限的维度,因此退而求其次,采用简化的齐当别策略进行决策。

该模型认为,决策行为就是在选项的不同维度间进行差别判断的加工过程。具体的说,每个选项之间都有许多维度作比较。在一些维度上各选项差异不大,那么这些维度对于判断的影响就应该被忽略(即"齐同")。比如,在几款手机上做选择,如果这几款手机的价格差异不大,那么买家可能不会将价格作为比较标准。决策者主要根据差别较大的维度(即"别")来做最终选择。比如,虽然这几款手机价格相差不大,但它们外观相差大,那么被试就可能会依据外观维度进行选择。

3.应用

对于框架效应,"齐当别"模型认为,在"亚洲疾病问题"上包括两个维度(但不限于),一个是"最好可能结果"维度,另外一个是"最坏可能结果"维度。在问题1中,由于两个选项均是正向的描述框架(即"最好可能结果"维度差异相对较小),该两选项在"最坏可能结果"维度上的差异非常突出("方案1:200人生还"VS"方案2:600人死亡")。因此,对于这一问题,大部分人是在最坏可能结果维度上做决策,选择方案1;在问题2中,由于两个选项均是负向的描述框架(即"最坏可能结果"维度差异相对较小),两个选项在"最好可能结果"维度上的差异非常突出("方案1:400死亡"VS"方案2:600生还")。因此,对于这一问题,大部分人是在最好可能结果维度上做决策,选择方案2。

十一.进化论决策理论(庄锦英,2006)

从生物进化的角度强调环境的作用,不再坚持占优性、一致性等传统理性观,而将视线转向环境,提倡生态理性,即注重环境对人的塑造作用,以及人对环境的适应作用,不把人类判断过程的逻辑和概率规则进行比较,而是考察它在现实环境中的效用。进化论范式的主要技术路线是寻找人类决策的启发式,但这些启发式的内涵不再是人类非理性的表现,而是人类适应环境的产物,是生态理性的表现。

1.生态理性

生态理性强调,人类的决策就是利用环境中的信息结构得出具有适应价值结果的过程;而个体在适应环境过程中获得的识别环境信息结构的功能作用。

Eddy(1982)曾要求医生依据下列信息对妇女患乳腺癌的概率作出估计:

一个患者患乳腺癌的先验概率概率"p(H)"是1%。

如果患者患有乳腺癌,那么放射线专家正确诊断它的概率"p(D/H)"是80%。

如果患者得的是良性,放射线专家误诊为癌症的概率"p(D/-H)"是9.6%。

问题:乳房X光片呈阳性的患者实际患乳腺癌的概率有多大?

结果显示,96%的医生估计患者患乳腺癌的概率是75%。但根据贝叶斯概率理论可得:

75%和7.8%的差异巨大。是专家错了,还是贝叶斯规则错了?事实上是专家错了,专家之所以发生错误,是因为概率表征不适合我们的大脑构造。频数的概念存在于自然界中,无论从种系发生还是从个体发展,人类都在很早的时候接触这些信息,如相传远古人类就有结绳记事的记载,儿童在很小的时候就能理解一次、两次的概念。而数学概率却是一个出现相对较晚的概念,它产生于17世纪中叶,直到20世纪后半叶才成为表征不确定性的方式,随后在西方国家的日常语言中普及和流行起来。因此,在人类长期的进化过程中,数字的自然的格式是"频率"。可以用频率将上述Eddy的问题改造如下:

设想一个医生治疗过一种疾病。这个医生发现了这种疾病的一种症状,虽然不是十分确定。她的职业生涯中,她曾经见过1000个病人。其中有10人患有此病,并有8人出现过上述症状;其他不属于此病的990个人中,也有95有此症状。因此,共有8+95=103人出现了该症状,其中只有8人患有此病。现在有一个新患者并且有上述症状,那么该患者患上此病的概率是多大?改造后的问题可以很容易找到答案,利用频数计算新患者患此病概率为:

p(H|D)=8/(8+95)=7.8%

可见,当表征信息符合自然格式时,人类行为就会符合传统理性。

2.再认启发式

再认启发式是指在一个二选一的选择问题中,当一个选择是决策者熟悉的或者能够再认的,另一个是陌生的,决策者通常会采用能够再认的(Goldstein和Gigerenzer,1998)。换句话说,人们选择认识的事物的概率通常高于选择陌生事物的概率。在Goldstein和Gigerenzer的一项实验中,他们分别向芝加哥大学和慕尼黑大学的学生提出下列问题:美国的哪一个城市拥有更多居民,圣地亚哥还是圣安东尼奥?结果显示,芝加哥大学的学生回答正确率仅为62%,而慕尼黑大学学生的正确率达到100%。为什么德国学生的正确率会达到100%,而许多美国学生却对自己国家的城市却不了解?Goldstein和Gigerenzer认为正是德国学生的无知,使他们作出了选择。具体来讲,因为圣地亚哥是一座大城市,大城市经常出现在报纸、电视等媒体上,因此所有德国学生都可能听过圣地亚哥,但多数学生不可能知道圣安东尼奥(因为它是一个小城市),所以他们运用再认启发式就可以作出正确选择;而美国学生对两个城市都有所了解,但又了解得不彻底,因此既不能凭借已有知识作出正确选择,又不能依靠再认启发式作出正确选择。

在日常生活和工作中,人们常常用到再认启发式策略。比如,当你在超市面对数十种不同品牌的牙膏时,你很可能选择你熟悉的或者听说的品牌名字,而很少去选择没有听说过的品牌。这是因为,人们往往感觉熟悉的品牌更可靠。

再认启发式的工作机制如图11所示。一方面,媒介(报纸、电视等)与不可接近的效标(如城市的大小)具有极高的相关性:如果在媒体上出现的频率越高,其代表的效标的信息越可靠(该城市的规模可能越大),这种相关被称为生态相关。另一方面,媒介通过自己的方式(电视节目、文章、广告等)将效标的信息(城市的大小)传递给个体,使个体在头脑中建立起了与效标的某种间接相关(对城市的熟悉程度与城市大小之间的相关),这种相关也叫作替代相关。由于替代相关基本上反映了生态相关,因此只要利用再认,即利用对信息的熟悉度,就可以对效标作出正确推断。还有一个例子是,一般来说,英国足球队通常用它们所在城市的名字来命名,拥有强劲实力的球队一般来自大城市,因此球队输赢与城市大小之间具有生态相关性,大城市与媒介具有替代相关性(被试经常能从媒体中听到该城市),因此利用大城市容易被再认这一特点,即便对于不熟悉英国足球队的被试,凭借再认启发式就可以作出对球队输赢的较好预测。

图11

3.单一理由决策模型

在解释单一理由决策模型时,先介绍一些基本概念。每一个选项都有多个线索(即特征),如城市"芝加哥"的线索包括,人口数量、是否首都、经济、位置...。每个线索都可能影响判断或决策,当线索和决策呈正相关时,即促使决策者选择该选项,称该线索为正线索,标记为"1"。如线索"是首都"是决策"是大城市"的正线索;当线索与决策呈负相关时,称为负线索,标记为"0"。未知线索标记为"?"。

单一理由决策模型每次只对两个选项的同一线索进行比较,若一个线索为正,另一个线索为负或未知"?",即可作出决策。其他情况(即两条线索相同,或一个线索为负另外一个线索为未知)下无法决策,则选择下一条线索继续进行比较。根据线索的选择方法,该模型可细分为,最少化启发式、采纳最近启发式和采纳最佳启发式。

(1)最少化启发式

该启发式的步骤为:

第一步:若这种启发式适用,才能该启发式。

第二步:随机选择一条线索,审视两个选项的线索值。

第三步:终止规则,如果一个对象有正线索值,而另外一个没有,则终止计算,进入到第四步。否则,返回第一步,搜索另一条线索。

第四步:决策规则。有正线索值的对象有较高的效标值。

(2)采纳最近启发式

该启发式的工作步骤与最少启发式的基本相同,但在选择线索的方式上采用的并非随机,而是利用成功解决上一问题时所使用的线索。

(3)采纳最佳启发式

该启发式的工作步骤与最少启发式的基本相同,但在选择线索的方式上是选择具有最高效用的线索。人类和动物具有知道哪些线索优于其他线索的能力,即对于同一个问题,能够对线索的重要性进行排序。这种能力有些是天生的,例如,雌性古比鱼在选择配偶时最重视的是雄性古比鱼的鲜艳橘黄色外表,这一线索与其他线索(如身体大小等)相比,处于支配地位。如果一个雌性古比鱼要在两个雄性之间作出选择,并且知道一个雄性古比鱼比另一个具有更加鲜艳的橘黄色,那么,它将选择更鲜艳的那一个。有些是后天学习得到的。例如,在判断哪个城市更大时,该城市是不是首都可能是效用值最高的一条线索。

十二.风险决策

到目前为止,所讨论的一般都是在实验室下进行的简单模拟,为了进一步描述个体在日常生活中的真实决策行为,还应该考察人们决策的微观过程。下面将对上述整体内容作一个补充。

1.定义(庄锦英,2006)

根据决策问题所处客观条件的不同,可以将决策分为确定型决策和风险决策,其中根据概率是否已知,风险决策又可以分为确定型风险决策和不确定型风险决策。

所有决策条件均是确定的即确定型决策,包括(a)所有行动选项是明确的;(b)每个选项对应的结果和结果的可能性是确定的(0%或100%);(c)每个结果的效用值是明确的。例如,顾客到某时装店购买衣服,已知衣服甲的价格为500元,衣服乙的价格为300元;衣服甲穿起来显得时尚,衣服乙穿起来显得稳重。顾客根据自己的喜好和经济状况最终作出选择,这种决策就是确定型决策。

风险决策中,(a)和(c)都是明确的,只有(b)不能被满足。其中,确定型风险决策中的各种可能结果及其概率已知,例如,某人患有严重近视需要确定是否接受一项手术,但手术成功的概率只为85%;而不确定型风险决策的各种可能结果及其出现概率未知,如地震预测。

2.影响因素

风险决策中如何选择行动的问题与许多不同的因素有关,如框架、情绪(22-6:情绪)、心理距离(13-4:心理距离与解释水平)、特质(22-11:人格特质与心理风格)、成就动机(22-4:重要动机)等等,下面主要介绍时间压力、自我-他人差异和自我控制对决策的影响。

(1)时间压力

决策过程总是受到时间限制的影响,用于做出决策的时间往往是有限的。当决策所需时间超过可用时间时,由外部条件所施加的限制可形成时间压力(Hockey ,MacLean和Hamilton,1981)。时间压力包括两个方面,一是决策情境中存在时间限制;二是时间限制导致决策者产生主观感受,如时间流逝感和仓促感(Szollos,2009)。当产生时间压力时,会对决策者的风险决策行为产生影响。例如,当被试在高(8秒)、中(16秒)和低(32 秒)三种时间压力条件下进行风险决策偏好选择时,与中、低时间压力条件相比,高时间压力条件下的被试更倾向于选择保守选项(Zur和Breznitz,1981)。然而,也有研究发现,高时间压力下的被试并非总是倾向于规避风险。在Rieskamp和Hoffrage(2008)的研究中,被试在权衡收益与损失的决策过程中,如果较大概率能获得高收益,那么即使处于高时间压力下,被试也会选择高风险选项。

(2)自我-他人决策差异(刘宇嘉,2023)

通常情况下,我们会依赖自身来做出决策。然而,在一些情境下,我们也会求助于他人,甚至将部分的决策委托于他人。研究发现,个体在为自己和为他人进行决策时,常常展现出不一致现象的行为,即自我-他人决策差异。例如,个体做出购买商品的决策时,为自己会更重视实用主义,而为他人则更重视享乐主义。不同学者针对该领域的研究存在许多相悖的结论,针对这些不同的结论,学者也提出了相应的理论进行解释。(许慧,2023)

(a)为他人决策时更冒险

Batteux等(2017)通过让被试为自己、为朋友和为陌生人进行决策,从而实现对被试与决策获益对象间的社会(心理)距离的操纵。研究显被试在为他人决策时更愿意承担风险,而在为自我决策时相对更为保守(社会距离越远,越倾向于冒险)。

为了解释这些现象,研究者引入了"风险即情感"假说,认为人们在面对风险决策时,并不仅仅基于认知评估,还会受到即时情感反应的影响。当社会距离越远时,损失所带来情感影响越小。

(b)为自我决策时更冒险

在医疗领域,Garcia-Retamero和Galesic(2012)发现,相比于医生为自我决策,医生们在为病人进行医疗决策时更多地选择相对保守的治疗方案。对于此现象,"风险即价值"该假说认为在大多数人将冒险精神推崇为优良品质的当今社会,个体为了塑造和维持更好的自我形象,往往会认为自己相比于他人更具备冒险精神,因此在为自我决策时表现出更强烈的风险寻求倾向。

(3)自我控制

研究发现,个体在风险决策中受到自我控制这一变量影响。相比高自我控制个体,低自我控制个体在风险决策中表现出较高的冲动性,更倾向于做出冒险选择(陈新伟,2023)。

(a)定义

与实验室环境中,被试仅参与一次风险决策,且无法立即获得先前决策结果的反馈,只有在整个决策过程完成后,被试才能了解最终的损益情况(刘霞, 潘晓良,1995),这类决策被称为静态决策。与之相对的是动态决策,动态决策是指在一个连续变化的情境中,个体需要根据不断更新的信息和反馈做出一系列风险决策的过程,现实中大部分真实的风险决策情境都不是静止的而是动态的(Hertwig,Barron,Weber和Erev,2004)。

与实验室情景相比,真实的决策情景主要有以下3个方面的不同:动态性,通常需要进行多次决策;连续性,即在连续多次的决策中,前次决策的结果会影响个体后面的决策行为;多参照点,一项任务的不同决策中往往具有多个参照点,且个体可能会将关注的中心从一个参照点转向另一个。(谢晓非,谢佳秋,任静和余松霖,2009)

(b)私房钱效应和保本效应

已有研究者发现,在静态风险决策情境下,人们在风险决策中表现的决策规律不能很好的应用在动态决策中,如下例6(陈新伟,2023)。

例6

问题1

请在选项1和选项2中做出选择。

选项1:100%的概率获得30美元。

选项2:50%的概率获得39美元,50%的概率获得21美元。

问题2

你已经赢得30美元,请在选项1和选项2中做出选择。

选项1:没有任何的获益或损失。

选项2:50%的概率获得9美元,50%的概率失去9美元。

事实上,这两个问题是一样的,无本质区别,即两个问题对应选项的价值相同。

Thaler和 Johnson(1990)针对以上问题发现,当单阶段问题(问题1)引入先前获益或损失的表述(已经赢得30美元)变为二阶段决策后(问题2),人们的风险决策偏好会发生反转。与问题1中的结果相比(问题1偏向选项1),在先前获益的情况下,被试在问题二中选择风险项B的倾向更大,这就是经典的私房钱效应。对于私房钱效应的解释是,在动态决策中,当下选项的损失如果小于先前以获得的获益,损失量会被决策者合并到先前获益中进行比较,从而仅仅将当前决策的损伤编码为获益的减少,而非实际的损失,这就增加了被试风险寻求的倾向。换句话说,先前决策赢来的钱就像个人的"私房钱"一样,即使输掉了,也只是获益量的减少而非损失量的增加,因此变得更加冒险。

问题2是典型的收益框架(已经赢得30美元),当我们将问题2改为损失框架,例如"你已经损失了30美元"(从已经赢得变为已经损失),那么与第一题中的结果相比,被试在问题2中选择选项2的倾向变小,此时如果增加一个能挽回先前损失的风险选项,那么被试又会非常热衷于选择这个选项,这就是保本效应。保本效应的解释为,在先前损失情境下,后续被试是否倾向于冒险选项,关键是"挽回点"选项是否存在,被试会将"挽回点"选项作为挽回损失的机会,从而愿意"孤注一掷、舍身冒险"。

潘禄和钱秀莹(2014)在没有轮次限制的轮盘赌局任务中,考察了先前一轮及多轮的决策结果对后续决策中风险偏好的影响模式。结果同样表明,前一轮获益后,接下来被试的下注金额往往小于之前的获益金额,表现出私房钱效应;前一轮损失后,接下来被试下注金额的潜在回报往往大于之前的损失金额,表现出保本效应。

3.跨期决策(陈新伟,2023)

(1)定义

设想一下,假设你获得了某个奖励,奖励的方案有两种,一种是立马能获得300元,另外一种是3个月后获得500元。你会选择哪一种方案?按照理性的做法(最大收益)应该选第二种,但事实对于部分人并非如此。在生活中,这种情况比比皆是,比如一款手机在一个月后将会大降价,即便在自己的手机还能用的情况下,还是有人会在当下购买。同样的结果,在不同时刻出现,人们会拥有不同感受。在这些不同时间点出现的结果之间进行权衡和选择,这就是跨期决策(Frederick,Loewenstein和O'donoghue,2002)。

跨期决策包括单时点结果与多时点结果两类。前者将跨期选择任务限定为两个单一时点结果之间的权衡。例如:选项一"现在获益300元"和选项二"3个月后获益500元"。后者则涉及两个及两个以上时点结果的权衡,因此更为贴近现实情境。例如,以分期还款方式为例,个体选择等额本息还款(每月的还款额恒定,比如每月8500元)或者等额本金还款方式(每月本金一致但利息递减,比如第一个月9000元,第二个月8900元,......),两种方式都需要还10个月(有10个时点)。(孙海龙,安薪如和熊冠星,2021)

(2)单时点结果的决策模型

在跨期决策理论几十年的发展历程中,涌现了许多不同的模型。

(a)时间折扣模型

传统的跨期决策理论认为,在面临跨期决策时,人们会将未来结果按一定比率折扣到现在,比较各个选项折现后的价值并做出决策。经济学家称这种现象为"时间折扣",这体现了个体"时间-金钱"内隐价值观,即"同一结果,其效用会因时间延迟而打折扣"。

指数折扣模型(Samuelson,1937)是其中一种时间折扣模型,模型计算公式为:DU =V* e-kd。其中,d表示一定的延迟时间,V表示客观价值,k为时间折扣率,DU则指延迟时间d后价值V以折扣率k的折扣效用。该公式表面,随着延迟时间的增加,价值会呈指数级下降。

(b)齐当别模型

研究者发现齐当别模型可以很好地对跨期决策进行解释,认为选择并非基于时间折扣的过程,而是根据维度比较而做出的。以"1年后获得320元人民币"和"3 年后获得 520元人民币"的选择为例。该例有两个维度,一个是时间维度,另外一个是金钱维度。如果决策者觉得金钱维度上的差异(320元 VS 520元)大于时间维度上的差异(1年 VS 3年),那么两个选项在时间上的差异会被齐同掉,决策者会在金钱维度上选择最好的结果,即选择"3年后获得520元人民币";反之,如果决策者觉得时间维度上的差异大于金钱维度的差异,那么决策者会选"1年后获得 320元人民币"。另外一个例子如例7所示,两个问题在时间维度和金钱维度上的绝对值差异是相等的,时间差异都是6天,金钱差异都是20元。但根据韦伯定律,在知觉上物理数值会被对数压缩(11-6:数),因此问题2在时间知觉上的差异要大于问题1的。因此,相比问题1,在问题2上被试更加倾向于选项1(现在获得100元)(孙红月和江程铭,2016)。

例7

问题1:

选项1:101天后获得 100元

选项2:107天后获得 120元

问题2:

选项1:现在获得 100元

选项2:6天后获得120元

(c)权衡模型

同样的,该理论认为决策者把"结果"维度上的差异和"延迟"维度上的差异进行比较,但与齐当别理论不同的是,权衡理论会对每个维度赋予权重。可以用下面例子简洁地说明,要求被试在选项1(x1,t1)与选项2(x2,t2)之间加以权衡(其中,x1<x2,t2<t1)。例如,x1=10元,t1为今天,x2为30元,t2为2个月。根据权衡理论个体在跨期选择中分别对两选项的结果维度赋予权重:v (x1)和v (x2),并计算结果维度两个价值之差:v (x1)-v(x2)。与此同时,分别赋予两个选项中的延迟维度权重:w (t1)和w (t2),同样计算两个权重之差(w (t1)-w (t2))。最后,对"延迟"维度((w (t1)-w (t2))与"结果"维度(v (x1)和v (x2))之间的差异大小加以比较,若延迟维度比结果维度占优,个体更加倾向选择及时可得的选项1,若结果维度比延迟维度占优,个体更加倾向选择金额更大的选项2。(孙红月和江程铭,2016)

(d)自我参照加工理论

该理论认为,人们将自我分成"现在"的自我和"未来"的自我。冲动的人,更倾向将"未来"的自我知觉成与自我参照加工无关的过程,即认为"未来"的自我与自已没有联系,从而导致对未来事件的主观体验降低。(Mitchell,Schirmer,Ames和Gilbert,2011)

(e)自我控制理论

该理论认为,尽管立即的主观价值高于延迟选项,立即收益有着更高的吸引力和动机驱动。但是在行为决策阶段,人们可以通过自我控制选择延迟较大的收益(Figner,Knoch,Johnson和Krosch等人,2010)。

(2)多时点结果的决策模型

Read和Scholten(2012)进一步将上述单时点跨期决策的权衡模型拓展到多时点跨期决策。以两时点结果的跨期决策为例加以说明。如果要求被试在选项1(x11,t11;x12,t12),与选项2(x21,t21;x22,t22)之间加以决策。根据拓展后的权衡模型,决策者实质上将两时点结果转化为单一结果:即选项1转化为单时点的结果(x1,t1),选项2同样转化为单时点结果(x2,t2),其中这里的x1指x11与x12的和,t1则指延迟时间的加权平均。例如,选项1:"今天收益¥500,2个月后收益¥30"可能与单时点选项的"2周收益¥530"相当。其中转化后的延迟时间2周可以简单理解为"现在"与"2 个月延迟"的加权"平均值"。最后,决策者再对延迟维度(w (t1)-w(t2))和结果维度(v (x1)-v (x2))的差异加以比较,最后做出选择。(孙红月和江程铭,2016)

4.决策策略(Kahneman,2011)

当在解决一个决策问题时,个体可以使用的策略是很多的。下面列举了一些常见的决策策略。

(1)优势策略

搜寻一个在所有重要属性上都不差于其他备选项的选项,从而选择它;或者找到一个在所有重要属性都劣于其他备选项的选项,并把它从备选集合中别除。这个策略只有在备选项集合中存在一个超过其他所有选项的"最优选项"时,才能发挥作用。优势策略一般用于选择的初期阶段,它可以保证先把最差的选项从备选集合中剔除。

(2)线性添加策略

根据重要性赋子每个属性一个权重(需参照决策者当前的目标)。每次考察一个备选项,通过对选项的每个属性进行评分,然后将每个属性的评分乘以属性的重要性权重并累加在一起,用这个方法得到的加权评价值作为该备选项的整体效用值。

(3)差别添加策略

同时考虑两个备选项,逐个比较两个选项的各个属性,估计出每个属性上的差别分。将所有的差别分加起来就可以表征这两个备选项总体上的差别。然后将较好的备选项挑出来与下一个备选项进行比较,重复上述比较过程。整个过程结束后,得到的最优备选项就是"赢得了"所有两两比较的那一个选项。

(4)满意策略

首先,对所有重要的属性设立一个"可接受的"底线;然后寻找第一个在所有重要属性上都不低于底线的备选项,或者用此方法挑选出几个"足够好"的备选项(即各个属性都高于底线)进行进步考察。满意策略会使得我们形成一个"好"候选项的集合。这个策略一般用于初期策略中剔除不满足要求的选项,或者在更普遍的满意策略下找到第一个"足够好的"选项。

(5)分离策略

首先,对所有重要的属性设立一个"可接受的"底线;然后寻找第一个在任意某个重要属性上不低于底线的备选项,或者用此方法挑选出至少在一个维度上很好的多个备选项来进行进一步考虑。这个策略会使得我们找到异质的"特别选项"集合。

(6)词典搜索式策略

首先,通览各个属性并挑选出最重要的一个属性;然后,根据这个属性选出表现最好的备选项。如果在这个属性上有几个备选项都很好,则选出第二重要的属性并从这几个备选项中选出最好的;重复上述过程直到剩下一个备选项。在我们日常的选择中会经常使用到这一策略,但各个属性被考虑的顺序对最终的选择结果会有重要影响。

(7)根据某一方面进行排除

选出一个重要的属性并设立在该属性上"可接受的"底线,随后剔除所有在该属性上没有达到底线的备选项;接着,挑选出第二重要的属性,同样设立可接受的底线并剔除在该属性上低于底线的备选项;重复上述过程直到剩下一个备选项。这个策略经常用来剔除不满足要求的选项。

十三.决策陷阱(庄锦英,2006)

决策陷阱是指在决策过程中,由于认知偏差、心理因素、信息特点等因素,导致人们做出非理性、低效甚至错误决策的心理或行为误区。它通常包含以下几种情况。

1.虚假确定效应

在序列选择中,忽略某些阶段,注重另一些阶段,把不确定事件当作确定事件的现象称为虚假确定效应。在一项研究中,现有两种疫苗接种形式,在概率防治条件下,告知被试某种疾病能够传染20%的人群,而打疫苗对这种疾病的预防作用为50%,也就是说,这种疫苗能够将受感染的概率从20%降至10%。在另一种条件下,告知被试有两种疾病,且每种疾病的传染概率为10%,注射疫苗能够完全防止一种疾病的发生,而对另一种疾病则无能为力。这种情况下,疫苗的作用仍只是将疾病发生的概率从20%降至10%。但结果发现,前一种情况只有40%的人愿意接受这种疫苗。后一种情况有57%的人表示愿意接受这种疫苗。第二种条件下的疫苗更受欢迎,是因为它们看起来好像消除了某种风险而不仅仅是降低了某种风险,即存在虚假确定效应。

2.框架效应

框架效应是指对相同信息的不同表征导致决策产生不同结果的现象。对"相同信息的不同表征"存在两层含义,一是指外部的信息呈现形式,如语言描述、问题结构等等;二是指个体内部对信息的心理表征形式,即心理框架,它受个体经验、认知水平等的影响。框架效应就是由外部框架和心理框架共同导致的决策偏差。

过去许多研究主要集中在用不同形式的外部框架(积极/消极、肯定/否定等),如前面的亚洲病问题,而很少关注心理框架与决策结果的问题。决策认知过程受到多种因素的影响,当决策问题比较单纯,决策过程中没有其他变量介人时,外部框架就会发挥作用,产生框架效应;而当决策过程中有其他变量介入时(如情绪因素),情况变得复杂,就不一定产生框架效应。

3.心理账户

考虑一下下面的实验。之所以出现这样的结果,其原因在于被试建立了不同的心理账户,如例8。在情况1下,被试通常将再次购买门票的钱与第一次购买门票的钱放在同一个主题性账户中,如此花费20美元购买一张门票,显得过于昂贵,所以许多人会放弃再次购买门票;而在情况2下,被试通常不会将丢失的10美元现金与购买门票的钱放在同一个账户中,因此,许多人愿意另付10美元购买门票。

例8

情况1:假如你想去看一场戏剧,并花10美元购买了门票,但到剧院门口时却发现门票丢了。你愿意再花10美元购买一张门票吗?

情况2:假如你想去看一场戏剧,门票为10美元,但到剧院门口时却发现丢了10美元。你仍然愿意花10美元购买门票吗?

结果显示,在情况1中,46%的被试愿意再花10美元购买门票;在情况2中,88%的被试愿意花10美元购买门票。两种情况下,被试均需另付10美元购买门票,但在选择上却表现出巨大差异。

4.成本沉没效应

(1)定义

成本沉没效应是指,当为在某方面一旦投人金钱、努力或时间之后就表现出继续投入的巨大倾向。1981年,美国的田纳西航道项目由于其巨大的花费正面临国会的审议,但项目的支持者们坚持要求国会不应该终止这一项目,理由是它已经花费了巨大的资金。若终止,无疑浪费了纳税人的大量金钱。支持者的行为是成本沉没效应的表现,先前的巨大投入驱使他们要继续投资这一项目。事实上,现实生活中广泛存在成本沉没效应。例如,中止一段不太美好的婚姻对夫妻双方而言都不是一件容易的事情,因为他们已经投人太多的时间、感情、金钱。

(2)解释观点

(a)"避免浪费"的社会学观点

该观点认为,人们之所以受到成本沉没效应的影响,是因为他们不想浪费自己已经投入的金钱、努力或其他东西。

(b)"前景理论"的观点

根据前景理论,价值函数输区比赢区更加陡峭的特点,可以推出,当x>0时,V(x)<-V(-x),由此个体将极力避免损失。举例来说(如图12),对于投资中表现出的成本沉没效应,投资之初,投资者的位置在原点O,当大量资金投出去之后,投资者的位置在B点。对于B点来说,进一步投资损失不会太大;相反,稍微获益就可以带来价值上的巨大增加。因此,处在B点的投资者会继续风险投资,以求能够获利,其中B点是投资者已经付出的沉没成本。

图12

(c)"消极偏向"的观点

前景理论用损失厌恶解释成本沉没效应,但它不能解释为什么成本沉没效应难以消除。成本沉没效应与"消极偏向"更为相联系。所谓消极偏向是指个体在评估事物的过程中,消极信息的作用大于同等强度的积极信息的一种心理现象。一般来说,消极事件倾向于使得生物体在生理、认知、情绪以及社会反应方面产生更大的波动。在所有生物种系中都不同程度地存在着消极偏向,消极偏向可以使生物体趋利避害,因此更好地保存自己种的延续。基于此,成本沉没效应应该是一种具有深厚生物学基础的心理现象,所以难以消除。

现在心理学研究的一种逻辑是,欲检査某类现象的存在是否根深蒂固,或者是否具有普遍的生物学意义,那就是在无意识层面上检查该现象是否仍然存在。沿着这样一种研究逻辑,对导致成本沉没效应的损失厌恶进行检验,发现存在十分强烈的消极偏向。实验采用内隐联想测验,其逻辑是,若概念词与属性词联系紧密,自动化程度高,反应时就短;若概念词与属性词相冲突,或者是联系松散,自动化程度低,反应时便长。两个反应时之差,即是内隐认知的指标。实验采用的概念词为代表"我"类和代表"他"类的词,属性词分为"得"和"失"两类。在日常用语中选择能够反映"得"的词 10 个,如"成功"、"胜利"等,选择反映"失"的词10个,如"癌症"、"死亡"等。结果发现,相对于我而言,对"得"的反应显著快于对"失"的反应。在无意识层面上存在极强的损失厌恶倾向。

(d)认知失调理论

根据认知失调理论(22-4:重要动机)的基本假设,当个体在认知上产生失调时就会引起心理上的不愉快和不舒适的体验,从而驱使个体设法减轻或消除失调状态,使认知达到协调一致。消除失调状态的方法通常包括,一是改变态度,二是改变行为,三是增加新的认知。从认知失调理论的角度看成本沉没效应,是个体为了肯定自己的前期投入,即改变态度,以保持认知协调的结果。通常而言,消极结果可以促使人们改变行为,成本沉没效应却恰恰相反,消极结果促使人们更加坚定原来的行为,以保持自己的认知与先前认知一致。

5.过度自信

(1)定义

从描述层面上讲,过度自信是指个体往往过于相信自己的判断能力,高估自己成功机会的心理现象。从操作性定义上讲,可以认为是当个体对不确定事件进行判断时,其主观概率在一定范围内高于实际事件出现概率的心理现象。

(2)影响因素

过度自信是一种普遍存在的心理现象,与它相对的是保守主义,保守主义是指过低估计自己成功概率的心理现象。对于过度自信的影响因素,大量研究认为过度自信与智力无关,而与基础概率、反馈等有关。

(a)基础概率影响过度自信

研究发现,当基础概率处于极端低或极端高时,个体并不表现过度自信,相反会表现出保守主义倾向。

(b)结果性质影响过度白信

过度自信还受结果性质的影响,当基础概率处于中间水平时,虽然无论选项的结果是积极的还是消极的,被试决策或判断都存在过度自信现象,但积极结果比消极结果有更强的过度自信倾向。

(c)问题结构影响过度自信

过度自信受问题结构影响。当问题结构良好时个体较少表现过度自信,而当问题缺少结构时,个体会表现出强烈的过度自信倾向。例如,当生产一种全新产品时,由于该产品的市场状况是未知的、不确定的,个体会表现出很强的过度自信倾向。风险投资是上述情形的典型代表,由于投资者对信息掌握的不足而导致过度自信,使他们对投资项目获取成功的估计大大高于实际成功概率的结果。

(d)反馈影响过度自信

当先前决策的结果得不到反馈、反馈模糊或延迟反馈时,也会增加过度自信。例如,由于有医疗仪器的反馈,医生对于在重症监护室内患者的死亡预测不存在过度自信现象,但当他们诊断一般的疾病时却会存在过度自信现象。

6.禀赋效应

(1)定义

禀赋效应描是指,个体不愿意放弃自己已经拥有的东西,当他打算卖掉他的东西时的要价会高于同样物品的买价。即因为拥有或仅仅因为属于自己而使物品增值,从而导致卖价高于买价的现象。

(2)心理学根源

禀赋效应的心理学根源是自尊,大量研究表明,个体往往把对自我评价的积极倾向无意识地投射到与自己有关的人群或事物上。例如,在一个实验中要求被试在一系列字母对中选择一个自己喜欢的字母,在这些字母对包含的两个字母中,一个是被试姓名中的字母,另一个不是。结果发现被试倾向于选择自己姓名中的字母。被试对自己姓名字母的偏爱是自我积极态度的反应。

进一步研究发现,无论被试自主选择还是被动接受某种观点以后,都会表现出对这种观点及其相关事物的积极评价,这被称为"角色扮演效应"。研究者认为,这是由于被试对分配任务的接受,导致任务与自我之间产生关联,由此使得自我评价的积极性泛化到任务上造成的。一项实验要求被试观察某个陌生人对一系列问题表达自己的观点,然后要求被试从两个方面对该陌生人进行评价,一是喜欢程度,二是想象自己与该陌生人一起工作有何感受。结果发现,当陌生人的观点与被试固有的观点越接近时,被试对陌生人的评价就越高。

7.比率偏见效应

(1)含义

比率偏见效应是指,对于一个小概率事件,与以小数量的形式出现相比较,当以一个更大数量形式出现时,人们会知觉到更大的可能性。例如,在一个盛有20块饼干的盒子里有1块巧克力饼干,在另一个盛有200块饼干的盒子里有10块巧克力饼干,巧克力饼干在两个盒子里的比率是一样的,但若请个体判断从哪个盒子里更有可能拿到巧克力饼干时,多数人的回答是后者。这是因为,当以大数量的形式出现时,如大盒子中的巧克力饼干,绝对数量多,导致个体产生错觉。可以推测,人们是以直观感知而不是以抽象比率作判断的。

(2)心理学解释

比率偏见效应是由直觉经验的绝对优势导致的。当数字比例和代表数字比例的实物同时呈现并在知觉上形成冲突时,绝大多数被试会以自己对实物的直觉为基础作出决策。在人类的进化过程中,以概率或百分数表征的不确定环境并不是大脑容易识别的信息。因此,当抽象的比率与代表比率的实物同时呈现时,大脑最先识别的或在信息中占有更大比重的是具体的实物信息。

相关推荐
MicrosoftReactor2 小时前
技术速递|如何使用 GitHub Security Lab 的开源 AI 驱动框架进行漏洞扫描
人工智能·安全·开源·github·漏洞扫描
Swift社区2 小时前
AI Agent 会取代传统 App 吗?
人工智能·app
甜城瑞庄的核桃2 小时前
Claude Code 工程化实战:从工具使用者到 Agent 构建者的进阶之路
人工智能·机器学习·aigc·ai编程
chaofan9802 小时前
拒绝单体模型依赖:从 GPT-5.4 与 Claude 生产力之争看分布式 AI 网关的必要性
人工智能·分布式·gpt
ZhengEnCi2 小时前
M0-mdtool 背景及链接目录
人工智能
Elastic 中国社区官方博客2 小时前
Elasticsearch:shell 工具不是上下文工程的银弹
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
放下华子我只抽RuiKe52 小时前
深度学习学习路径规划
人工智能·深度学习·学习·github·ai agent·openclaw·development
耶夫斯计2 小时前
Agent入门-Agent实战(skills\tools\prompt\subagents)
人工智能·prompt·llama
纤纡.2 小时前
从基础 CNN 到优化模型:食品图像分类全流程对比实战
人工智能·python·深度学习