首页 » 决策与判断 » 决策与判断全文在线阅读

《决策与判断》第三部分 决策模型

关灯直达底部

虽然决策和判断具有情境依赖性,但早期的决策模型常常假定,人们的态度和偏好是固定的,且不会随着引导方式的改变而改变。决策者被当成“理性人”来看待,他们追求效用最大化和自我利益,而且遵循理性行为的原则。这一部分的章节将对这些模型进行回顾,讨论它们各自的缺点以及其他一些决策理论。

第7章 期望效用理论

1713年,一位名叫尼古拉斯·伯诺利(Nicolas Bernoulli)的瑞士籍教授提出了一个非常有意思的问题。翻译过来的意思大概是:伯诺利感兴趣的是,根据下面两个原则,人们愿意为玩这个游戏付多少钱:(1)掷硬币,直到硬币出现字,(2)如果第一次掷硬币就出现字,玩游戏的人可以得到2美元,如果第二次才出现字,玩游戏的人可以得到4美元,如果第三次才出现可以得到8美元,如果第四次才出现可以得到16美元,以此类推。为了参加这个游戏,你愿意付多少钱?(读者调查的第30题,你可以检查自己的答案。)大多数人都表示,只愿意花几美元来玩这个游戏。

由于是伯诺利第一次提出了这个问题,因此它被称做“圣彼得堡悖论”。之所以称它为一个悖论,是因为这个游戏的期望值(如果游戏无限次地进行下去,其期望平均值)是无限的,但却几乎没有人肯付一大笔钱来玩这个游戏。为了说明平均回报是无限的,我们可以用每种结果的回报乘以其概率来计算伯诺利游戏的期望值。[1]第一次抛硬币就出现字(玩游戏的人可以得到2美元的回报)的概率为1/2,第一次出现正面第二次出现字(玩游戏的人可以得到4美元的回报)的概率为1/4,出现两次正面再出现字(玩游戏的人可以得到8美元的回报)的概率为1/8,推而广之,期望值(EV)为(K=掷硬币的次数):

那么问题就在于,为什么人们不愿意付更多的钱来玩这个游戏,以得到无限大的回报。就在尼古拉斯·伯诺利提出这个问题的25年之后,他的堂弟,数学家丹尼尔·伯诺利对此进行了解释,并成为现代决策理论的起源。丹尼尔·伯诺利认为,金钱的价值或者说效用随着获取金额的增多(或者是已有财富的增多)而递减。丹尼尔·伯诺利书中的第24页写道:“同样是1000达克特,对于一个穷人的效用要比它对于一个富人的效用要大得多,虽然二者的金额完全相同。”伯诺利认为,金钱的价值可以这样来表示:

有了这样一个假定,即金钱效用随着财富增加而递减,伯诺利就能够解释,圣彼得堡游戏的期望值并非是无限的。

期望效用理论

并不是所有的学者都同意丹尼尔·伯诺利的理论确实能够解释圣彼得堡悖论(例如,Lopes, 1981;Weirich, 1984),但他的边际效用递减理论却为后来的选择行为理论奠定了基础。其中最为著名的便是“期望效用理论”。这是由约翰·冯·诺伊曼(John von Neumann)和奥斯卡·摩根斯坦(Oskar Morgenstern)于1947年提出的。冯·诺伊曼和摩根斯坦认为,期望效用理论是一种标准化行为理论。也就是说,经典的效用理论并不是要描述人们的实际行为,而是要解释,在满足一定的理性决策条件下人们将如何表现自己的行为。

这一理论的一个主要目的是为理性决策提供一套明确的基本假设或者说公理。当冯·诺伊曼和摩根斯坦定义这些公理后,决策研究者们就能够将期望效用理论计算出的数学预测结果与决策者的真实行为相比较。当研究者发现某一公理无法满足时,就可以对这一理论作修改并做出新的预测。这样,决策研究者们可以反复比照理论与实际,提出更多新的学说来。

理性决策的公理有哪些?期望效用理论的大多数公式都至少包含了以下六条原则中的一条:

有序性。首先,决策者可以对任意两个备选方案进行比较。他们应该要么偏好其中一个,要么对两个都无所谓。

占优性。理性的个体永远都不会采取一个被其他策略占优的策略(对于我们来说,采取策略等同于做决策)。如果一项策略与其他策略相比较,至少在某一方面比其他策略都好(意味着产生更大的效用),而且在其他方面与其他策略一样好,这项策略称之为弱式占优。如果一项策略与其他策略相比较,在所有方面都比其他策略好,这项策略称之为强式占优。举例来说,如果汽车A在质量、成本和外观方面来说都比汽车B更好,那么汽车A相对于B来说就是强式占优。但如果汽车A只是在质量方面比汽车B好,而在成本和外观方面与汽车B差不多,那么汽车A就属于弱式占优。根据期望效用理论,完全理性决策者绝不会选择一个占优策略,即使所选策略是一个弱式占优策略。

相消性。如果两个有风险的备选方案所可能产生的结果中包含了某些完全相同且具有相同概率的结果,那么在对这两个方案进行选择时,就应该忽略那些结果的效用。也就是说,在进行选择时只需要比较那些不同的结果,而不是比较两种选择都具有的相同结果。相同因素应该相互抵消。

可传递性。如果一个理性决策者在方案A和方案B中更偏好方案A,在方案B和方案C中更偏好方案B,那么这个人在方案A和方案C中肯定更偏好方案A。

连续性。对于任何一组结果,如果出现最好结果的概率非常大,决策者总是偏好在最好和最坏的结果中进行赌博而不是选择一个中间值。举例来说,如果完全财务损失的概率是1000000000000000000…000分之一,那么一个理性决策者肯定会偏好在100美元和完全财务损失中进行赌博,而不是选择一个确定的10美元的盈利。

恒定性。恒定性原则表示,决策者不会受到备选方案的表现方式的影响。比如说,理性决策者不会在一个复杂的赌博(例如,两阶段的彩票,每一阶段的获奖概率为50%,如果两阶段都获奖将得到100美元)和一个简单的赌博(例如,一次性彩票,有25%的概率赢得100美元)中有什么偏好。

冯·诺伊曼和摩根斯坦从数学上证明,如果决策者违背了这些原则,期望效用就无法达到最大化。举例来说,如果违背了可传递性原则,那么你对于方案A、B和C的偏好就具有不可传递性。你偏好方案A比方案B更多一些,偏好方案B比方案C更多一些,偏好方案C比方案A更多一些。这就意味着,我可以让你选择方案C,也可以提议你放弃方案C并付一分钱而得到方案B。因为你偏好方案B比偏好方案C更多一些,你当然乐意接受我的提议,并付给我一分钱。

现在你选择了方案B。同样的,我也可以提议你放弃方案B并再付一分钱而得到方案A(相对于方案B来说,你更偏好方案A一些)。这样你就得到了方案A。但是,由于你的偏好具有不可传递性,我仍然可以提议,你放弃方案A并再付一分钱而得到方案C(相对于方案A来说,你更偏好方案C一些)。其结果就是,你还是回到了最初的状态,却损失了3分钱(或者是3美元、3000美元,或者其他)。也就是说,我可以继续利用偏好所具有的不可传递性,把它作为摇钱树,直到骗光你所有的钱。在以后几章中,我们将讨论违背理性行为中的可传递性原则和其他原则的一些例子。

理论的扩展

继冯·诺伊曼和摩根斯坦提出期望效用理论后,许多其他理论家对此进行了扩展,提出了多个变式。其中最有名的一个变式是由伦纳德·萨维奇(Leonard Savage)于1954年提出的“主观期望效用理论”。萨维奇的理论与冯·诺伊曼和摩根斯坦的理论相比的最大区别在于,萨维奇考虑到了主观的,个人的因素。1954年以前,期望效用理论中使用的概率都是经典理论中的客观概率(例如,以相对频率为基础)。萨维奇将这一理论进行了推广,将人们对某个事件可能发生的主观概率也纳入进来。

如果客观概率不可能预先得知或是这种结果只会发生一次,这种推广就显得十分重要了。比如说,在主观期望效用理论的框架下,如果一些不可重复事件的发生可能性(如核战争)的概率无法通过计算相对频率来得到,就可以进行人为的估计。而经典效用理论则无法估计“核战争爆发的可能性”究竟有多大。

其他理论家也对经典效用理论进行了补充和完善。例如,邓肯·卢斯(Duncan Luce, 1959)和其他人一起建立了一个他们称之为“随机的”选择模型——这一模型认为偏好具有随机成分。在随机模型出现之前,效用理论家很难解释清楚为什么头一天偏好喝汤而第二天却偏好沙拉。卢斯解释这一问题的方法是,将对汤和沙拉的偏好作为一种随机概率而不是100%固定的选择。

彼得·菲什伯恩(Peter Fishburn, 1984)、尤德尔·卡梅卡(Udar Karmarkar, 1978)、约翰·佩恩(John Payne, 1973)和克莱德·库姆斯(Clyde Coombs, 1975)等人对期望效用理论进行了更进一步的扩展,并提出了其他一些替代理论。虽然期望效用理论常常被作为一个整体理论来进行探讨,但实际上期望效用理论指的是一个理论系,而不是某个特定的理论(虽然“期望效用理论”也常常作为冯·诺伊曼和摩根斯坦理论的一个简称)。

结论

保罗·休梅克(1982, p. 529)对期望效用理论及其变量做了一次全面回顾,他认为:“可以毫不夸张地说,期望效用理论是自二战以来决策研究的主要范式。”确实,在决策理论中,这一理论所引起的研究和讨论比其他理论所引起的研究和讨论都要多。但是,正如第8章所示,经典期望效用理论却存在一些棘手的问题和悖论。这些问题使得部分决策研究者放弃了期望效用理论而去寻找更有用的替代理论。

第8章 理性决策的悖论

虽然期望效用理论的原则听起来好像是合理的,但在许多情况下决策者却会违背这些原则。例如,第6章的框架效应表明,决策者常常会违背恒定性原则(如果要进一步了解违背恒定性原则和占优性原则的例子,参见特韦尔斯基和卡尼曼,1986)。在这一章中,我们主要讨论违背相消性原则和可传递性原则的例子。

阿莱悖论

根据相消性原则,在两个方案中做出选择应该只取决于它们之间的差异——而不是两种方案所具有的共同点。两种方案所具备的相同因素不应该影响到理性人所做的选择。比如说,你要在两辆车之间进行选择,而它们具有同样的质量,那么质量这一因素就不应该影响到你的选择。

从表面看来,这一原则看似有理;如果两辆车有同样的质量,为什么要让质量的高低来影响你的选择呢?理性决策者应该是根据两种方案的不同方面来进行选择。但1953年,一位名叫莫里斯·阿莱斯(Maurice Allais)的法国经济学家发表了一篇文章,向相消性原则提出了挑战。在这篇文章中,阿莱斯(1953)简要概述了他的阿莱悖论——这一悖论显示了违背相互抵消原则的情况。让我们来看一看这一悖论是怎样起作用的。

假设我提供给你两种选择,A和B。如果你选择A,你一定能够得到100万美元。但如果你选择B,就有10%的概率得到250万美元,有89%的概率得到100万美元,1%的概率什么也得不到。也就是说,你的选择如下:

选项A:肯定会获得100万美元

选项B:10%的概率获得250万美元,89%的概率获得100万美元,1%的

概率什么也得不到

你会做出什么样的选择?(参见读者调查中第28题(1)的答案。)实验结果是,即使选项B的期望值大于100万美元,大多数的人仍然会选择A以得到一个确定的数额。将选项B中的可能结果与其概率相乘后,可以计算出选项B的期望值(EV)实际上为114万美元,比选项A的期望值更高:

EV(B)=(0.10)(2500000美元)+(0.89)(1000000美元)+(0.01)(0美元)=1140000美元

虽然如此,大部分的人仍然愿意获得一个确定的100万美元的数额。

现在,假设我提供给你另外一个选择。这一次,选项A有11%的概率获得100万美元,89%的概率什么也得不到;而选项B则有10%的概率获得250万美元,90%的概率什么也得不到。也就是说,你的选择如下:

选项A:11%的概率获得100万美元,89%的概率什么也得不到

选项B:10%的概率获得250万美元,90%的概率什么也得不到

这次你会如何选择?(参见你在读者调查中第28题(2)的答案。)大多数人会选择B。他们通常会这样认为,10%与11%盈利概率的差别很小,但100万美元和250万美元的差别却很大。而且,选项B的期望值也最大。选项B的期望值是250万美元的1/10,也就是25万,这是选项A的期望值(100万美元的11%是11万美元)的两倍多。问题或者说是悖论在于,在第一种情况下选择A的人在第二种情况下也应该选择A——否则就违背了相互抵消的原则。

图8.1 阿莱悖论

为了说明这一点,现在假设每个选择的结果是通过从罐子里的100个彩色小球中随机抽取来决定:89个红球(R), 10个白球(W), 1个蓝球(B)。在第一种情况下,选项A代表抽到红球、白球或是蓝球中的任意一个就可以获得100万美元(也就是说,不管抽到什么都可以得到100万美元)。选项B则代表抽到红球可以得到100万美元,抽到白球可以获得250万美元,抽到蓝球则什么也没有。按照同样的逻辑,在第二种情况下,选项A代表抽到白球和蓝球都可以获得100万美元,抽到红球则什么也得不到。而选项B则代表抽到白球可以得到250万美元,抽到红球或蓝球则什么也没有。

由此看来,你会发现两种情况实际上提供了完全相同的选择,只是在第一种情况下无论你选择哪一个选项,抽到红球你都可以获得100万美元,而在第二种情况下无论你选择哪一个选项,抽到红球都表示什么也没有。在两种情况下选项A都表示,抽到白球和蓝球可以获得100万美元;选项B则表示,抽到白球和蓝球分别可以获得250万美元和0美元。第一种情况下的选项A和第二种情况下的选项A相比较,除了89%的概率可以多获得100万美元以外完全相同;第二种情况下的选项B和第二种情况下的选项B相比较,除了89%的概率可以多获得100万美元以外也完全相同。

所以说,附加的等同结果——在第一种情况下红球代表100万美元,而在第二种情况下红球则代表一无所获——使得人们做出了不同选择。这种差异恰恰违背了相同因素相消性的原则。因为根据相消性原则,在对两种选项做出选择时,只应该以它们的差异为依据,而不以它们的共同点为依据。

埃尔斯伯格悖论

另外一个违背相消性原则的著名例子则由丹尼尔·埃尔斯伯格(Daniel Ellsberg, 1961)提出。埃尔斯伯格悖论是这样的:假设缸里有90个球,30个是红色的,剩下60个要么是黑色要么是黄色,其比例未知。从缸里抽出一个球,球的颜色将决定你的收益(见图8.2a的列表)。

你会在哪种颜色的球上下注——红色还是黑色?大多数人都选择了红球,以避免黑球和黄球混合比例的不确定性。但如果给出的收益列表如图8.2b所示,你又会在哪个颜色上下注呢?在第二种情况下,大多数的人偏好在黑球或黄球上下注,而不是在红球或黄球上下注。这也是为了避免黑球和黄球混合比例的不确定性。也就是说,大多数的人在第一种情况下会选择选项1,而在第二种情况下则会选择选项2。

但根据相消性原则,人们在两种情况下应该选择同样的选项。这可以从图8.2看出,两种情况的结果只有一点不同,那就是在第一种情况下黄球表示什么也得不到,而在第二种情况下则表示100美元。由于在两种情况下选项1和选项2中的黄球都代表相同的数额(在第一种情况下代表0美元,在第二种情况下代表100美元),因此两种情况下黄球的价值都不应该影响到对选项1和选项2的选择(正如相同的质量不应该影响到对两辆车的选择一样)。但与期望效用理论相悖的是,人们常常在两种情况下做出不同的选择。

图8.2a 埃尔斯伯格悖论第一种情况下的结果

图8.2b 埃尔斯伯格悖论第二种情况下的结果。惟一的变化是黄球现在表示100美元而不是0美元。

不可传递性

另外一个理性决策原则是备选方案应该具有可传递性,也就是说,如果一个决策者在结果A和B中偏好A,在结果B和C中偏好B,那么在结果A和C中就应该偏好A。第7章曾讨论过,一个具有不可传递性偏好的决策者容易被别人当做“摇钱树”来使。图8.3给出了有关不可传递性的另外一个例子。

假设你必须在3个求职者中做出选择(图8.3中的求职者A、B和C),你已经有了关于他们才智和经验方面的信息。再进一步假设你的决策原则如下:如果两人的IQ差距超过10分,选择更有才智的人;如果两人的IQ相差不超过10分,选择更有经验的人。

这听起来倒不失为一个合理的原则,但如果你遵循这一原则就有可能会面临困境。如果将求职者A与B相比较,我们应该选择B,因为A和B的才智相差不超过10分,而B却比A有经验得多。同样,如果将求职者B与C比较,我们应该选择C,因为B和C的才智相差不超过10分,而C却比B有经验得多。但如果我们将求职者C与A相比较,我们应该选择A,因为A的IQ比C的IQ高出了10分以上。也就是说,A和B中应该选择B, B和C中应该选择C,而A和C中则应该选择A。这种不可传递性出现的原因在于,决策标准有两个维度——才智和经验——而这两个维度都是小幅递增且呈负相关的。

现实中的人们是否会违背可传递性原则呢?1969年阿莫斯·特韦尔斯基发表了他的研究,在这项研究中有1/3的被试表现出了不可传递性。特韦尔斯基

图8.3 以下的决策原则使得很难在A、B、C3个求职者中做出选择,因为此时的偏好是不可传递的:如果两人的IQ相差超过10分,选择更有才智的人;如果两人的IQ相差不超过10分,选择更有经验的人。

向18名哈佛研究生展示了图8.4中所列出的5种赌博游戏。正如你所见,每个赌博游戏的期望值随着获胜概率递增,随着获胜金额而递减。随机挑选一对赌博游戏展示给学生,要求他们选出更喜欢的一种游戏。游戏的配对有10种可能(A和B、A和C,等等)。学生做了3次选择后,特韦尔斯基从中挑出8名表现出不可传递性倾向的被试,让他们每周去一次他的实验室,进行一项为期5周的深入研究。

他发现,有6名学生表现出可信度较高的不可传递性。当两个选项具有十分相近的获胜概率时(如赌博游戏A和B),被试会选择具有更高获胜金额的选项。与之相反的是,当两个选项的获胜概率相差悬殊时(如赌博游戏A和E),被试会选择具有更高获胜概率的选项。也就是说,A比B好,B比C好,C比D好,D比E好,而E却比A好。特韦尔斯基(1969)采用了与上面所述的求职者选择相类似的问题,也发现了不可传递性的存在。

不可传递性并不只是实验上的一个新奇事物,它对决策者来说也具有非常重要的启示。举例来说,考虑一下决策研究者们所熟悉的“委员会问题”。在一个典型的委员会问题例子中,一个委员会里一般有5个成员:安、鲍伯、辛迪、丹和埃伦。他们的任务是聘用一名新教授,3个候选人如图8.5所示。

假设你是委员会的主席,你知道每个人的偏好,并且你希望能够控制投票以使得阿尔·爱因斯坦被选中。你应该怎么做?

图8.4 阿莫斯·特韦尔斯基(1969)采用以下的赌博游戏对偏好的不可传递性做了实验。将每个游戏的获胜概率和获胜金额相乘,即可得到每个游戏的期望值(EV)

图8.5 在一个典型的委员会问题中,偏好排序如下。数字越低代表的偏好程度越高(例如,安在乔·施莫和简·多伊中更喜欢乔·施莫,而在简·多伊和阿尔·爱因斯坦之间更喜欢简·多伊)

答案就是你应该避免在爱因斯坦和多伊之间直接投票,因为5个委员中有3个人都更加偏好多伊而不是爱因斯坦(安、丹和埃伦)。相反,你应该让他们就施莫和多伊之间选择谁进行投票,等到施莫赢了以后再安排在施莫和爱因斯坦之间进行投票。另一方面,如果你更希望雇佣多伊,你应该先就施莫和爱因斯坦之间进行投票,再在爱因斯坦和多伊之间进行投票。由于在成对比较中委员们的偏好具有不可传递性,因而安排投票进程的人能完全控制结果。

偏好逆转

违反不可传递性原则还不是最糟的,因为有的时候甚至连偏好都会随着情境的变化而发生逆转。萨拉·利希滕斯坦和保罗·斯洛维奇于1971年发表的实验是有关偏好逆转的最早的实验之一。利希滕斯坦和斯洛维奇推断,当需要从一对赌博游戏中做出选择时,其心理过程可能有别于单独在每种赌博游戏上出价的过程(也就是说,对一项赌博游戏单独设定一个金额)。具体来说,他们认为二选一的选择是由赌博的获胜概率决定的,而单独出价则主要是由输赢的金额决定的。

为了验证这一假设,他们进行了3个实验。在每一个实验中,他们首先向被试演示了几组赌博游戏。每组中的两个游戏具有十分相近的期望值,但一个游戏具有很高的获胜概率,而另一个则具有很高的获胜金额(见图8.6)。在每组中做出选择后,被试还需要在单独考虑每种赌博的情况下出价。被试被告知,他们有一张玩赌博游戏的门票,他们需要说出愿意卖出这张票的最高价和最低价。

在第一次实验中,大学生们需要指出他们在每组赌博中更偏好哪个游戏,以及他们愿意以怎样的价格卖出其持有的门票。利希滕斯坦和斯洛维奇衡量偏好逆转的方法是,假定当两个游戏配对出现时,被试所选择的是获胜概率高的游戏,则计算高获胜金额游戏门票售价超过高获胜概率游戏门票的次数百分比。利希滕斯坦和斯洛维奇发现,73%的被试总是表现出这种偏好逆转。第二次实验基本上是第一次实验的重复,只是在出价程序上略有不同。而第三次实验也发现,即使对每个被试单独进行了详尽仔细的指导,而且实实在在地进行了赌博游戏,人们也表现出了稳定的偏好逆转。

图8.6 偏好逆转的实验材料(引自Lichtenstein&Slovic, 1971)

当然,利希滕斯坦和斯洛维奇发现的偏好逆转是在严格的实验情境之下产生的,它是否存在于实验情境之外的现实生活中依旧是一个问题。为了验证这一问题,利希滕斯坦和斯洛维奇在拉斯维加斯的赌场中重复了他们的实验。通过一台计算机和轮盘机,他们搜集了44名参与赌博人的数据(包括7名职业发牌人)。

实验结果十分令人震惊。在高获胜概率和高获胜金额的游戏中选择了高获胜概率游戏的被试当中,81%的人在高获胜金额游戏上的出价更高。这一逆转比例甚至比第一次实验中发现的逆转比例还要大。所以说,偏好逆转似乎不仅仅存在于实验情境之中;对于那些有经验也有金钱激励的决策者来说,这一现象同样存在。

自这些早期的实验之后,一些研究重复和拓展了利希滕斯坦和斯洛维奇的发现(Grether&Plott, 1979;Schkade&Johnson, 1989;Slovic, Griffin&Tversky, 1990;Slovic和Lichtensitein, 1983;Tversky, Slovic,&Kahneman,1990)。偏好逆转很难改变,而且它们也不随着金钱激励而消失(Tversky, Slovic,&Kahneman, 1990)。当人们需要在两种赌博中做出选择时,他们通常会特别关注获胜概率,而如果他们需要考虑每种赌博的价值时,则往往看重其可能获得的金额。违背期望效用理论真的就是不理性的吗

毫无疑问,人们常常违背期望效用理论的一些原则,但这种违背真的就意味着人们是不理性的吗?这些发现是否说明人们的决策是不理性的?

答案当然是否定的。这是因为,我们并不知道人们犯错误的成本与人们遵循这些理性原则(如相消性原则和可传递性原则)的成本相比(这一点将在以后做进一步讨论),哪个更大。正如利希滕斯坦和斯洛维奇所说:“被试为了将复杂任务简单化而采用的捷径实际上是非常有效的,因为他们减少了认知努力,而且结果与最佳策略相比相差无多。在使用这些捷径时决策者通常假设,这个世界(并不像我们进行的实验那样),并不想要利用他的这些捷径。”一项逻辑并不是那么严密的决策有时候却可能是理性的。因为如果从长期来看,这项决策相对于正常决策来说确实是提供了一条快而简单的捷径来实现效用最大化。

结论

本章中所提到的研究看起来好像是针对理性原则的各项原则进行了单独的验证。但正如邓肯·卢斯(1990)所说,有时候很难区分出,一个实验究竟是在检验哪一项原则。比如说,偏好逆转通常可以用违背可传递性原则来解释,但近期的一些研究则表明,用违背恒定性原则来解释偏好逆转也许会更好(Bostic、Herrnstein,&Luce, 1990;Tversky、Sattath,&Slovic, 1988;Tversky、Slovic,&Kahneman, 1990)。但不管这些争论最后如何解决,有一点却是非常清楚的,那就是期望效用理论还不足以描述人们真实的决策行为。

自冯·诺伊曼和摩根斯坦研究之后,许多决策理论家试图将期望效用理论发展为一个描述性决策模型。但这些努力常常遭受失败。由于违反相消性原则、可传递性原则、恒定性原则和占优性原则情况的大量存在,因而许多以前是效用理论忠实支持者的理论家们都开始转向其他的决策模型。第9章将对其中一些模型进行讨论。

第9章 描述性决策模型

1977年杰伊·拉索(Jay Russo)发表了一项有关超市商品单位定价效应(单位价格指的是每盎司、每克或是其他每单位的商品明细价格)的实地研究。在这项研究中,拉索发现了一些有关人们购物方式的有趣现象。首先,当货架上的标签包含了单位价格信息时,购物者就会节约1%的单位采购成本。这一节省不是靠购买更低价格品牌的商品来实现,而是通过加大采购量来实现(1%好像不值多少钱,但请记住,在超市里的消费达数十亿美元)。第二,拉索发现,如果超市列出了不同品牌的价格比较,购物者的单位采购成本平均就会节约3%。在这种情况下,购物者的节省主要来自购买更便宜一些的品牌。

后一个发现确实有些令人吃惊,因为增加单价对比实际上没有提供任何新的信息,只是列出了已经标明的价格而已。根据期望效用理论的恒定性原则,决策不应该受到选项的表现方式的影响。但拉索(1977)发现,列出商品单价表会对消费者产生巨大影响。当不同品牌的单价同时出现在一张单子上时,购物者倾向于购买更便宜的品牌。超市可以通过将商品单价同时列出来影响消费者的选择。

满意

期望效用理论做了一系列简化的假设,以便进行严格的数学分析。期望效用理论通常都会假设,决策者对过程中每一备选方案的结果及其概率拥有完全信息,而且决策者能够理解这些信息,能够间接或直接地推算出每一备选方案的有利和不利方面。最后,这一理论还假定决策者会在这些推算结果中做出比较,并选择能够实现效用最大化的方案。

但显而易见的是,决策者并不总是这样行事。有关备选方案的信息常常会缺失,或者本来就是不确定的,而知觉则往往具有高度的选择性,记忆又充满了偏差。有关不同方案的结果常常被错误地理解,而且正如拉索的研究所示,在没有协助情况下的决策者有时候并不去比较所有可能的结果。所以说,期望效用理论虽然是一个有用的标准化决策模型(在一定假设被满足的条件下,有关理性个体如何行为的模型),却并不是一个很好的描述性模型(实际中人们如何做决策的模型)。如果要描述人们实际的决策行为,就有必要考虑其他理论模型。

诺贝尔奖获得者赫伯特·西蒙(Herbert Simon)于1956年提出的模型是最早替代期望效用理论的模型之一。西蒙认为,人们在做决策时,追求的是“满意”而并非最优。满意是指,选择一个最能够满足你需要的方案,即使这一选择并不是理想化或最优化的。比如说,在租房子的时候,人们倾向于寻找一套能够满足某些需求(价格、位置、空间、安全性,等等)的房子。他们并不会彻底搜寻所有可能的房子,然后选出能够产生最高效用的那一套。西蒙(1956, p. 129)写道:“不管有机体在学习和选择情境中的行为多么具有适应性,这种适应能力都远远无法达到经济理论中理想的‘最大化’状态。显然,机体的适应性往往只是能够达到‘满意’,而不是‘最优’。”

前景理论

自西蒙的论文之后,出现了许多替代期望效用理论的理论,但其中最广受承认的是“前景理论”(prospect theory)。这一理论是由丹尼尔·卡尼曼和阿莫斯·特韦尔斯基于1979年共同提出的。与期望效用理论相比,它在许多重要方面都存在差异。

首先,它用“价值”概念替代了“效用”概念。效用通常是从净财富的角度去定义,而价值则是从收益与损失(对某一参照点的偏离)方面去定义。而且,损失的价值函数与收益的价值函数也不同。如图9.1所示,损失的价值函数(横轴以下的曲线)是凸函数,而且更加陡峭一些。相比之下,收益的价值函数(横轴以上的曲线)则是凹函数,而且不是那么陡峭。这些差别引出了一些值得注意的结果。

由于损失的价值函数比收益的价值函数更为陡峭,所以损失比收益显得更加突出一些。例如,损失500美元的感觉比获得500美元的感觉更加强烈(见图9.1)。正如乔治·夸特龙和阿莫斯·特韦尔斯基(1988)所指出的,这种不对称性,或者说“规避损失”,与现任政客相对于其挑战者所具有的优势是一致的(也就是说,投票人常常认为,在政权交替中出现不利改变的潜在损失比出现有利改变的潜在收益要重要得多)。夸特龙和特韦尔斯基(1988)也注意到,这种规避损失倾向会使商讨和谈判变得更加复杂,因为“每一方都将自己的让步看做一种损失,而这种损失比让步带来的成果显得更加突出一些。比如说,在就导弹问题的谈判中,两个超级大国都认为解除导弹设施是安全上的一个重大损失,而实际上对方也会做相应的战备收缩而为自己带来安全利益。但双方在衡量这种损失和利益时,都不约而同地认为损失比利益更加重要一些”。

图9.1 前景理论中的假定价值函数(数据摘自卡尼曼和特韦尔斯基1979年的研究)

规避损失所产生的另外一个结果就是“禀赋效应”(endowment effect)。禀赋效应指的是,当一件物品成为人们的禀赋时,它的价值便增加了(Thaler,1980)。比如说,当人们需要对自己所拥有的一件东西(如巧克力条、钢笔或是咖啡杯)定价时,这一价格通常比他们所愿意购买这件东西而出的买价更高(Kahneman、Knetsch,&Thaler, 1990;Knetsch&Sinden, 1984)。根据理查德·塞勒的理论,这一效应之所以出现是因为损失(这一物品)的感觉,比获得同样东西的感觉更加强烈。这种不对称性常常被许多公司加以利用。它们常常向消费者提供试用产品,而对这些试用品的拥有权常常增加了产品的价值,使得消费者很不情愿归还这件产品。

不同于期望效用理论,前景理论认为偏好取决于问题的框架。如果相对于某一参照点,某项结果看起来是一种收益,那么其价值函数将是凹函数,决策者也倾向于规避风险。相反,如果相对于某一参照点,某项结果看起来是一种损失,那么其价值函数将是凸函数,决策者也变得更加偏好风险。以下一组问题是对这一点的一个很好的说明(摘自卡尼曼和特韦尔斯基1979的一个实验):

问题1:除了你现在所拥有的,再给你1000美元。你现在必须在选项A和选项B中做出选择:

选项A:50%的概率获得1000美元

选项B:肯定会获得500美元

70名被试回答了这一问题,其中84%的人选择了肯定会获得500美元。正如图9.1的上半部分所示,这一答案是十分合理的。因为在这一价值函数中,从0美元到500美元的价值增加,大于从500美元到1000美元的价值增加。如果你认为第二个500美元的价值不如第一个500美元的价值,那么你就不应该接受在第二个500美元上具有相等概率的赌注。

问题2:除了你现在所拥有的,再给你2000美元。你现在必须在选项C和选项D中做出选择:

选项C:50%的概率损失1000美元

选项D:肯定会损失500美元

在这种情况下,70%的人选择了有风险的选项。正如图9.1的下半部分所示,当面临损失时人们通常会变得风险偏好。这是因为损失的价值从0美元到500美元要高于从500美元到1000美元(所以肯定会损失掉500美元比50%的概率损失掉1000美元更糟糕)。所以说,虽然这两个问题在数字上来说是等同的,却导致了不同的选择。由于价值函数呈“S”形,人们在面对收益时常常是规避风险的,而在面临损失时则常常偏好风险。而且由于价值总是依据一定的参照点来定义的,前景理论——而不像期望效用理论那样——认为,当参照点发生位移时,偏好也会受到影响(正如第6章所介绍的框架效应一样)。前景理论与期望效用理论的另一个不同之处在于它们处理结果概率的方式。经典效用理论假定,50%的客观获胜概率对于决策者来说,就是50%的获胜概率。而前景理论则认为,偏好是“决策权重”的一个函数,而这些权重并不总与概率相对应。具体来说,前景理论假定,决策权重常常会强调小概率事件而忽视一般或者高概率事件。正如你在图9.2所见,对角线以上的权重函数代表小概率,而对角线以下的则表示高概率。

卡尼曼和特韦尔斯基(1979)利用了下面一组问题来说明人们具有强调小概率事件的倾向:

问题1:在选项A和选项B中进行选择。

选项A:千分之一的概率赢得5000美元

选项B:肯定会获得5美元

在对这一问题进行回答的72名被试中,有将近四分之三的人选择了有风险的答案。其实,每天都有很多人在做同样的选择——买彩票。但考虑第二个问题:

问题2:在选项C和选项D中进行选择。

图9.2 根据前景理论推测的决策权重(数据摘自卡尼曼和特韦尔斯基1979年的研究)

选项C:千分之一的概率损失5000美元

选项D:肯定会损失5美元

在对这一问题进行回答的72名被试中,则有超过五分之四的人选择了确定的损失。卡尼曼和特韦尔斯基解释说,存在这种偏好是由于人们往往会过于看重大金额的损失——这种倾向对保险公司特别有利。

确定效应

期望效用理论与前景理论的另一个差别在于,前景理论隐含了“确定效应”。确定效应指的是,由同一个因素引起的结果概率减小,在结果最初就确定时所产生的影响要大于在结果最初只是可能时的影响。著名的莫里斯·阿莱斯(1953)期望效用理论反例是最早关于确定效应现象的描述。另外,经济学家理查德·泽克豪泽(Richard Zeckhauser)也用一个非常生动的例子说明了确定效应是如何起作用的。泽克豪泽发现,与从4颗子弹中拿走一颗的情况相比,大多数人愿意出更多的钱拿走俄式轮盘赌中惟一的一颗子弹。虽然拿走一颗子弹后,两种情况下被击中的概率都等量减少了,人们仍然会感觉到0颗子弹与1颗子弹的差异,比3颗子弹和4颗子弹的差异要重要得多。前景理论隐含了这一效应,而期望效用理论则没有。

为了详细了解前景理论是如何隐含确定效应的,可以参照卡尼曼和特韦尔斯基(1979)有关“概率保险”的一项调查结果。在这项调查中,卡尼曼和特韦尔斯基让大学生被试做这样一个假设:假设你正考虑给你的某项财产上保险以预防可能发生的损失,如火灾、失窃等。在计算过风险和保费以后,购买保险和不购买保险对你来说是无所谓的。这时候保险公司新推出的一种名为概率保险的新保险计划引起了你的注意。在这项保险计划中,你一开始只需付一半的保费。然而一旦发生损失,你只有50%的概率可以获得全部赔偿(如果不要求赔偿损失,则退还全部保费)。也就是说,在概率保险的情况下,你只需要付50%的保费,也只有50%的概率获得赔偿。这个问题看来好像已经为预防损失做了精心准备,但卡尼曼和特韦尔斯基同时也指出,还有许多其他预防性措施可以减少这些不利事件发生的概率(虽然不能完全消除这些概率),比如安装防盗自动警铃,换掉旧轮胎,戒烟,等等。

在回答这一问题时,80%的学生表示他们不会购买概率保险(可以对比你在读者调查中第23题的答案)。对此,卡尼曼和特韦尔斯基解释道,将一项损失的概率(无论是多少,比如p)减少到原来的一半(p/2)的价值不如将其概率从一半(p/2)减至0的价值大。人们更愿意消除风险而不是减少风险,即使这项损失发生的概率在两种情况下都等量减少了。前景理论认为,由于决策中常常强调小概率,因而这些小概率事件的重要性总被夸大。因此,用前景理论可以很好地解释这一发现。相反,如果放在期望效用理论的框架下,则会认为概率保险比常规保险更有吸引力(有关这一说法的证明比较复杂,可以参见卡尼曼和特韦尔斯基书中的第270页,1979)。

虚假确定效应

除了确定效应,卡尼曼和特韦尔斯基(1981)还讨论了“虚假确定效应”(pseudo certainty)。拟确定效应与确定效应十分类似,只不过这种确定只是一种表象而不是真相。保罗·斯洛维奇,巴鲁克·菲什霍夫和萨拉·利钦斯坦(1982a)也在一篇文章中对虚假确定效应进行了详细的阐述。

斯洛维奇和他的同事向211名被试演示了以下两种疫苗接种项目之一。在概率防治条件下,被试需要回答他们是否愿意接受一种对某种疾病只有一半保护作用的疫苗,这种疾病能够传染20%的人口。也就是说,这种疫苗能够将受感染的概率从20%降低到10%。只有40%的被试表示愿意接受这样一种疫苗。

在虚假确定条件下,被试被告知:有两种互相排斥且得病概率相等的疾病,每种疾病都可能会传染10%的人口。疫苗能够完全防治一种疾病的发生却对另一种疾病没有预防作用,因此染病的总体概率也是从20%降到了10%。但在对这一问题的回答中,有57%的人表示他们愿意接种这一疫苗。对此,斯洛维奇、菲施霍夫和利钦斯坦(1982)解释说,虚假确定条件下的疫苗更受欢迎,是因为它们看起来好像是消除了某种风险而不仅仅是降低了某种风险。

营销学教授常常利用模拟技术来强调降价的知觉价值。比如说,干洗店如果提出一次洗三件衣服就可以免费洗一件,其效果要比降价25%更好。这是因为,免费服务比折扣服务更有吸引力,即使免费服务并不真正意味着在总价格上有更多的优惠。

后悔理论

正如前景理论所指出的,决策者通常以一个参照点为基础来衡量其拥有的备选方案。这一参照点往往选择最具有普遍意义的一点,但在某些特定情况下,人们却是将某一决策质量的衡量建立在与其他不同决策的后果相比较的基础上。由于这种假想性结果的比较依赖于假设的事件,它有时也被称为“反事实推理”(counter-factual reasoning)(Dunning&Parpal, 1989)。

反事实推理构成了后悔理论(regret theory)的基础。这是一个有关选择的经济学理论,分别由戴维·贝尔(David Bell, 1982, 1985),格雷厄姆·卢姆斯和罗伯特·萨格登(Graham Looms&Robert Sugden, 1982, 1983, 1985)各自提出。卢姆斯和萨格登(1981, p. 820)认为:“后悔理论以两个基本假设为基础:首先,很多人都经历过后悔和欣喜的感觉;第二,在不确定的情况下做决策时,他们会预期这些感觉并将其作为决策时要考虑的一个因素。”比如说,如果人们面临这样一个选择:确定会得到1000美元,还是通过掷硬币来决定是否获得2000美元(出现人头)。他们很可能会选择确定的1000美元,以避免未猜对时的后悔。

与前景理论对这种风险规避倾向的解释不同,后悔理论在解释这一选择时仍然采用了经典效用函数,只是加进了一个新的变量——后悔。加入这一变量后,后悔理论同前景理论一样,也能够解释许多悖论,包括阿莱悖论、埃尔斯伯格悖论、偏好逆转、对概率保险的回避等。卢姆斯和萨格登(1982)提出的后悔理论确实是前景理论之外的另一个选择。但这种后悔预期并不与前景理论相矛盾。而当涉及到死亡风险的决策时(如心脏手术),谈论负面结果的后悔却是毫无意义的。

多属性选择

在许多选择中,结果并不能根据某个单一的标准(如金钱或是患病的风险)来描述。与只有一种评价标准的情况不同,当需要在这些不同标准(如成本和质量)中做出选择时,通常并没有一个客观的最优化决策。因而人们只需要与他们的目标和价值观保持一致,而不是追求客观最优化(Einhorn&Hogarth, 1981)。所以,有关“多属性选择”的研究通常关注人们如何做出决策,而不是这些决策有多好。

在面临多属性选择时,人们会根据问题的类型而采用不同的策略。当决策者只需要在两种方案中选择其一时,他们常常会采用一种被称为“补偿性”的策略(Payne, 1982)。采用补偿性策略是指,以某一标准的高价值来弥补另一标准的低价值。比如说,汽车购买者会选择一辆外观时髦的车,即使它的质量相对另一辆来说要差一些。又比如,一个人可能会放弃一项长期稳定的工作而选择在哈佛任教,虽然暂时还没有终身教职,却能享有更高的学术声誉。

有几种方法能够解释这种选择策略(cf. Hogarth, 1987),其中一种被称为“线性模型”。在线性模型中,根据每一标准的重要性赋予其权重,然后将各个标准的值加权后得到总体价值指数。比如说,在选择研究生考生时,招生委员会通常会制定一个加权指数,其中包括了平均绩点、考试分数和推荐信。虽然人们通常不会严格地按照线性公式来做决策,但线性决策原则却能够产生与人们实际做出的决策十分相近的结果(因此,它能够将人们的决策制定模型化,有时甚至能够取代人的决策)。

另一种补偿性策略的决策模型是“差异加法模型”。这一模型与线性模型有些类似,但有一点区别:在线性模型中,是将每一方案的各个标准的值加权,然后在这些方案中作出比较;但在差异加法模型中,则先比较每一标准上各个方案的差异,然后对这些差异赋予权重后进行加总。将注意力集中在差异上至少有两个优点——它不仅大大简化了两个备选方案,而且,作为一个决策制定模型,它更接近人们实际的决策行为。比如说,汽车购买者更愿意考虑两辆车各方面的差异,而不是(像采用线性模型那样)仔细考虑每辆车的各个方面后比较两辆车的加权价值。

还有一种补偿策略的决策方法被称为“理想点模型”(ideal point model)。理想点模型在运算上与线性模型类似,但两者的原理并不相同。在这一模型中,决策者心中有一个理想方案(如一个理想的工作或是一辆理想的汽车)。然后他们将其拥有的备选方案在各个标准上与理想方案相比较,对这些差异进行加权。

非补偿性策略

人们在面临具有多个备选方案的复杂情况时通常采用非补偿性策略(noncompensatory strategy)。与补偿性策略相反,这些策略不允许不同标准间进行互相协调。有四个著名的非补偿性策略方案:关联原则、析取原则、词典式策略和逐步淘汰制(Hogarth, 1987)。

在关联原则(conjuntive rule)下,决策者可以排除那些在预定范围之外的备选方案。比如说,如果某个研究生申请者的GRE分数低于1000,平均绩点低于3.0,或是申请信犯了3个以上的拼写错误,就会被排除在考虑范围之外。但关联原则只能达到满意,而不是最优。

如果决策者采用的是析取原则(disjuntive rule),那么只要申请者的GRE分数或是平均绩点足够高的话,决策者就可能会允许他们犯更多一些的拼写错误。根据析取原则,衡量每一备选方案的标准是这一方案所具有的最好的属性,而不管它的其他属性有多差。举一个极端的例子,只要一个申请者的GRE分数够高,那么就算他的申请信是大猩猩替他写的也无所谓。

第三个非补偿性策略是词典式策略(lexicographic strategy)。使用这一策略的决策者,首先甄选出最重要的衡量标准,然后选择在这一标准上最令人满意的方案。如果选出的方案不止一个,那么就甄选出第二重要的衡量标准,再在剩下的方案中进行选择。如此下去,直到最后只剩下一个方案。

第四个非补偿性策略是逐步淘汰制(elimination-by-aspects, EBA),由特韦尔斯基(1972)提出。从本质上来说,它是词典式策略的一种概率形式。根据EBA原则,每一衡量标准——或是方面——被选择的概率与其所具有的重要性相当。备选方案首先按照已选出的衡量标准进行比较,淘汰掉次要的方案后再选出进行比较的第二个方面,然后淘汰掉更多的方案,如此下去直到最后只剩下一个方案。特韦尔斯基(1972)是这样说明EBA原则的:“为了购买一辆新车,选出的第一个衡量标准可能是汽车的自动变速装置,这将排除那些不具有此项特征的所有汽车。假设在剩下的方案中,选出的另外一个评价标准是3000美元的价格限制,那么超过这个价格限制的所有汽车都将被排除掉。这个过程一直持续下去,直到最后只剩下一辆汽车。”

优先标准

虽然有许多关于多属性选择策略的理论文章和数学论文,但有关这一命题的实验却相对较少。其中比较著名的是由斯洛维奇(1975)进行的一系列实验。

斯洛维奇感兴趣的是,人们如何在两个等价的方案中做出选择。他的假设是,如果两个方案具有相等的价值,那么人们倾向于选择在优先标准上具有更高价值的方案。斯洛维奇称之为“优先标准假设”。

为了检验这一假设,斯洛维奇先让被试找出两个等价的备选方案(比如说,对球队来说具有同等价值的两个棒球运动员)。他们会被问到与下面这个问题相类似的问题:

球员1打出了26个本垒打,击球平均得分数为0.273;球员2打出了20个本垒打。如果说两名球员具有不相上下的能力和价值,那么球员2的击球平均得分数应该为多少?

被试找出等价的备选方案后(已经过了一段时间),斯洛维奇让他们评出他们认为更重要的衡量标准并在备选方案中做出选择。其实验结果有力地支持了“优先标准假设”。实验结果表明,被试确实倾向于选择在优先标准上具有更高价值的方案。

这表明,当面临等价的备选方案时,人们并不是进行随机的选择,而是先识别出对自己来说最重要的标准,然后选择那些在这一标准上具有更高价值的方案。

结论

圣彼得堡悖论导致了期望效用理论的产生,而诸如阿莱悖论和埃尔斯伯格悖论之类的问题则引发了其他替代期望效用理论的理论研究。这些替代理论中最为广泛接受的便是前景理论。虽然许多决策研究分析家仍然采用期望效用理论作为一个标准化模型,但前景理论却是一个能够更加准确地描述人们实际决策行为的模型。它还能够被广泛应用到许多其他领域中。

比如,前景理论所隐含的损失回避倾向就意味着,相对于征收信用卡逾期费用来说,实行现金折扣政策能够使信用卡公司获利更多(Thaler, 1980)。逾期费用对人们来说是一种从自己腰包里流出去的损失,而现金折扣则是一种获利;因此,即使两种情况下的费用结构是等价的,交纳逾期费用的感觉仍然要比没有得到现金折扣的感觉更强烈一些。相同的策略也被许多商店所采用,它们给出一个“建议零售价”以改变消费者的参照点,使得它们的实际价格看起来好像要“省钱”一些(Thaler, 1985)。

损失规避同样被用于鼓励妇女们进行乳腺癌自我检查。贝丝·迈耶罗维茨和谢利·蔡金(Beth Meyerowitz&Shelly Chaiken, 1987)向女大学生出示了以下三本手册之一:(1)一本手册从防止乳腺癌产生的收益的角度来说明乳腺癌自我检查的重要性;(2)一本手册强调了不进行乳腺癌检查的可能损失;(3)一本手册两者都不提及。比如说,从收益角度来阐述的手册可能会告诉读者:“如果现在就进行乳腺癌自我检查,你就能够知道正常、健康的乳房应该是怎样的,这样你才可以注意到随着年龄变化而可能产生的很小但不正常的变化。”而从损失角度来阐述的手册则是:“如果你现在不做乳腺癌自我检查,你就不知道正常、健康的乳房应该是怎样的,而且很难注意到随着年龄变化而可能产生的很小但不正常的变化。”另一本两者都不提及的手册则省略掉了这些句子。

迈耶罗维茨和蔡金发现,4个月之后,阅读“损失手册”的女性中,有57%的人进行了乳腺癌自我检查,而阅读“收益手册”的女性和阅读两者都不提及的手册的女性中,分别只有38%和39%的人这样做了。对此,迈耶罗维茨和蔡金解释说,那些阅读“损失手册”的女性更愿意进行乳腺癌自我检查是因为,所预期到的健康预防损失比同样的健康预防收益要重要得多——即使两者在逻辑上是等同的。这些结果说明了损失规避倾向是如何被运用到提高社会健康状况和社会福利上来的。

前景理论相对于经典期望效用理论来说是一个很大的进步。确实,许多违背期望效用理论的现象都能够在前景理论中得到很好的解释。第四部分对各种偏离理性原则的原因做了回顾。正如这些章节所示,决策者在判断和选择行为过程中很容易受到许多偏差的影响,但在许多情况下,这些偏差都是系统性的,而且是预先可以控制或预测的。

[1]本书的这一部分相对于其他部分来说,更加理论化和数学化一些。因此,有的读者可能觉得这一部分比前几章所讨论过的话题更具有挑战性。如果你对“期望值”一类的概念不太熟悉,不要放弃——大部分的观点即使没有什么数学知识也可以理解,以后的几章也很少再用到数学。