囚徒困境或许是各类社科文献中遭到滥用最多的悖论。但无论是不是专业研究人员,但凡不小心中招落入其圈套的人,都会为之着迷。在等式中引入理性情感是否能帮助我们走出困境?
让我们来简要回顾一下囚徒困境的基本理论。两名银行抢劫嫌犯被抓获,遭到了逮捕,但警方的证据不足,若两人均不肯招供,警方将别无选择,只能释放他们。
两名嫌犯被分别关在两间单人牢房里,审讯的警察将两人轮流叫到审讯室,向他们提出以下方案:如果两人中有一人招供,另一人拒绝招供,招供的人会被释放,而拒绝招供的人会被判处5年徒刑;如果两人都招供,则两人都会被判刑,但坦白从宽,会酌情减刑,只会被判处4年徒刑;如果两人都不招供,警方则无法控告他们有罪,只能控告他们在追捕过程中有危险驾驶行为,判处一个月的监禁。
两名嫌犯须分别决定对此方案作何答复,但没有机会以任何方式同关在不同牢房的另一名嫌犯沟通。那么,嫌犯是否会招供?
设身处地站在一名嫌犯的立场上思考,你会马上发现无论对犯罪同伙的选择有何判断,招供始终符合你的最佳利益:如果对方招供,你也招供,你的刑期可以减少一年(从5年减到4年);如果对方拒绝招供,你招供就能立即得到释放,获得自由。
然而,这一结论自相矛盾:若两名嫌犯都从理性和自私的角度思考,认为自己应该认罪,两人都会被判处4年徒刑;如果两人都拒绝招供,他们的境遇会好得多,只需服短短一个月的刑期。
囚徒困境并非打发时间的智力游戏,而是博弈论的一个核心概念。博弈论,本质上就是对交互决策的研究。“博弈”作为专业术语,意即一人的行为会影响另一人处境的任何情况。经济竞争、国与国的暴力冲突乃至家庭内部的互动都可以利用博弈论来建立模型。
社会科学研究者往往将囚徒困境称为社会困境博弈,因其言简意赅地描述了各种各样的社会与经济情况,包括环境污染、偷税漏税、逃避兵役,乃至在银行插队。在以上所有案例中,从单个个体的角度考虑,都存在一项更加可取的行为。然而,假如所有(或退一步讲,大多数)参与者都做出这一行为,所有人都会深受其害。那么,在现实世界中,我们应如何解决此类困境?既然无法强制人们合作,人们又为何会选择合作?
针对这一问题,罗伯特·奥曼在一系列研究论文中给出了答案,凭借这些论文,他获得了2005年诺贝尔经济学奖(当年的诺贝尔经济学奖由奥曼与谢林共同获得)。囚徒困境的社会变异往往是“重复博弈”,即同一种互动情景在同一组参与者之间多次重复进行。由于是重复进行,选择自私而为或会造成不小的损失:人们会记得你过往的行径。因此,自私而为的参与者(如在典型的囚徒困境中选择招供的人)再次遇到同样的情形时,其他参与者可能会伺机报复,从而也选择只符合其一己私利的行为(如自己选择招供)。
奥曼建立了重复博弈的数学模型,证明了在重复博弈的情形中,经过理性思考而达成合作是有可能的。(奥曼的理论本身值得充分讨论,下一章会予以详述。)然而,根据我本人的研究,还有另一种可能的答案。理解这一答案,需要先介绍一下博弈论的核心概念之一:纳什均衡——这一理论以1994年的诺贝尔经济学奖获得者约翰·纳什命名,纳什作为电影《美丽心灵》[2]的主角原型而闻名世界,其萌生均衡概念的灵感是在20世纪50年代初——纳什均衡最终成为极为重要的概念,广泛用于社会科学领域。
为解释纳什均衡所蕴含的思想,我们要重点探讨涉及两名参与者的博弈:每名参与者均有多项行为(或策略)可以采取,从可选行为中选择一项行为,所选行为决定着两人的收益。如两名参与者所选的行为均为另一人所选行为的“最佳回应”,均衡即形成。换言之,两名参与者若选择其他行为,收益不会增加。
试举一个更为具体的例子,设想一种名为两性之争的博弈:你和你的伴侣需要决定今晚去哪里过。
选项有两个,一是芭蕾舞剧,一是拳击比赛。不巧的是,对于如何选择,你和你的伴侣存在很大分歧:你坚决要在晚上看芭蕾舞,而你的伴侣却不肯放弃欣赏一场精彩拳击比赛的机会。
多番协商无果后,你们决定通过以下方式确定选哪个。你们两人各拿一张纸条,在上面写下“芭蕾”或“拳击”,不能看对方写了什么,也不能和对方讨论这件事。七点整,你们将纸条交给邻居布朗先生,布朗先生随后会大声宣读纸条上的内容:如果两人针对晚上的活动写下了同样的内容,你们就要一起参加这项活动;假如你们写了不同的活动,你们两人都只能留在家里,错过晚上出去玩的机会。现在假设你们每人都将自己首选的活动估价为200美元,次选的活动估价为100美元,留在家里是最差的选择,可估价为0美元。在这一博弈中,怎样才算均衡状态?
只有两人都写“芭蕾”或两人都写“拳击”,均衡状态才可形成。如果两人固执己见,都写了自己的首选活动,你们只能双双留在家里。由此可见,改善境况的唯一方式就是一人做出让步,同意参加自己的次选活动,但这正是该例中的“圈套”所在:假如你和你的伴侣都决定委曲求全,成全对方的喜好,你们也只能留在家里(请记住,你们不能和对方讨论写什么)。
这对夫妻能增加选择同一活动,从而确保晚上能出去的概率吗?当然可以!例如,拳击迷可以在餐桌上放一只拳击手套,明确暗示对方自己不计后果,绝不会让步,放弃自己的首选活动。这或许能让芭蕾迷明白,除非他想在家过夜,否则就别无选择,只能同意妻子的选择,从而增加他在纸条上选“拳击比赛”的概率。
另外,丈夫或许想先发制人,在客厅里放柴可夫斯基的《天鹅湖》,暗示他无论如何也会坚持选择芭蕾,从而增加妻子态度软化,顺从他在纸条上选“芭蕾”的概率。
在无法直接同对方沟通的情况下,这对夫妻确有可能通过此类暗示,来增加在两性之争的博弈中达成均衡状态的概率。但这与情感有何关系?
实际上,情感就是一种信号传递机制,让我们得以在日常参与的各类博弈中协调行动,达成均衡。情感还可以帮助我们建立新的均衡状态,这种均衡在纯粹的思维与理性世界中是不存在的。在很多情况下,情感可以通过这种机制改善我们的社会境遇。
为理解这一重要观点,让我们回到囚徒困境这一理论,证明即便博弈只进行一次,情感也可以建立起合作性均衡。为此,我们描述囚徒困境的方式略有不同。
假设你和一个素不相识的人参加一项实验。首先,你们每人分到100美元。然后,你们要在两种可能行为中二选一:“拿走”或“分享”(你们两人在做出选择之前,没有机会讨论如何选择)。如果你们一人选择拿走,一人选择分享,选择分享的人须将100美元全部送给选择拿走的人。如果你们两人都选择拿走,则每人须返还50美元给实验人员。最后,如果你们两人都选择分享,实验人员会分别给每个人再发50美元,你们每人可以拿走150美元。
请注意,这种博弈与前一节提及的《平分或偷走》节目有相似之处。二者相同之处在于,如果你所在乎的仅仅是拿到最高的现金奖励,你无论如何都应该选拿走。无论另一名参与者如何选择,你选拿走得到的钱都更多。
下面在博弈中加入情感因素。假设在游戏中,除了获得金钱回报之外,对你来说有价值的还包括,一方面要做一个正人君子,另一方面也不能“任人蒙骗”。如果你选择拿走,而另一名参与者选择分享,你会因为自己的贪得无厌感到惭愧。这种羞耻感存在负价值,我们姑且将其描述为相当于损失掉100美元。相反,如果你选择分享,而另一名参与者选择拿走,你会感到恼羞成怒。姑且可以说,这种情绪也相当于损失100美元。如果你们两人都选择拿走或都选择分享,你的情感反应则是不喜不悲。
现在假设另一名参与者在上述情况中也会产生完全相同的情感反应,且这些反应附带的金钱价值完全一致,对此博弈的分析则会出现显著变化。选择拿走,原本最高可得200美元现金,现在则变成了100美元,因为你可以说羞耻感会造成损失。新的价值低于选择分享的所得,意即你最理想的情况就是拿到150美元。因此,两名参与者同时选择分享成了新的均衡模式,即最有可能出现的情况是双方都选择合作,而非自私而为。
简而言之,这说明在这一等式中,情感——甚至包括愤怒和羞耻等消极情感——的存在可以提高两名参与者的最终所得。然而,这一解释并不完整。我想证明,上例中描述的情感并不是随机挑选的,而且实际上,这些情感切合有此情感之人最狭隘的物质利益。
假设有情感反应的参与者也能较为准确地预测到他人的情感反应。接下来,假设囚徒困境博弈中有一名参与者是个没有感情的人,凡事皆做最冷漠无情的思考,一心只谋求拿到最多的金钱收益,而另一名参与者有着前文所述的正常情感反应(及情感预测能力)。请试想一下,这种情况会造成什么样的结局。姑且将铁石心肠、精于算计的参与者称为“头脑先生”,而另一名参与者则为“情感先生”。
头脑先生自然会选择拿走,因为他不知羞耻。但情感先生很可能明白自己面对的是头脑先生,进而推断出头脑先生会选拿走。在此情况之下,如果情感先生选择分享,他会承受双重损失:一是他在博弈开始时拿到的100美元会被收回,二是他会觉得自己受到了羞辱,相当于再次损失了100美元,损失合计200美元。反之,如果他选择拿走,他只会损失50美元。情感先生因此认定,他也应该选拿走,这样他和头脑先生得到50美元,这与两名参与者都有感情的情况截然相反。上文已证明,这种情况可达到两人皆得150美元的均衡状态。结论是,情感行为有其益处:在这一简单的例子中,情感反应能在金钱方面构成正面优势。
该例来自我所建立的一个数学模型,该模型归纳了纳什均衡的概念。该模型表明,在许多类似囚徒困境的博弈中,合作的主要动机是追求互惠互利的情感需求。例如,在别人都慷慨相赠的情况下,自己因表现出贪欲而产生了羞耻感,或者别人贪得无厌时,自己会感到羞愤交加,这两种情感共同组成了道德金律,亦称互惠伦理。
道德金律在宗教典籍中受到了大肆的宣扬,所有小学生都要习得此道,以此种手段来保护他人的情感,即某些事虽然有悖于你的个人私欲,你却仍然要义不容辞,但这些实验表明,道德金律也是满足一己私利的重要手段。
[1]道德金律,即互惠伦理。这一术语的使用可追溯至17世纪的欧洲,指的是《马太福音》第七章第十二节和《路加福音》第六章第三十一节的论述,即“你们愿意人怎样待你,你们也要怎样待人”。这一金律几乎是世界通用的,因为许多国家的思想文化中都出现过类似的概念,如孔子的“己所不欲,勿施于人”。——译者注
[2]《美丽心灵》,约翰·纳什的传记片,改编自同名传记,由好莱坞演员拉塞尔·克劳主演,上映于2001年,并获得2002年奥斯卡最佳影片与最佳导演奖。——译者注