在静态博弈中,我们无法事先了解对方的策略,但还不得不思考自己的策略。在这一章中,我们将通过博弈论中具有代表性的协调博弈和斗鸡博弈,来分析最优策略的选择方法,以及这些理论在现实生活中的应用。
与对方协作,可以增加自己的收益
~协调博弈/相关策略~
在非合作博弈中,局中人会各自进行合理的判断,为自己追求最大的收益。作为企业,会将价格设定得低于其他公司以吸引顾客;作为个人,会为了自己的利益选择比对方更有利的策略。
然而,如果大家知道,和别人进行协调、协作的话,可以让自己获得更高的收益,那么大家一定乐于进行协作。不过,有一点希望大家牢记:协调博弈属于非合作博弈。为什么属于非合作博弈呢?因为在协调博弈中,局中人之间并不是经过相互协商达成一致后再采取行动的,最多只是根据对方的行为适当调整自己的行为,因此属于非合作博弈。
生活中协调博弈的例子,比较典型的就是汽车通过十字路口。假设两辆汽车从相互垂直的两个方向开来,同时抵达十字路口,如果都继续向前开,那么肯定会相撞。如果知道对方会停下来避让,只要继续直行就好了;如果知道对方不会停下来,只有自己停下来避让,才不会发生事故。在这种情况下,如果隐藏自己的意图或者一意孤行,对自己绝对没有好处。所以,双方应该相互协调,调整各自的行为。
在这个博弈中,纳什均衡应该是“自己停下来避让,让对方先通过路口”和“对方停下来避让,自己先通过路口”。不过,虽说纳什均衡是最优的策略组合,但要瞬间判断该选择哪个纳什均衡,我们是做不到的。所以,路口才会设置红绿信号灯。信号灯就是协调交通参与者行为的一种设备,红绿灯以一定的频率交替变换,告诉交通参与者什么时候该停止,什么时候该前进,以帮助交通参与者选择纳什均衡。像这样,局中人通过共同观察到的情况做出决定,叫作“相关策略”。相关策略的组合达成纳什均衡的,就叫作“相关均衡”。
从《麦琪的礼物》看夫妻间的协调
~协调博弈/收益值变了,博弈就变了~
美国著名小说家欧·亨利有一部代表作名叫《麦琪的礼物》,其中讲述的故事也是协调博弈的一种。
有一对贫穷的夫妇,圣诞节快到了,他们都想给对方买一份称心如意的圣诞礼物,但是谁都没有什么积蓄。妻子为了给丈夫心爱的怀表配一条表链,卖掉了自己视若珍宝的长发。而丈夫为了给妻子买梳理秀发的梳子,典当了自己的怀表。因为彼此的感情非常深厚,都想给对方最好的礼物,结果阴差阳错,夫妇俩苦心为对方准备的礼物都变成了无用的东西。但换个角度看,其实,双方都收获了比礼物更珍贵的东西,那就是爱。这是一个温暖人心的感人故事。
我们姑且设定,妻子卖掉头发、丈夫当掉怀表的收益都是3(因为可以买礼物送给心爱的人);收到对方送的礼物,收益得分为5(心爱的人送自己礼物,当然很开心);没有了长发却收到梳子、没有了怀表却收到表链,两人的收益得分都为-5。据此,我们制作出一张收益表。从表中我们可以看出,在这个博弈中,夫妻双方的最优反应,即纳什均衡是“丈夫不当怀表,妻子卖掉头发”和“丈夫当掉怀表,妻子不卖头发”。
这个博弈中的两个局中人,即夫妻双方,不经协调就采取行动,结果的收益都是负数。因为事先并没有向对方表明自己的意图,所以最终得到了略感遗憾的结局。事先不进行沟通,当然可能给对方带来惊喜,但也可能造成遗憾,这就是协调博弈的风险。
在《麦琪的礼物》这个故事中,虽然结局有些遗憾,但是,双方都收获了比任何珍宝都更宝贵的东西,那就是彼此的爱情和自我牺牲的精神。也许,这种精神上的收益让他们更有幸福感。所以,如果认为精神上的收益高于物质收益,这个博弈的收益将发生很大的变化。
为了获得收益,应该选择协作还是单独行动?
~猎鹿博弈/如何让对方与自己协作~
18世纪著名的社会哲学家卢梭给人们讲了一则“猎鹿”的寓言。现在,我们从博弈论的角度来分析一下这则寓言,也许其中的道理就更容易理解了。
那个时候,猎人想猎捕一头鹿,需要多人进行合作。如果捕到一头大鹿,每人分到的战利品会多一些,但并不是每次都能成功。合作猎鹿需要做严密的分工,有人负责追赶鹿,有人负责设置陷阱,有人则用弓箭射鹿……总之,参与猎鹿的人都必须严守自己的岗位,尽自己最大的努力。但是,假设在追赶鹿的过程中遇到一只兔子,该怎么办呢?猎人可以很轻松地捕获一只兔子,此时,这个猎人是该放弃追鹿去捕兔子,还是放弃兔子继续追鹿呢?停下来捕捉兔子的话,100%可以得手,只是收益小了点儿;继续追鹿的话,可能获得更大的收益,但也可能失败,一无所获。
我们假设这个猎鹿博弈中有两名猎人参与,这两名局中人的收益如表3-1所示。两个猎人分别去捕捉兔子的话,各自的收益是1;如果协作捕鹿的话,各自的收益是2。而且,只有两个人协作才能捕到鹿。如果一个人想去捕鹿,但得不到另外一个人的协助的话,也捕不到鹿,最后的收益是0。从收益表中我们可以看出,这个博弈的纳什均衡是“鹿、鹿”组合和“兔、兔”组合。这个博弈就叫作“猎鹿博弈”,是协调博弈的一种。只有局中人相互协作,才能提高各自的收益。分工猎鹿,是猎人之间不成文的约定,对猎人的行为并没有实际的约束力,因此这也算一种非合作博弈。
如果猎人能够按照最初的目的继续追赶鹿,最终可以获得最大的收益。但是,有些猎人可能会因为担心合作伙伴的能力、追赶的鹿太过强壮等原因,认为继续追鹿的选择是不合理的,就难以抵挡住路边兔子的诱惑。还有一种情况是有些猎人不信任自己的伙伴,怀疑对方也会中途停下来捉兔子,于是自己也放弃追鹿,去捉兔子。为了不让自己被这种诱惑打败,信任合作伙伴,相信他会坚持追鹿,也是合作的一个必要条件。所以,在酒馆里,猎人们经常会吹嘘自己的打猎手段多么高明,战利品多么丰富,其实,这并不全是为了满足自己的虚荣心,也是为了让其他猎人相信自己的打猎水平,以后合作的时候,也好让合作伙伴安心地继续去追鹿。
此外,猎人不会去理兔子而是专心追鹿,这也可能是因为捕鹿的收益特别大,或者捉兔子的收益非常小。关于这种情况,我们将在下一小节的例题中讲到。
如果得到了公司的内幕消息,你会怎么做?
~知情博弈/对方值得信任吗?~
假如你得到一个内幕消息,说公司近期要收购某家公司。倘若如此,被收购公司的股价可能会迅速上涨。这时,你会怎么做呢?
被收购公司的股价将会上涨,那么现在你肯定想购买这家公司的股票,以期大赚一笔。但是,这样一来,就属于内幕交易,会触犯法律。如果你把这个消息悄悄告知自己的父母、妻子、兄弟等亲密的人,让他们购买该公司的股票,那么日后如果遭到调查,你也脱不掉泄露内幕消息的干系。此时,假设你要和关系不太亲密的朋友合谋,购买那家公司的股票牟利。在此前提下,如何把握和这个朋友之间的亲疏关系,就成了你烦恼的来源。很亲近的朋友倒是可以信赖,但是和亲密朋友合谋干这种勾当,容易被别人识破;如果是不太亲近的朋友,你又不敢完全信任对方。如果他爱吹牛,说不定哪天就把这个消息泄漏了,让第三者听到,你就可能要承担很大的责任。以此为例只是要说明在知情博弈中你会面临的关于信任的选择难题。我们是绝对反对股票内幕交易的。
协调博弈,是局中人相互协调,然后获得等同的收益。这种博弈也可以称为信任博弈,博弈的解要么是双方都获得很大的收益,要么是双方都平安无事,只获得很小的收益,甚至没有收益。
在这样的信任博弈中,对方是否值得信任很重要。必须要让对方认识到,他通过纳什均衡获得的收益,要远远高于他背叛你时的收益。
在胆量测试中,如何取胜?
~斗鸡博弈/通过操纵策略来取得博弈的胜利①~
基本上来说,男人都是胆小鬼。可是,胆小鬼们却喜欢玩什么“斗鸡博弈”,以此来炫耀自己的胆量。现在,我们用博弈论来分析一下斗鸡博弈。
◎例题3-1斗鸡博弈
你的朋友中有一个特别喜欢装硬汉的家伙,而且平时你们两人就看对方不太顺眼。于是有一天,你们决定比一比谁的胆量大。比试的规则很简单,就是在一条笔直的路上,你们两个驾驶汽车高速对向行驶。当两辆汽车越来越近的时候,看谁先打方向盘,谁先转向谁就输了,会被嘲笑为“懦夫”。在这个博弈中,局中人既想显示自己胆量大,又不想撞车受重伤。那么,你采取的策略是“直行”还是“转向”?最佳的策略到底是什么呢?
在这个博弈中有两种策略,分别是“直行”和“转向”。这两个策略的收益比较起来不是很直观,所以我姑且先把它们数值化。如果两人都坚持“直行”,结果撞车,两人都受重伤,各自的收益得分都是-10。如果你坚持“直行”,而对方因为害怕提前转向了,那么你赢得了大胆的好名声,收益得分为5,同时,对方被骂为懦夫,收益得分是-5。反过来,如果对方坚持“直行”而你“转向”,那你的收益得分就是-5,对方是5。如果双方都提前“转向”,那都会被认为是胆小鬼,双方的收益得分都是-1。
我们先来找找这个博弈中有没有支配性策略,如果没有的话,就从最优反应中寻找纳什均衡。
~斗鸡博弈/通过操纵策略来取得博弈的胜利②~
我们从收益表中寻找最优反应。如果对方坚持“直行”,那么你也“直行”的话,收益得分是-10,如果你“转向”的话,收益得分是-5,所以应该选择“转向”。我们将较低的得分-10用横线勾掉。如果对方选择“转向”的话,你坚持“直行”可以得到5分,如果你也“转向”的话,只能得到-1分,所以这种情况下,你应该选择“直行”。我们将较低的得分-1用横线勾掉。
同样,当你选择“直行”的时候,对方“直行”得-10分,他“转向”得-5分,所以他应该选择“转向”。我们将较低的得分-10用横线勾掉。如果你选择“转向”的话,那么对方选择“直行”得5分,选择“转向”得-1分,所以他应该选择“直行”。我们将得分较低的-1用横线勾掉。
从收益表中我们可以看出,这个博弈中没有支配性策略。没有被横线勾掉数字的小格还剩两个,这两个就是纳什均衡,也就是这个博弈的解(表3-3)。
这个博弈的解为:
你“直行”,对方“转向”和你“转向”,对方“直行”。
当一个博弈中,纳什均衡不止一个的时候,在均等的条件下,我们无法用理论来判断到底该选哪一个。不过,对于你来说,当然是“你‘直行’,对方‘转向’”的策略组合让你收益更高。不过,在这个博弈中,有一招能保证你必胜。
~斗鸡博弈/通过操纵策略来取得博弈的胜利③~
在这个斗鸡博弈中,你的必胜方法其实很简单,就是在两车快要相撞的时候,你把自己汽车的方向盘拔下来。
没有了方向盘,你的汽车就无法转向了。即使想转向,也毫无办法。如果只是双手离开方向盘,那么也可能因为害怕又抓住方向盘转向。
你的汽车失去了方向盘,只能直行,如果对方不转向的话,结果只能是两车相撞。怕死的对方一定会转向。因为你已经表现出了“绝不避让”的坚定决心,这一招能让对方感觉到实实在在的威胁。
你把方向盘拔下来的那一瞬间,你就放弃了“逃避”的选项。结果,整个博弈就只剩一个纳什均衡了,那就是两车相撞。在这种情况下,对方为了采取最优反应,只有选择转向避让。结果,你赢得了这场博弈。
像这种,自己抛弃一些选项,向对方显示自己的强烈意志和坚定决心的策略,和序章(第6页)中介绍的“舍弃重要事物的‘破釜沉舟’战略”如出一辙。两者都是通过操纵策略,让博弈朝着更有利于自己的方向发展。
除了拔掉方向盘的策略之外,还有一种方法可以取胜,就是让对方觉得你神志不太正常。这样一来,博弈也会对你有利。如果让对方觉得你这个人非常理智,他就会想,理智的人一般都不太愿意冒险,所以他反倒会大胆起来。如果一开始你就做出一些莫名其妙的行为来迷惑对方,让他觉得“这个人什么事都干得出来”,那么,在博弈中他就会害怕你,从而提前转向。
古巴导弹危机中肯尼迪总统的策略
~政治界的斗鸡博弈①~
斗鸡博弈不仅仅出现在个人与个人的胆量较量上,还有国家与国家之间的较量。20世纪冷战时期,美国与苏联的“古巴导弹危机”就是斗鸡博弈的典型案例。
1962年,美国获得情报称,苏联在古巴建设了中程导弹基地。从地理上来看,古巴是美国的邻居,而苏联在古巴建立了中程导弹基地,无异于在美国后院安放了一枚定时炸弹,给美国带来了巨大的军事威胁。当时,美国与苏联相比,不管是核武器的数量还是质量,都处于上风。而且,美国在苏联的邻国土耳其也设有军事基地。在这种情况下,美国总统肯尼迪决定对古巴进行海上封锁,借此胁迫苏联撤除其在古巴的导弹基地。而苏联方面,表面上矢口否认自己在古巴设有导弹基地,但又秘密向古巴运送核武器。不仅如此,还有一架美国侦察机被苏军击落。当天,美国甚至考虑攻击苏联的潜水艇进行报复。但是,苏联的潜水艇上可能搭载有核导弹。这时,如果两国首脑做出一个错误选择,就有可能引发第三次世界大战。在这样千钧一发的时刻,美国是该攻击苏联在古巴的导弹基地,还是避免发起攻击,解除对古巴的海上封锁呢?我们利用博弈论的知识来分析一下双方的策略和收益。
双方的策略有“攻击”和“回避”两项。如果美苏双方都选择攻击,那么第三次世界大战在所难免,将会给双方乃至全世界带来无可估量的损失。我们将这种情况下双方的收益都设定为-100。如果双方都选择“回避”,和平解决危机,那么双方的收益都是2。如果美国选择“攻击”而苏联选择“回避”,那么美国的收益是3,苏联的收益是1。反过来,如果苏联选择“攻击”而美国选择“回避”,那么苏联的收益是3,美国的收益是1。
注:①日语中“洗涤”和“选择”同音。
~政治界的斗鸡博弈②~
收益的大小,是根据相互之间的比例关系设定的,至于具体数值的大小,并不重要。
那么,我们来为古巴导弹危机这个博弈制作一张收益表。从表中寻找美国和苏联的最优反应时,我们可以发现,这个博弈中存在两个纳什均衡。一个是“美国攻击,苏联回避”,另一个是“苏联攻击,美国回避”。这和两个人比试胆量,开车对撞那个博弈中的情况是一样的。
前面我已经讲过,在斗鸡博弈中,让对方知道自己绝不会撤退的坚定决心是非常重要的,这是一种强有力的威胁。当时,在核武器的数量、质量上都处于上风的美国,对于苏联保持着强硬态度,美国发现并监视了苏联的潜艇。最终,苏联没有选择反击,在美国做出不入侵古巴的承诺后,撤除了在古巴的导弹基地。第三次世界大战与我们擦肩而过。
实际上,在古巴已经存在苏联的短距离战术核武器。但是,美国并没有获得这个情报。我觉得,如果苏联想以强硬态度逼迫美国做出让步,也许应该把古巴拥有战术核武器的情报透露给美国。另一方面,美国在土耳其配备的导弹其实已经十分老旧,此前美国正打算撤除这些导弹。但是,美国并没有把这个情报透露出去,所以才能对苏联保持强硬的态度。
预防接种,谁是最大的获益者?
~预防接种博弈/社会性的斗鸡博弈~
关于斗鸡博弈,前面介绍了个人与个人之间的博弈、国家与国家之间的博弈,其实,还有个人与众人之间的博弈案例。以预防接种来说,个人接种了疫苗,可以防止感染相应的疾病,即使感染了,也不至于发展到十分严重的地步,这是接种疫苗的好处。但另一方面,接种疫苗也存在遭受不良反应以及副作用的风险。那么,我们该不该接种疫苗呢?到底该如何衡量呢?
我们把预防接种比喻成一个博弈,你是一个局中人,另一个局中人是其他众人。在这个博弈中,最差的状态就像比试胆量游戏中两车相撞的结果一样,你和其他人都没有接种疫苗。虽然大家都不会受到疫苗副作用的影响,但大家都有可能感染疾病,甚至造成疾病肆虐。另一方面,当你和其他人都接种了疫苗,就像比试胆量游戏中两辆车都转向的结果。虽然大家都可能受到疫苗副作用的影响,但是可以防止疾病的大范围传播。
在接种疫苗的博弈中,也存在两个纳什均衡,一个是“你接种疫苗,其他人都不接种疫苗”,另一个是“你不接种疫苗,其他人都接种疫苗”。分析一下你可能会认为,自己受益最大的策略组合应该是“自己不接种疫苗,其他人都接种疫苗”。这样一来,除自己之外的人都接种了疫苗,可以防止疾病的大爆发,自己感染这种疾病的风险也大大降低了。而与此同时,自己没有接种疫苗,就不会受到疫苗副作用的影响。风险让别人承担了,而自己又可以享受到好的结果,看起来真是一个不错的选择。
预防接种不达到一定的比例,就无法起到预防疾病爆发的作用。如果大家都像你刚才那样想,自己不去接种,等别人去接种,那么结果接种的比例一定很低,从而失去控制疾病爆发的作用。所以,我们不能只从个人的角度出发考虑问题。也正因为如此,国家一般把接种疫苗作为一个公民的义务固定下来,这也是保护公民的一种手段。
第三章 总结
●在非合作博弈中,也可以通过与对手进行协调,来增加自己的收益。
●为了让博弈向有利于自己的方向发展,不仅要研究策略,还可以从改变收益的角度入手。
●要想赢得斗鸡博弈,让对方看到自己“无路可退”,是个很有效的策略。
●让对方感觉我们是“疯子”,也有一定的震慑作用。