按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
为什么一毕业,就宣告着一段美好的恋情结束、而昔日亲密无间的恋人也要劳燕分飞呢?这涉及博弈论中的“有限重复博弈”与“无限重复博弈”的问题。为了使读者朋友更容易地理解这个问题,让我们先从大家都熟悉的《鹿鼎记》中所描写的两个情节谈起。
《鹿鼎记》中韦小宝被太监海大富抓进皇宫之中,却伺机毒瞎了海大富,并杀死了海大富身边的小太监小桂子,从此在宫中冒充小桂子。在顺治帝出家前,海大富受命留在宫中调查找杀死端敬皇后的凶手,他自始就从口音中辨出此小桂子非彼小桂子,却一直没有说破,不动声色地查探这个“小桂子”的幕后指使是谁,后来却意外地从韦小宝身上得知原来杀死端敬皇后的凶手竟然是现在的皇太后。海大富决定向太后发难,韦小宝已无利用价值,于是他最终向韦小宝摊牌。而此时韦小宝才得知原来海大富早已知道他其实不是小桂子,但此时也只能在肚中暗骂海大富“死老乌龟,臭老乌龟!”了。(事见《鹿鼎记》第六回)
书中还有一次康熙对韦小宝的“摊牌”:康熙早已知道韦小宝是反清组织天地会的香主,却一直隐忍不发。直到韦小宝把天地会众兄弟聚集在自己的伯爵府,康熙决定将其一网打尽之时,才对韦小宝亮出底牌:“天父地母,反清复明!韦香主,你好大的胆子哪!”(事见《鹿鼎记》第四十三回)康熙的这张底牌一亮,就意味着胜负已分,他与韦小宝的这一回合的“斗心眼儿”也宣告结束。
但是假如海大富没有查出皇太后会“化骨绵掌”且是杀死端敬皇后的凶手,或者假如康熙没有机会把天地会一网打尽,那么他们势必还会把糊涂装到底。装到什么时候是终点呢?恐怕没有人知道。也就是说,只要海大富一天没有查出杀害端敬皇后的凶手,或者康熙一直没有机会把天地会一网打尽,他们就将装作不知韦小宝真实身份的样子一直与韦小宝“玩儿”下去。
如果我们把韦小宝与海大富及与康熙的“斗心眼儿”视为一场博弈,那么书中所写的最后“摊牌”的情形则被称为“有最后一次重复的博弈”,而我们假设的“一直玩下去”的情形则被视为“无限重复的博弈”。所谓有限重复博弈,是指重复次数是有限的且有确定终点的博弈;而无限重复博弈,则是指重复次数是无限的或者对双方而言不知道哪一次是尽头的博弈。
通过前面的分析我们知道,在一次性博弈中,“对抗”对双方而言是最优策略,在重复博弈中,“合作”对双方而言是最优策略。而在有限重复博弈中,由于最后一次博弈是确定会出现的,这个“最后一次博弈”可以被视为一个“一次性博弈”,也就是说,在双方的最后一次博弈中,“对抗”是最优策略,因为人们在重复博弈中之所以选择合作,主要是考虑日后还要进行博弈,而在最后一次博弈中则没有以后,因此显然不必考虑后面的行动。 电子书 分享网站
第3章 重复博弈:“一锤子买卖”与长期合作(5)
那么再回到我们前面所说的“毕业了就说分手”的事例,用博弈论的术语来说,这是一个“有最后一次的重复博弈”。毕业之后,二人一个回西北,一个回东南,在一起生活成了不现实的情况。“毕业”这一不可改变的现实,就是博弈的“最后一次重复”,所以二人最佳的选择只能是分手。
让我们进一步假设:李平与魏芳毕业后留在了同一所城市,他们还会如此轻易地选择分手吗?如果没有特殊情况,应该不会!至少分手的可能性要大大降低,因为毕业后同处一座城市,就是说二人之间还有美好的未来,从而使得二人间的博弈从“有限重复博弈”转成了“无限重复博弈”,而无限重复博弈中,最理性的选择是合作而非对抗。
因“有最后一次的重复博弈”而发生的对抗性情形在生活中并不鲜见,比如张三、李四两个同事素有矛盾,但既在一家单位工作,二人面临的是长期共事,且谁也不知道会共事到什么时候,如果他们都是严格意义上的“理性经济人”,则通常他们不会大打出手,即便不能化干戈为玉帛,也只会暗斗而不会明争。但一旦哪一天其中的一位决定离开公司,那么,双方积蓄已久的矛盾就很有可能集中爆发,因为“无限重复博弈”转成了“有限重复博弈”,在“有限重复博弈”中,双方所能选择的最佳策略是对抗。
这种情形有点类似于我们通常所说的“君子报仇,十年不晚”,因为一个理性的人要“报仇”,必须考虑报仇的条件是否成就,会有什么样的后果与得失,而非莽撞行事。但是这并不说明在任何情况下的重复博弈中,隐忍总是最好的策略,有些情况下,“一报还一报”的策略反而能显出奇效,这一点我们将在下篇中予以讨论。
■你打我一拳,我是否应该马上踢你一脚?
电视剧《亮剑》中,日本的山本特工队夜袭独立团团部,掳走了独立团团长李云龙的新婚妻子秀芹,重伤独立团政委赵刚。李云龙集结队伍,未经请示,公报私仇,攻打山本特工队所在的平安县城,最终全歼山本特工队,但秀芹也玉石俱焚。这一仗打出了八路军的威风,更打灭了日本人骄横不可一世的气焰。战斗过后,李云龙去野战医院看望赵刚时,二人有了一番推心置腹的交谈。一向服从上级领导、守纪律、讲原则的赵刚这次没有埋怨李云龙擅自调动部队作战,反而赞赏地对李云龙说:“你李云龙,是有仇就报的性格,那独立团当然也是如此。君子报仇,十年不晚。这句话不适合独立团。独立团是有仇就报,马上就报。你给我一刀,我反手就是一剑。公平合理,决不欠债。”
“有仇就报,马上就报”如果用博弈论的观点来解释,则可以简单地描述为“针锋相对策略”。这一策略的提出者是美国密歇根大学的学者罗伯特?爱克斯罗德,他是一个政治科学家,研究的领域主要是人与人之间的合作关系。
爱克斯罗德在开始研究合作之前,设定了两个前提:一、每个人都是自私的;二、没有任何权威干预每个人的决策。也就是说,个人可以完全按照自己利益最大化的企图进行决策。在此前提下,合作要研究的问题是:第一、人为什么要合作;第二、人什么时候是合作的,什么时候又是不合作的;第三、如何使别人与你合作。书包 网 。 想看书来
第3章 重复博弈:“一锤子买卖”与长期合作(6)
在研究的过程中,爱克斯罗得教授组织了一场计算机模拟竞赛,竞赛的思路非常简单:任何想参加这个计算机竞赛的人都扮演“囚徒困境”案例中一个囚犯的角色,他们开始玩“囚徒困境”的游戏,每个人都要在合作与背叛之间做出选择。关键问题在于,他们不只玩一遍这个游戏,而是一遍一遍地玩上200次,这就是所谓的“重复的囚徒困境”,于是这就更逼真地反映了日常人际关系。这又是一个值得注意的条件,最简单的囚徒困境模型说的是一次性博弈,正是这一点加剧了囚徒做出坦白的决心。
试验的结果使爱克斯罗德大为吃惊,因为竞赛的冠军获得者——多伦多大学的数学教授阿纳托?拉波波特所采取的策略一点都不高深,而是非常简单:一报还一报。也就是我们通常所说的“以其人之道,还治其人之身”。它的特点是:第一次对局采用合作的策略,以后每一步都紧紧跟随对方上一步的策略,你上一次合作,我这一次就合作,你上一次不合作,我这一次就不合作。
为了进一步验证第一轮游戏得到的结论,爱克斯罗德邀请了更多的人再做一次游戏。这时游戏进入了第二轮。第二次爱克斯罗德征集到了62个程序,同样也附加上他自己的随机程序,又进行了一次竞赛。结果,第一名的仍是针锋相对策略。
这个如此简单的策略之所以反复赢得竞赛,是因为它奉行了针锋相对的法则,说白了就是一报还一报,即“人不犯我,我不犯人;人若犯我,我必犯人”,但它坚持“有理、有利、有节”的尺度,并且用以下有规律可供遵循的行为将对手纳入长期合作的轨道上来:
第一,善良的,即从不首先背叛;
第二,可激怒的,对于对方的背叛行为一定要报复,不能总是合作;
第三,宽容的,不能人家一次背叛,你就没完没了地报复,以后人家只要改为合作,你也要合作;
第四,易于察觉的,即逻辑清晰,使对手能够很轻易地发现你采取策略的规律,并且领会你的意图。
⊙爱克斯罗德比赛
罗伯特?爱克斯罗德1943年出生于芝加哥,曾就读于芝加哥大学和耶鲁大学,现在是密歇根大学政治学教授。
1980年,爱克斯罗德组织了一次关于囚徒困境的不同战略的比赛。比赛包括一些简单的战略,如“针锋相对”和总是犯错误,同时也包括一些比较复杂的战略。他邀请了杰出的博弈理论学家制作了一些程序,通过计算机模拟的方式进行战略之间的对抗。在其一份影响很大的报告中,他指出针锋相对的战略在一定范围内是最优的,不存在一个完美的战略优于其他的战略。
而输掉这个竞赛的策略,总是在上述四个方面做得不够好。比如竞赛者的脾气过于好,总是“以德报怨”,结果就被狡猾之徒反复地占便宜;有些竞赛者不够宽容,别人背叛一次他就不与对方再次合作,从而使合作关系永久性断绝;还有一些竞赛者太“精于算计”,总是试图通过取巧来占别人的便宜,这种人在与“好脾气者”的博弈中虽然大占便宜,但与“不宽容者”的博弈中往往搬起石头砸自己的脚,而从最后的总分来看,他的“小聪明”总是得不偿失。
历史反复证明了这一策略的正确性:1945年抗日战争胜利后,为避免内战、争取和平,中囯共产党同国民党政府在重庆进行了为期43天的和平谈判,史称“重庆谈判”。谈判之前,蒋介石就让阎锡山入侵上党地区,以此先发制人,扼守抢夺平津、独占华北的交通要道,保持长江与北方之间的陆上联系。当时国共之前的军事摩 txt小说上传分享
第3章 重复博弈:“一锤子买卖”与长期合作(7)
擦已经出现。8月25日,即毛泽东电复蒋介石将亲自赴重庆谈判的当天,对即将返回上党前线的刘伯承、*说说:“你们回到前方去,放手打就是了。不要担心我在重庆的安全问题,你们打得越好,我越安全,谈得越好。别的办法是没有的。”刘、邓回到上党,稍事休息,即在直属机关干部大会上作了上党战役的动员报告。指出:“我们立足于打,不放弃有利条件的谈判。只有打得好,才能谈得好。”
就这样,国共和谈在边打边谈中进行。重庆谈判从8月28日毛泽东赴重庆开始判,至10月11日,前后共43天;上党战役从9月1日攻克襄垣开始,到10月8日解放长治,12日全歼逃敌而胜利结束,历时42天。重庆谈判桌上与上党战场无论时间、进展情况极其一致与密切相关,绝非是偶然的。中国共产党的方针是“以打促谈”,“打而胜之”是共产党重庆谈判桌上的重要筹码,也是国共和谈取得成功的保障。
从上述事例中我们可以看到,中国共产党正是采取了“针锋相对策略”:首先,解放军绝不开第一枪,所以是善意的;其次,一旦国民党军队挑起军事冲突,人民解放军立即报以颜色,这表明共产党是“可被激怒的”;第三,共产党绝不得理不饶人,你停火,我就停火,这表明共产党是“宽容的”。其结果是,国共两党达成了和平协议。(虽然后来内战还是爆发,但它不属于本文讨论的范围。)除此之外,中国军队在朝鲜战争、中印战争、对越自卫反击战等战争中,采取的均是“人不犯我,我不犯人;人若犯我,我必犯人”以及边打边谈的针锋相对策略。
“针锋相对策略”在实际生活中可以被广泛地应用:比如当你受到朋友的欺骗时,你知道即便报复了他也并不能消除已对你形成的伤害,而且你还希望两个人的关系能够继续,那么你最好是宽恕他。但是,若他知道即便伤害了你也会获得宽恕的时候,他就可能一直有意无意地不停伤害你。就像我们现实生活中的一些心地善良却遇人不淑的女子,那些女子一次又一次原谅背叛她的丈夫,希望用真情感动他回心转意;但结果丈夫反而得寸进尺,因为他知道无论如何,只要一些花言巧语、再摆出一副要痛改前非的可怜相,就会轻易地获得宽恕。
所以有时候,人们会对伤害选择报复。当别人打你一拳,你马上还他一脚,这固然并不能减轻你已挨那一拳的疼痛,而且用力踢回一脚通常也得不到*。那为什么还要针锋相对地坚决予以回击呢?原因就在于,打不还手只会让对手更加猖狂,而只有回击才能遏制对方的进一步侵犯。所以,有些时候宽大为怀不一定好,有些时候毫无回旋余地也不见得最佳。人类互动世界的奇妙之处于此尽显。
■没有惩罚机制的契约不过是一纸空文
狐狸与狮子约定合作打猎,狐狸负责寻找猎物,狮子负责捕获猎物。成功捕猎后狮子分得八成,狐狸分得二成。口说无凭,二者还郑而重之地签订了一份协议。协议签订后,狐狸就兢兢业业地出去寻找猎物,很快他发现了一只梅花鹿,赶紧告诉狮子前去捕捉。狮子按照狐狸的指示,很容易地捉到了那只梅花鹿。可是当狐狸要求分得它那两成鹿肉时,狮子露出尖利的牙齿:“趁早滚远点,否则连你也吃了!”倒霉的狐狸只好赶紧逃命。
第3章 重复博弈:“一锤子买卖”与长期合作(8)
类似的一幕在中国历史中也曾上演:1232年,蒙古窝阔台可汗派使臣到南宋,提出联合灭金。南宋长期受金国欺压,早有反抗之心,因此也遣使前往蒙古,双方达成协议:宋朝出兵与蒙古耿合攻打金国,蒙古答应灭金后把黄河以南的中原地带归还南宋。1234年,宋蒙联军经过艰苦奋战,灭亡了金国。可是金灭后,蒙古窝阔台可汗撕毁了将黄河以南归还南宋的协议,改为陈,蔡以北属蒙古,以南属南宋。南宋政府被迫承认了这一事实,双方各自罢兵归国。
这是两个关于合作与背盟的囚徒困境。爱克斯罗德在他所著的《合作的进化》一书中,曾经提出这样一个重要的假定:个体之间的博弈是完全无差异的。放在上述两个案例里,就是说狐狸与狮子同样强大,南宋与蒙古同样强大。
⊙《合作的进化》
《合作的进化》是密歇根大学政治学与公共政策教授、美国科学院院士,著名的行为分析及博弈论专家罗伯特?爱克斯罗德的代表作,是行为领域的经典之作,其主题是合作的产生和进化。作者以组织的两轮“重复囚徒困境”竞赛为研究对象,结果发现在两轮竞赛中胜出的都是最简单的策略“一报还一报”。这一策略简洁明晰,具有善良性、宽容性、可激怒性和策略性,其出色的竞赛表现为我们了解个人、组织和国家间合作产生和进化提供了积极的前景,其结论在社会科学的诸领域产生了广泛深刻的影响,被广泛征引。
本书中译本于2007年由上海人民出版社出版。
但爱克斯罗德的假定忽略了这样一个重要事实:一场博弈中的对局者之间绝对的平等是不可能达到的,对局者在实际能力上存在不对称,双方互相背叛时,可能不是各得1分,而是强者得5分,弱者得0分。上述两个案例中的狐狸与南宋,就是因为其弱小而忍气吞声。
我们可以这样设想,假如南宋与蒙古同样强大,蒙古还敢撕毁盟约吗?或者即使南宋的军事力量的确比蒙古弱小许多,但一旦蒙古背弃盟约,会有一个强有力的“第三方”出来为南宋主持正义,而这个第三方的力量强大到足以让蒙古畏惧,那么蒙古还会背弃盟约吗?
由此我们可以看到,在合作中,签订协议并不困难,困难的是协议对博弈各方是否具有很强的约束力。任何协议签订之后,博弈参与者都有背盟的动机,因为至少在背盟的这一轮博弈中,他可以得到更大的收益。怎样解决这个问题呢?英国政治学家、哲学家霍布斯对合作协议的观点是:“不带剑的契约不过是一纸空文。它毫无力量去保障一个人的安全。”如果要通俗地将这句话加以表述,则可以说为“没有惩罚机制的合同不过是一张废纸,没有任何意义。”
现实生活中,每一个合作通常都会包含某种惩罚背盟者的机制。比如在商业合同中,一般都会有违约责任条款,如果一方违约,则会被判定向对方支付违约金,如果给对方造成了损失,还要赔偿对方损失。如果违约方拒不赔偿,则会有强有力的第三方——法院来强制执行。再比如现在有的情侣在结婚前,约定婚后对感情不忠的一方“净身出户”,财产全部归对方所有。这种在最初博弈之时就讲好惩罚机制的做法,其目的就是为了减少背信弃义行为的发生。也正因为如此,我们提倡通过法制手段,以法律的惩罚来规范合作行为——即违约者、犯法者必须要为自己的行为付出相应的代价。这同时也告诫一部分人,在与人达成合作协议时,除了要考察对方以往的信誉度,你还要关注这合作份协议中是否包含了能够得以实现的惩罚机制。如果没有,你最好不要选择合作,免得成为本文开头提到的那只吃亏的狐狸。 。。
第3章 重复博弈:“一锤子买卖”与长期合作(9)
■从“投名状”看道德规则在博弈中的力量
我们知道,博弈论的基本假定就是“人是绝对理性的”。既然“绝对理性”,则可以不考虑道德力量的因素。那么能够因此断定道德在博弈中无所作为吗?答案是否定的。
我们先来看一下广为人知的例子,故事出自于2007年的电影大片《投名状》。
什么是投名状?《水浒传》有云:凡好汉们入伙,须要纳投名状。其意思是指一个人在进入黑道绿林时必须签订一份生死契约,或者杀一个人,将头献纳,一来以表忠诚,二来互相掌握对方的犯罪证据便不用害怕背叛。三来也是这种黑帮一种共同犯罪体的默认契约,这个便谓之“投