按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
大量的心思,一改博弈论公理化论述的传统,而是从案例和故事出发,把博弈论介绍给经济学学子和其他领域的人们,并首创了以表格形式表达的博弈收益矩阵,使得博弈论能够更容易地为没有数学基础的人轻松地阅读与掌握。
⊙托马斯?C。谢林(Thomas C。 Schelling)
托马斯?C。谢林1921年生于美国加利福尼亚州奥克兰市,曾就读于加州大学伯克利分校,在哈佛大学获得经济学博士学位。谢林在经济和战略行为方面有很多重要的著作,其中1960年出版的《冲突的战略》对博弈论作出了突出的贡献。
谢林的理论和思想不仅促进了博弈论的发展,还加速了它在整个社会领域的应用,从而形成了社会科学的经典理论,因此他被看作是非数理博弈理论领域的先驱。他还用博弈论分析了二战后东西方的冷战,阐述了先发制人核打击的危害性。谢林博弈论的一系列观点,对解决人类对资源的合理利用和人类与环境和谐相处,都有十分重要的借鉴意义。2005年,谢林与奥曼(Robert J。 Aumann)因在博弈论方面的研究有助于提高对冲突与合作的了解,共同获得诺贝尔经济学奖。
由此我们可以得出结论:不懂数学,虽然不大可能掌握博弈论中的一些技术性的概念和方法,但这对于了解博弈论的思想精髓及在日常生活中的应用并无大碍。
。 想看书来
第2章 囚徒困境:傻作精时精亦傻,输为赢处赢还输(1)
◆预备知识
在博弈中,你在采取行动时,一定要考虑对方会采取怎样的行动;在博弈中,假定每个人都是理性的;每个博弈参与者都会采取最优策略反应,以使自己在博弈中的预期收益最大化。(第1章)
◆本章重要概念
◎囚徒困境:在博弈论中最常被研究的,也是20世纪最有影响力的博弈实例。它由美国普林斯顿大学数学系教授阿尔伯特?塔克提出。囚徒困境通俗化的表达就是“在一场博弈中,每个人都根据自己的利益做出决策,但最后的结果却是谁也捞不到好处。”
◎优势策略:是指在一个博弈中,不论对方采取哪个策略,我的这个策略总是显出优势。
◎收益矩阵:由著名经济学家托马斯?谢林教授提出,用矩阵的形式直观地表示两个参与者在博弈中的得失。收益矩阵在博弈论中至关重要,在本书的许多章节中都会涉及。
■囚徒困境:忠诚还是背叛?这是一个问题
在了解“囚徒困境”之前,让我们先看一下发生在我国古代的一个小故事。
春秋时期,贫士玉戭生与三乌从臣二人相交甚好,由于没有钱,他们就以品性互勉。玉戭生对三乌从臣说:“我们这些人应该洁身自好,以后在朝廷做官,绝不能趋炎附势而玷污了纯洁的品性。”三乌从臣说:“你说得太有道理了,巴结权贵绝不是我们这些正人君子所为。既然我们有共同的志向,何不现在立誓明志呢?”于是二人郑重地发誓:“我们二人一致决心不贪图利益,不被权贵所诱惑,不攀附奸邪的小人而改变我们的德行。如果违背誓言,就请明察秋毫的神灵来惩罚背誓者。”
后来,他们二人一同到晋国做官。玉戭生又重申以前发过的誓言,三乌从臣说:“过去用心发过的誓言还响在耳边,怎能轻易忘呢!”当时赵盾在执掌晋国朝政,人们争相拜访赵盾,以期能得到他的推荐,从而得到国君的赏识。赵盾的府邸前车子都排出了很远。这时三乌从臣已经后悔,他很想结识赵盾,想去赵盾家又怕玉戭生知道,几经犹豫后,决定起早去拜访。为避人耳目,当鸡刚叫头遍,他就整理衣冠,匆匆忙忙去拜访赵盾了。进了赵府的门,却看见已经有个人端端正正地坐在正屋前东边的长廊里等候了,他走上前去举灯一照,原来那个人是玉戭生。
这则颇具意味的故事出自明代学者宋濂的《宋文献公全集》。宋濂在作品中评论道:“二人贫贱时,他们的盟誓是真诚良好的,等到当了官走上仕途,便立即改变了当初的志向,为什么呢?是利害关系在心中斗争,地位权势使他们在外部感到恐惧的缘故。”或许我们要问,地位和权势是怎样使他们感到恐惧的?或许博弈论中的“囚徒困境”理论可以给出合乎情理的解答。
1950年的一天,美国斯坦福大学客座教授、普林斯顿大学数学系主任阿尔伯特?塔克给一些心理学家做讲演,为了避免使用繁杂的数学手段而能更加形象地说明博弈的过程,他提出了囚徒困境的理论模型。
塔克以下面这则小故事作为开始:
鲍勃和埃尔两个窃贼在偷盗地点附近被警察抓获,分别关押。每个窃贼必须选择是否供认并指证同伙。如果二人都不供认,将被指控非法携带武器,入狱1年。如果二人都供认并指证同伙,将入狱10年。如果一人供认,一人不供认,则鉴于供认者与警方合作的表现,无罪释放,其同伙将遭到严惩,判入狱20年。
第2章 囚徒困境:傻作精时精亦傻,输为赢处赢还输(2)
我们用收益矩阵分析囚徒困境的情况(如下表):
埃尔
供认 不供认
鲍伯 供认 10年,10年 0年,20年
不供认 20年,0年 1年,1年
收益矩阵可以这样解释:囚犯的战略是供认或不供认,每个囚犯选择其中一种战略。竖列代表埃尔的战略,横行代表鲍勃的战略。矩阵中的每组数字是两个囚犯选择不同战略得到的相应结果,逗号左边的数字为鲍勃的收益,右边数字为埃尔的收益。以第一列为例,若两囚犯都认罪,都被判入狱10年;若埃尔认罪,鲍勃不认罪,鲍勃入狱20年,埃尔获释。
那么,到底应该如何解决这一博弈问题呢?如果二人都想入狱时间最短,什么样的战略才是理性的呢?埃尔可能作如下思考:“有两种可能性会发生:鲍勃认罪或保持沉默。假定鲍勃认罪,则我不认罪将入狱20年,认罪将入狱10年,所以该情况下最佳的选择是认罪。相反,假定鲍勃不认罪,则我不认罪将入狱1年,认罪将获得自由,认罪还是最佳选择。总之,我应该认罪。”
⊙托马斯?谢林的博弈收益矩阵
托马斯?谢林教授对博弈论的重大贡献之一就是首先用矩阵形式的表格表示两个参与者的博弈所得。谢林教授曾经说过:“假如真有人问我有没有对博弈论做出一点贡献,我会回答有的。若问是什么,我会说我发明了一个矩阵反映双方得失的做法……我不认为这个发明可以申请专利,所以我免费赠送,不过除了我的学生,几乎没有人愿意利用这个便利。现在,我也供给各位免费使用我发明的矩阵。”
上文中我们所用的用来表示囚徒困境的矩阵,就是谢林教授“免费”提供给我们的。
同样,鲍勃也将按照相同的思维确定自己的行为选择,其结果是两人都认罪,被判入狱10年。然而,如果二人非理性行事,保持沉默,每人只会入狱1年。
由此可见,对于鲍伯来说,无论埃尔采取什么策略,他坦白总是对自己有利的,两相比较,坦白是他的优势策略;对于埃尔同样如此。因此,在这个博弈中,坦白是双方的优势策略,那么,抵赖就是劣势策略。
实际上,囚徒困境正是个人理性冲突与集体理性冲突的经典情形。正因为在囚徒困境中,每个人都根据自己的利益做出决策,但最后的结果却是谁也捞不到好处。这种情形在生活中也会遇到,比如排队购物时,如果大家都在排队而只有一个人挤上前去插队,他将得到好处;可是如果大家都蜂拥而上,将会出现混乱无序的局面,此时你只能跟着大家一起挤才有可能尽快买到你想要的东西,否则你将成为最后一个——也是最吃亏的一个。
学习了囚徒困境理论,我们在回过头来看一下本文开头的小故事,相信会有豁然开朗的感觉。首先,赵盾的权势对玉戭生与三乌从臣而言是不可忽视的外在资源,赵盾是否赏识,将决定他们的仕途是否顺利。这种情形之下,巴结赵盾与不巴结赵盾的选择,就与二人的现实利益息息相关。对于二人而言,无论对方是否选择巴结,自己只有选择巴结才有可能升官。
因此我们不能说趋炎附势是性格软弱而导致的惯性举止,实际上它是为了维护自身利益而进行的一种博弈选择。如果他们信守誓言,就肯定与升迁无缘;而背叛誓言,则有可能得到现实利益。因此,在没有良性竞争的机制下,背叛无疑是利益最大化的选择。因为如果自己坚守,而又没有一种机制能保证对方也同样坚守,那么坚守者就有可能成为被牺牲的傻瓜。学习囚徒困境的理论模型,并非鼓励人们背叛,而是让我们知道,在面临一个决策时,如果没有十全十美的办法,我们不妨权衡一下利弊,从而做到“两害相权取其轻”。
第2章 囚徒困境:傻作精时精亦傻,输为赢处赢还输(3)
⊙阿尔伯特?塔克(Albert tucker;1905—1995)
阿尔伯特?塔克出生于加拿大的安大略,1929年到普林斯顿大学从事研究工作,后来担任该大学数学系主任——当时普林斯顿大学的数学系是世界上最富创造力的数学系之一。
1950年,塔克在作为斯坦福大学的客座教授给心理学家们讲理博弈论时,创造了囚徒困境。囚徒困境的例子虽然简单到用一页纸就可以写完,但却对20世纪后半叶的社会科学产生了深远的影响,塔克本人也因其在博弈论和数学优化领域的贡献而为世人敬仰。
■军备竞赛、价格战与学生减负
“妈妈,我要买耐克运动鞋,脚底有透气孔的那种!”
“多少钱?”
“一千两百多。”
“这么贵?赶上我半个月工资了呢!”
“同学们都有,我也要!”
以上是14岁的初二学生小明放学回到家里和妈妈的对话。对此,大多数朋友会指责小明不懂事、爱慕虚荣、喜欢攀比、不体念父母赚钱养家的艰辛。但这只是表面现象。目前学生穿的校服是学校统一制作的,单从衣服上看,学生无法分出三六九等,不知道谁的父母更有钱、谁在家更受宠。那么比什么?比学习好当然太“老土”,于是比鞋子、比手机、比MP4。大刘的儿子今年上高二,让大刘哭笑不得的是,儿子早上上学走的时候穿的是两只一样的鞋,晚上回到家里一只脚耐克一只脚阿迪达斯——不懂?这是时尚!你要穿个稍微次点的鞋,还没人和你换着穿呢!你说要孩子不要和人攀比?那你无疑是把孩子推到另一个体系——大多数同学之外的体系。这是家长的无奈,也是社会的无奈。
这就是囚徒困境在现实生活中的生动写照。同学间的攀比,其结果是对大家都不好;但是别的同学都有了,你也得有,否则你就是同学中的“另类”,你就会遭多数同学的白眼。
国家之间军备竞赛的例子与此类似,同样可以用囚徒困境来描述。展开军备竞赛的两国都可以声称有两种选择:增加军备(背叛)、或是达成削减武器协议(合作)。两国都无法肯定对方会遵守协议,因此两国最终会倾向增加军备。似乎自相矛盾的是,虽然增加军备会是两国的“理性”行为,但结果却显得“非理性”(例如会对经济造成都有损坏等)。比如冷战时期的美国与苏联。
商业领域,囚徒困境在商业领域也不鲜见,比如价格战、广告战等。让我们看下面一例:
2007年夏,中国食品行业普遍刮起了涨价风。6月21日,光明、蒙牛、伊利、三鹿等14家国内外乳品企业聚集南京签署“乳品企业自律南京宣言”。约定取消特价、降价销售等促销方式,这被认为是一种变相的联合涨价。7月26日,统一、康师傅、日清、今麦郎、华龙等方便面生产企业宣布集体涨价,幅度为20%至40%。对于联合涨价,厂商们给出的统一理由是:遏制低价竞争,维护行业长远发展。
但是结果怎样呢?
不到两个月,在超市的货架上,方便面“涨价联盟”成员之一某品牌的葱爆羊肉方便面就搞起了促销活动——买两包方便面即可获赠一副扑克牌;而有的超市中,某著名品牌方便面则是买五连包送一个酱罐;还有方便面展开了“买五送一”的活动。
再看牛奶,“买一箱伊利纯牛奶送3袋250毫升牛奶”、“光明利乐枕原价元,现价18元”、“原价元特浓纯牛奶现仅售元”“蒙牛买一箱送一袋”……乳制品业的知名品牌无一例外,全部参加了促销活动。而且超市的促销广告牌上标明促销活动时间为7月24日至8月10日,是在乳制品业“涨价联盟”形成之后。。 最好的txt下载网
第2章 囚徒困境:傻作精时精亦傻,输为赢处赢还输(4)
为什么这些当初如此高调、如此信誓旦旦的价格联盟是这样的不堪一击?博弈论中的“囚徒困境”能给出令人信服的解释。假设乳制品市场有两个寡头同时面临着降价与不降价的选择,如果双方都不降价,则双方都保持原来的销售利润,增加的赢利为0;如果双方都降价,则各增…50个单位;如果甲厂降价而乙厂不降价,那么甲通过降价扩大了市场份额,赢利增加100个单位,而乙因为坚持不降价而失去了市场,赢利增加…100个单位;反之,如果乙降价而甲不降价,而乙赢利增加100个单位,而甲赢利增加…100个单位。那么从双方最好的结果来看,就是双方都不降价(相当于“囚徒困境”中的两个人都不招)。但如同囚徒困境一样,只有降价才是每个企业的优势策略——如果对方不降价,我最好降价(我不降价得0,降价得100);如果对方降价,我更得降价(我不降价得…100,降低得…50)。
显然,从参与竞争各方最好的结果来看,就是都不降价。而在现实中,几乎所有的公司都不可避免地陷入了价格战的囚徒困境中。
囚徒困境中在现实生活中的另一个例证是学生减负的问题。众所周知,目前我国的“应试教育”备受诟病,但孩子们无一例外地在接受着这种教育。为什么会出现这种情况呢?我们试着用“囚徒困境”来分析一下:
现实中,学生(或家长)有两个策略可供选择:“减负”与“增负”。选择“减负”策略,学生则有更多的时间学习课本以外的东西,这样学生的综合素质得到提高;选择“增负”,学生花大量的时间做大量的习题,以“学透”、“学精”课本规定的东西,此时,学生没有时间学习课本以外的没有规定的内容。“减负”的结果是学生的全面发展;而“增负”的结果是学生获得高的分数。
在这样的博弈结构下,学生(或学生家长)如何选择呢?每个学生这样想:如果其他人采取的是“增负”策略,我采取“减负”策略,我的考试分数不如他人,接受不了好的教育,在未来求职时我也赶不上他人;如果其他人采取的是“减负”策略,我采取的是“增负”策略,我的考试分数会比其他人高,我会上好的学校,在未来的职业竞争中我会处于优势。因此,无论其他人采取的是什么策略,我采取“增负”策略都是最好的。
说到底,路只有一条,不管别的学生增负还是减负,你都得选择增负,因为这是你的“优势策略”。这就如同看足球赛,如果前排的人为了看得更远而站起来,后排的人必须也得跟着站起来,如果不站起来你就看不到——而人人都站起来,实际上相当于人人都没站起来来——即便如此,你还是不得不跟着站起来。
所以,在应试教育的体制下,“学生减负”只能是一句美妙的口号,没有家长会真正让自己的孩子“减负”的。
■旅行者困境:聪明反被聪明误
有一位因车祸而住院的老大爷,想借此机会敲诈肇事司机,于是就在医院开了许多与车祸创伤无关的营养药品,花了许多不该花的钱。他认为这些钱都应该由肇事司机出。结果交通队查明了事故原因,老大爷承担60%的责任,也就是说,他花的越多,自己承担的也越多。得知这个消息后,老大爷一脸的沮丧:“早知道是这样,我不开这营养药啊,医院的药这么贵!真是聪明反被聪明误啊!”
第2章 囚徒困境:傻作精时精亦傻,输为赢处赢还输(5)
聪明反被聪明误,我们每个人对这句话都不陌生。究其出处,原来却是出自宋代大文豪苏轼口中:“人皆养子望聪明,我被聪明误一生。”生活中的人们,谁都希望自己聪明,聪明的人希望自己更加聪明,没有人愿意自己是个傻子。聪明不是坏事,但自以为聪明,总认为自己了不起,往往就会做出“聪明反被聪明误”的事情来。正如孔子所说:“人皆曰:予知。驱而纳诸罟擭陷阶之中,而莫之知辟也。”意思是说:每个人都说自己聪明,可是被驱赶到罗网陷阱中去却不知躲避。
武则天时的周兴和来俊臣,二人是著名的酷吏,成千上万的人冤死在他们手下。有一次,周兴被人密告伙同丘神绩谋反。武则天便派来俊臣去审理这宗案件,并且定下期限审出结果。来俊臣深知周兴为人感到很棘手。他苦思冥想,生出一计。一天,他准备了一桌丰盛的酒席,把周兴请到自己家里,酒过三巡,来俊臣叹口气说:“兄弟我平日办案,常遇到一些犯人死不认罪,不知老兄有何办法?”周兴一向对刑具很有研究,便很得意地说:“我最近才发明一种新方法,不怕犯人不招。用一个大瓮,四周堆满烧红的炭火,再把犯人放进去。再玩固不化的人,也受不了这个滋味。”来俊臣听了,便吩咐手下人抬来一个大瓮,照着刚才周兴所说的方法,用炭火把大瓮烧得通红。然后站起来,把脸一沉对周兴说:“有人告你谋反,太后命我来审问你,如果你不老老实实供认的话,那我只好请你进这个大瓮了!”周兴听了惊恐失色,知道自己在劫难逃,只好俯首认罪。
⊙旅行者困境
由哈佛大学教授巴罗提出,它通过一个生动的虚拟案例,揭示了如果是人彻底理性、能够算计到十几步甚至几十步的话,那么他推论出的结果,很可能并不符合自己的现实利益。
如果周兴自己不给来俊臣出馊主意,自己或许能躲过一劫,但倒霉就倒霉在他太“聪明”了。由此可见,吃亏的人