知方号

知方号

6个例子让你彻底明白,什么是纳什均衡<纳什均衡理论是什么意思啊>

6个例子让你彻底明白,什么是纳什均衡

电影《美丽心灵》的主人公原型——约翰·纳什因车祸去世。你也许听说过他是厉害的数学家、1994 年诺贝尔经济学奖得主、博弈论之父……但是,他的最大贡献是“纳什均衡”。

那么问题来了,纳什均衡到底是个什么鬼?

我们先来看看纳什均衡的经济学定义:

所谓纳什均衡,指的是参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。换句话说,如果在一个策略组合上,当所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。

是不是看完几乎没什么概念?

我们先用个常见的现象试图解释下,例如价格战。生产同一样产品的若干厂家会形成一个稳定的状态,在这个状态下各家所卖的产品价格保持基本一致,在这种情况下各方就形成了一个“纳什均衡”。

若其中一方打破默契,开始大幅降价,以求薄利多销,获取更大利润,那么其他家便会很快跟进,互相压价。刚开始降价的一方短期内可能会增加销量和利润,但最终的结果是两败俱伤。

下面小编将给大家举几个经典的例子,以便大家更深刻地理解约翰·纳什这位奇才留给我们的精神遗产。

1囚徒困境

假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌 疑人,警方给出的政策是:

如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8 年。

如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。

如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。

关于案例,显然最好的策略是双方都抵赖,结果是大家都只被判1年。但是由于两人处于隔离的情况,首先应该是从心理学的角度来看,当事双方都会怀疑对方会出卖自己以求自保、其次才是亚当·斯密的理论,假设每个人都是“理性的经济人”,都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程:

假如他坦白,如果我抵赖,得坐10年监狱,如果我坦白最多才8年;假如他要是抵赖,如果我也抵赖,我就会被判一年,如果我坦白就可以被释放,而他会坐10年牢。综合 以上几种情况考虑,不管他坦白与否,对我而言都是坦白了划算。两个人都会动这 样的脑筋,最终,两个人都选择了坦白,结果都被判8年刑期。

基于经济学中Rational agent的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被判处一年就不会出现。这样两人都选择坦白的策略以及因此被判8年的结局,纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战:按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。但是我们可以从“纳什均衡”中引出“看不见的手”原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。

1枪手博弈

彼此痛恨的甲、乙、丙三个枪手准备决斗。甲枪法最好,十发八中;乙枪法次之,十发六中;丙枪法最差,十发四中。

先提第一个问题:如果三人同时开枪,并且每人只发一枪;第一轮枪战后,谁活下来的机会大一些?

一般人认为甲的枪法好,活下来的可能性大一些。但合乎推理的结论是,枪法最糟糕的丙活下来的几率最大。

我们来分析一下各个枪手的策略。

枪手甲一定要对枪手乙先开枪。因为乙对甲的威胁要比丙对甲的威胁更大,甲应该首先干掉乙,这是甲的最佳策略。

同样的道理,枪手乙的最佳策略是第一枪瞄准甲。乙一旦将甲干掉,乙和丙进行对决,乙胜算的概率自然大很多。

枪手丙的最佳策略也是先对甲开枪。乙的枪法毕竟比甲差一些,丙先把甲干掉再与乙进行对决,丙的存活概率还是要高一些。

但是在第一轮枪战后,丙有可能面对甲,也可能面对乙,甚至同时面对甲与乙,除非第一轮中甲乙皆死。尽管第一轮结束后,丙极有可能获胜(即甲乙双亡),但是第二轮开始,丙就一定处于劣势,因为不论甲或乙,他们的命中率都比丙的命中率为高。

这就是枪手丙的悲哀。能力不行的丙玩些花样虽然能在第一轮枪战中暂时获胜。但是,如果甲乙在第一轮枪战中没有双亡的话,在第二轮枪战结束后,丙的存活的几率就一定比甲或乙为低。

这似乎说明,能力差的人在竞争中耍弄手腕能赢一时,但最终往往不能成事。

我们现在改变游戏规则,假定甲乙丙不是同时开枪,而是他们轮流开一枪。在这个例子中,我们发现丙的机会好于他的实力,丙不会被第一枪干掉,并且他可能极有机会在下一轮中先开枪。

先假定开枪的顺序是甲、乙、丙,甲一枪将乙干掉后(80%的几率),就轮到丙开枪,丙有40%的几率一枪将甲干掉。即使乙躲过甲的第一枪,轮到乙开枪,乙还是会瞄准枪法最好的甲开枪,即使乙这一枪干掉了甲,下一轮仍然是轮到丙开枪。无论是甲或者乙先开枪,乙都有在下一轮先开枪的优势。

如果是丙先开枪,情况又如何呢?

丙可以向甲先开枪,即使丙打不中甲,甲的最佳策略仍然是向乙开枪。但是,如果丙打中了甲,下一轮可就是乙开枪打丙了。因此,丙的最佳策略是胡乱开一枪,只要丙不打中甲或者乙,在下一轮射击中他就处于有利的形势。

我们通过这个例子,可以理解人们在博弈中能否获胜,不单纯取决于他们的实力,更重要的是取决于博弈方实力对比所形成的关系。

在上面的例子中,乙和丙实际上是一种联盟关系,先把甲干掉,他们的生存几率都上升了。我们现在来判断一下,乙和丙之中,谁更有可能背叛,谁更可能忠诚?

任何一个联盟的成员都会时刻权衡利弊,一旦背叛的好处大于忠诚的好处,联盟就会破裂。在乙和丙的联盟中,乙是最忠诚的。这不是因为乙本身具有更加忠诚的品质,而是利益关系使然。只要甲不死,乙的枪口就一定会瞄准甲。但丙就不是这样了,丙不瞄准甲而胡乱开一枪显然违背了联盟关系,丙这样做的结果,将使乙处于更危险的境地。

合作才能对抗强敌。只有乙丙合作,才能把甲先干掉。如果,乙丙不和,乙或丙单独对甲都不占优,必然被甲先后解决。、

1966年经典电影《黄金三镖客》中的最后一幕,三个主人公手持枪杆站在墓地中,为了宝藏随时准备决一死战。为了活着拿到宝藏,幸存下来的最优策略是什么呢?

《生活中的概率趣事》一书中用概率的方法进行了严密的推理计算,给出了最优解,具体的计算步骤详见《生活中的概率趣事》书中P56—P57。

1

赤壁之战

那时,曹操势力最强,孙权次之,刘备最弱。为了抵抗强大的曹操,孙刘两家只有联合起来,取胜的几率才比较大。孙权就相当于前面例子中的乙,是孙刘联盟中最卖力的成员。在赤壁之战中,孙权出力最多,刘备实际上没出多少力。《三国演义》夸大了诸葛亮对赤壁之战的贡献,当时孙刘联军的统帅实际上是周瑜,周瑜在赤壁之战的功劳远大于诸葛亮。

1

蒙古联合南宋灭金

当时,蒙古军事实力最强,金国次之,南宋武力最弱。本来南宋应该和金国结盟,帮助金国抵御蒙古的入侵才是上策,或者至少保持中立。但是,当时的南宋采取了和蒙古结盟的政策。南宋当局先是糊涂地同意了拖雷借道宋地伐金。1231年,蒙古军队在宋朝的先遣队伍引导下,借道四川等地,北度汉水歼灭了金军有生力量。

1233年,南宋军队与蒙古军队合围蔡州,金朝最后一个皇帝在城破后死于乱兵,金至此灭亡。1279年,南宋正式亡于蒙古。

如果南宋当政者有战略眼光,捐弃前嫌,与世仇金结盟对抗最强大的敌人蒙古,宋和金都不至于那么快就先后灭亡了。

1智猪博弈

猪圈里面有两只猪, 一只大,一只小。猪圈很长,一头有一个踏板,另一头是饲料的出口和食槽。每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只 猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪 会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。

那么,两只猪各会采取什么策略?令人出乎意料的是,答案居然是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。

原因何在呢?

因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。

“智猪博弈”的结论似乎是,在一个双方公平、公正、合理和共享竞争环境中,有时占优势的一方最终得到的结果却有悖于他的初始理性。

这种情况在现实中比比皆是。

比如,在某种新产品刚上市,其性能和功用还不为人所熟识的情况下,如果进行新产品生产的不仅是一家小企业,还有其他生产能力和销售能力更强的企业。那么,小企业完全没有必要作出头鸟,自己去投入大量广告做产品宣传,只要采用跟随战略即可。

“智猪博弈”告诉我们,谁先去踩这个踏板,就会造福全体,但多劳却并不一定多得。

在现实生活中,很多人都只想付出最小的代价,得到最大的回报,争着做那只坐享其成的小猪。“一个和尚挑水喝,两个和尚抬水喝,三个和尚没水喝”说的正是这样一个道理。这三个和尚都想做“小猪”,却不想付出劳动,不愿承担起“大猪”的义务,最后导致每个人都无法获得利益。

智猪博弈与“枪打出头鸟”

一个很常见的现象就是在企业中,不论国企还是民企或是外企,在企业内部总会存在各种各样的小团体。套用组织行为学的专业术语来说就是存在各种非正式组织。而每一个团体都代表了一部分人的利益,因此不可避免地会产生冲突。

这时,每个团体都会推选出各自的代言人。这些代言人是为集体利益(如争取加薪或增加福利等)作出积极行动的领头人。但我们这时会发现,被推选为代言人的总是那些胸无城府、意气用事的人。

然而,群体活动的最大受益者“小猪”们则永远躲在幕后。活动成功了,他们可以毫发无伤地优先分到一杯羹;如果失败了,他们也可以发表一通与我无关,我是受害者之类的演讲,让“大猪”成为永远的牺牲者。从另一个角度来看,懂得智猪博弈对于个人并非是件坏事。

1证券市场中的“智猪博弈”

金融证券市场是一个群体博弈的场所,其真实情况非常复杂。在证券交易中,其结果不仅依赖于单个参与者自身的策略和市场条件,也依赖其他人的选择及策略。

在“智猪博弈”的情景中,大猪是占据比较优势的,但是,由于小猪别无选择,使得大猪为了自己能吃到食物,不得不辛勤忙碌,反而让小猪搭了便车,而且比大猪还得意。这个博弈中的关键要素是猪圈的设计, 即踩踏板的成本。

证券投资中也是有这种情形的。例如,当庄家在底位买入大量股票后,已经付出了相当多的资金和时间成本,如果不等价格上升就撤退,就只有接受亏损。

所以,基于和大猪一 样的贪吃本能,只要大势不是太糟糕,庄家一般都会抬高股价,以求实现手中股票的增值。这时的中小散户,就可以对该股追加资金,当一只聪明的“小猪”,而让 “大猪”庄家力抬股价。当然,这种股票的发觉并不容易,所以当“小猪”所需要的条件,就是发现有这种情况存在的猪圈,并冲进去。这样,你就成为一只聪明的 “小猪”。

从散户与庄家的策略选择上看,这种博弈结果是有参考价值的。例如,对股票的操作是需要成本的,事先、事中和事后的信息处理,都需要金钱与时间成本的投入,如行业分析、企业调研、财务分析等。

一旦已经付出,机构投资者是不太甘心就此放弃的。而中小散户,不太可能事先支付这些高额成本,更没有资金控盘操作,因此只能采取小猪的等待策略。等到庄家动手为自己觅食而主动出击时,散户就可以坐享其成了。

股市中,散户投资者与小猪的命运有相似之处,没有能力承担炒作成本,所以就应该充分利用资金灵活、成本低和不怕被套的优势,发现并选择那些机构投资者已经或可能坐庄的股票,等着大猪们为自己服务。

由此看到,散户和机构的博弈中,散户并不是总没有优势的,关键是找到有大猪的那个食槽,并等到对自己有利的游戏规则形成时再进入。

遗憾的是,在股市中,很多作为“小猪”的散户不知道要采取等待策略。更不知道让“大猪”们去表现,在“大猪”们拉动股票价格后从中获取利润,才是“小猪”们的最佳选择。

作为“小猪”,还要学会特立独行。行动前,不用也不需要从其他“小猪”那里得到肯定;行动时,认同且跟随你的“小猪”越多,则你出错的可能也就越大。简单地说,就是不要从众,而是跟随“大猪”。

当然股市中的金融机构要比模型中的大猪聪明的多,并且不守游戏规则,他们不会甘心为小猪们踩踏板。事实上,他们往往会选择破坏这个博弈的规矩,甚至重新建立新规则。

比如他们可以把踏板放在食槽旁边,或者可以遥控,这样小猪们就失去了搭便车的机会。例如,金融机构和上市公司串通,散布虚假的利空消息,这就类似于踩踏板前骗小猪离开食槽,好让自己饱餐一顿。

当然金融市场中的很多“大猪”也并不聪明,他们的表现欲过强,太喜欢主动地创造市场反应,而不只是对市场作出反应。短期来看,他们可以很容易地左右市场,操纵价格,做胆大妄为的造市者。

这些“大猪”们并不知道自己要小心谨慎、如履薄冰,他们不知道自己的力量不如想象的那样强大到可以无敌于天下。自然而然地,每一年都会有一些高估自己的“大猪”倒下,幸存的“大猪”在经过优胜劣汰之后会变得更加强壮。

不过,无论是多么强壮的“大猪”,只要过于自信、高估自己控制市场的能力,总会倒下。

俗话说“家家有本难念的经”,在股市中,“大猪”有“大猪”的难处,“小猪”有“小猪”的难处。尽管“大猪”“小猪”只要了解自身处境,采取相应的策略就会成功,然而理性是有限的,确定的成功总是很难获得。

文末福利:纳什均衡的扩展应用

我们把男生女生分成ABCD四等来看,由于男性的控制性倾向,导致其一般会降格选择异性伙伴,因此现实中的典型配对是:A男配B女,B男配C女,C男配D女,A女与D男轮空。

A女(鲜花)确定D男(牛粪)没人要,而D男确定A女追不到。这导致了两个最有可能的均衡策略:A女如果在某种情况下选择了D男,则D男一定会接受;D男去追A女则肯定不会有结果。但反正D男

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至lizi9903@foxmail.com举报,一经查实,本站将立刻删除。