经济学原理

标题: 【附录】博弈论初步 [打印本页]

作者: admin    时间: 2018-10-6 22:21
标题: 【附录】博弈论初步
        
   
   
   
      
从图12A-1的支付矩阵可以看出,当乙寡头选择合作的策略时,甲寡头会选择不合作,乙选择不合作时,甲同样选择不合作,因此不合作就是甲寡头和占优策略,不管乙怎么选择,甲选择不合作都是最优的。而对于乙寡头来讲,当甲选择合作时,乙会选择合作,当甲选择不合作时乙则同样也选择不合作,就是说乙并不存在占优策略,它选择什么样的策略要看甲的选择。由于甲不管在什么情况下都会选择不合作,而只要甲选择不合作了乙肯定也会选择不合作,那么两个寡头就会在“不合作-不合作”这个策略组合上实现博弈均衡。当这一博弈均衡实现后,双方都没有改变自己的策略的动力了,因为改变的话只会使自己的状况变坏而不能改善,这种均衡我们就称其为纳什均衡。
如果有n个局中人参与博弈,在给定其他人策略的条件下,每个参与者都会选择自己的最优策略以实现自己收益的最大化,这种策略选择可能依赖于也可能不依赖于别人选择。所有参与者的策略构成一个策略组合,当这个策略组合由所有参与人的最优策略组成的时候,就形成了纳什均衡,这时,在给定其他参与者策略的前提下,没有任何一个参与者有足够的激励打破这种均衡。因此,纳什均衡(Nash Equilibrium)就是这样一种均衡,任何一个参与者都不会改变自己的最优策略,如果其他参与者均不改变其最优策略。从本质上讲,这种纳什均衡是一种非合作博弈。
在图12A-1纳什均衡的例子中,甲寡头不管乙怎么选择自己都会选择不合作,这属于占优策略,而乙则不存在占优策略,自己的选择要根据甲的选择来确定。但在我们前面介绍的囚徒困境博弈中则不同,两个囚徒都存在着占优策略,即不管另一方如何选择,自己都会选择坦白。这种每一个参与者对于其他参与者的任何策略来说,其最优策略者是唯一的,也就是都是占优策略的均衡,我们称之为占优策略均衡(Dominant Equilibrium)。占优策略均衡肯定属于纳什均衡,但纳什均衡不都是占优策略均衡,因为纳什均衡只是要求在其他参与者策略给定的条件下,任何一个参与者都选择了最优策略。占优策略均衡在一局博弈中只有一个,但纳什均衡可以有多个,比如下面的例子:
12A.2.2 纳什均衡的另一个例子:性别大战

性别战博弈(Game ofBattle of Sex,有时缩写为BoS),描述的是这样一种博弈:双方存在一定的共同利益,但是具有共同利益的不同结果又有着相对冲突的偏好。假设有一对情侣,男的喜欢打游戏,女的喜欢逛街,同时两个人关系很好只要在一起就会开心,于是我们就可以得到下面的支付矩阵:


        
图 12A-2 性别大战
   
      
        
2
   
      
在图12A-3中的博弈树是自左向右展开的,由一些线段和一些点组成。最左侧的点叫起点,或者叫初始决策点,这是博弈树的根,是整个博弈开始的地方,此点我们记作a,在我们的例子中,由于博弈过程是从进入者是否要进入垄断市场开始的,所以a点就是进入者的决策点,在此点标注“进入者”。从初始决策点引出向右伸展的两条线段,代表进入者的两个可代选择的行动策略:进入和不进入。两条线段分别通向b、c两个点,这两个点叫中间决策点,由于进入者进行是否进入的初始决策之后紧跟着就需要垄断者做出相应的决策,所以这两个中间决策点是属于垄断者的。从每一个中间决策点出各发引出两条向右展开的线段,分别代表了垄断者的两个行动策略:容忍和抵抗。代表垄断者的策略的线段的结尾是终点,代表者博弈的结束。终点不属于决策点,而是参与者相互博弈后的结果。在终点右侧括号内的数字代表两个博弈参与者的支付,前面的数字是进入者获得的利润,后面的数字则是垄断者获得的利润。
12A.3.2 博弈均衡
在图12A-3中存在着一个唯一的纳什均衡就是d点(进入-容忍)的策略组合点,此时双方的利润为(1,5)。在此均衡点博弈双方都没有改变策略的动力,因为如果垄断者改变策略变为(进入-抵抗)其利润会下降到2,而进入者改变策略变为(不进入-容忍)则利润会下降到0。
除了d点,其他3个终点都不是纳什均衡点,比如在e点垄断者将策略从抵抗变为忍让就可以从2增加到5,而进入者将策略改变为不进入就可以把利润从-2变为0;在f点进入者改变策略可以使利润从0变为1;g点垄断者改变利润就可以把利润从4变为10。所以这3个点都有参与者想改变策略的激励,都不是均衡点,只有d点是唯一的均衡点。
与完全信息静态博弈一样,这种序贯博弈也可以存在多个纳什均衡点的,比如我们前面介绍的性别大战博弈,见下面的博弈树:
        
(2,1)
   
      
正像我们在上一节讨论的那样,性别大战有两个纳什均衡,分别是(游戏,游戏)和(逛街,逛街)的策略组合,在这两个纳什均衡下两个人都没有动力改变当前的决策,因为改变只能使自己的效用下降。而在另外两个终点即(游戏,逛街)和(逛街,游戏)则双方都有改变策略的激励,通过改变两个人的效用都可以增加。
12A.3.3  子博弈精炼纳什均衡
在多重的纳什均衡的博弈中,有些纳什均衡是不可置信的威胁,这里的威胁是指一个参与者承诺如果其他参与者偏离均衡,他将采取某种行为,这种威胁是有一定的影响力的,虽然它可能从来没有被实施过。比如参与者甲对参与者乙讲如果你做出某种策略我将采取a策略,而这个a策略将使乙的收益下降,这就是威胁。但如果甲采取b策略将获得比a策略更大的收益,那么甲要采取a策略的威胁就是一个不可置信的威胁。子博弈精炼纳什均衡就是要解决这个问题。
子博弈精炼纳什均衡(subgame perfect Nash equilibrium)将纳什均衡中包含的不可置信的威胁策略剔除出去,它要求任何参与人在任何时间、地点的决策都是最优的,决策者应该随机应变,而不是固守前谋。由于剔除了不可置信的威胁,在许多情况下,精炼纳什均衡也就缩小了纳什均衡的个数,使问题变得更加简单直观。如果给定“历史”,每一个行动选择开始至博弈结束构成了一个博弈,称为子博弈。只有当参与者的策略在每一个子博弈中都构成纳什均衡叫做精炼纳什均衡。或者说,组成精炼纳什均衡的策略必须在每一个子博弈中都是最优的。
为了求子博弈精炼纳什均衡,我们需要使用逆向归纳法,所谓逆向归纳法(Backward Induction)是在求解子博弈精炼纳什均衡时,从动态博弈的最后一个阶段或最后一个子博弈开始,逐步向前倒推的方法。这一方法可以分为两个步骤,第一步先从博弈的最后阶段的每一个子博弈开始,确定参与者所选择的策略,把参与者所放弃的策略删除,通过精炼得到原博弈的一个简化博弈;第二步再对简化的博弈重复第一步的程序,最后得到一个原博弈的最简博弈。这个最简博弈就是原博弈的解。下面我们就用这一方法来分析一下前面提到的性别大战博弈。
性别大战中有两个纳什均衡,那么哪一个会成为博弈最终的结果呢?我们先来分析博弈最后的阶段,即女朋友的策略。当男朋友选择游戏的时候,女朋友肯定也会选择游戏而放弃选择逛街,因为前者可得到1个单位的效用后者效用是0。于是我们就可以把博弈树后面的4条线段中的第二条及其后的终点及支付组合删掉(用虚线表示)。当男朋友选择逛街时,女朋友肯定也会选择逛街而不是游戏,理由同上。这样我们又可以把最后4条线段中的第三条及终点与支付组合删掉,如下图:
        
(2,1)
   
      
这样我们就得到了一个简化的博弈模型,这里只有(游戏-游戏)和(逛街-逛街)两种策略组合,即实线部分。然后我们再对这个简化的博弈进行分析。需要注意的是这时虚线部分已经删掉了不用考虑了。
前面分析了女朋友的策略,现在我们再向前推看一下男朋友的策略。他现在面临着两个策略的选择,很明显他会选择游戏因为这时他的效用是2而选择逛街效用为1。这样我们就可以把表示逛街策略的这个线段删除,相应其后的线段及支付组合也相应删除。现在剩下的(游戏-游戏)的子博弈就是原博弈的子博弈精炼纳什均衡解。如下图:
[table=98%]
   
        
游戏         
   
      
从上面的例子当中我们看到一个有趣的现象,那就是虽然存在着两个纳什均衡,但最后是男朋友喜欢的游戏胜出,这实际上就是所谓的“先动优势”,先行动者的利益大于后行动者。如果我们把性别大战的博弈改成女朋友先行动,则逆向归纳的结果就是对女方更加有利的纳什均衡(逛街-逛街)胜出,而对男方有利的纳什均衡将被排除。见下面的博弈树:
[table=98%]
   
        
图 12A-7 性别大战:女方先动
   
      
在图12A-7中运用逆向归纳方法,先分析男朋友的策略选择,当女朋友选择游戏的时候男方会选择游戏,当女方选择逛街时男方也会选择逛街,所以先把最后4条线段中的第二、第三条删除,从而形成一个简化了的博弈模型。然后再看女方的策略选择,在游戏和逛街中她肯定选择逛街,这样再把上面一条代表游戏的线段及其后的内容删掉,最后我们就得到了对女方有利、对男方不利的(逛街-逛街)子博弈精炼纳什均衡解。
逆向归纳法也可以用来分析只有一个纳什均衡的博弈,如12A-3的进入者-垄断者博弈。我们先看最后阶段垄断者的决策,当前的竞争者准备进入的时候,原有的垄断者肯定选择容忍,因为容忍它的利润为5而抵抗的利润为2,这样我们可以删掉最后4条线段中的第2条;当竞争者选择不进入时,垄断者也会选择容忍,这样的它的利润为10而不是抵抗的4,这样我们又可以删除第4条线段。从而原来的博弈变成了一个简化了的博弈,见下图:
[table=98%]
   
        
抵抗
   
      
然后在图12A-8的基础上我们再往前推来看进入者的策略选择问题。它面对着两个策略:进入还是不进入。很明显它会选择进入,因为进入的利润为1而不进入的利润为0,我们又可以把代表不进入的线段及其后的内容删掉,这样(进入-容忍)就成了子博弈精炼纳什均衡的解。见下图:
[table=98%]
   
        
容忍
   
      


[/td][/tr]
[/table][/td][/tr]
[/table][/td][/tr]
[/table][/td][/tr]
[/table]






欢迎光临 经济学原理 (http://wdjjlt.org/yl/) Powered by Discuz! X3.4