去读读

免费在线阅读网

去读读 > 科普学习 > 博弈论:决策制胜的法则

合作博弈、伙伴关系和收益分配

    《博弈论:决策制胜的法则》章节:合作博弈、伙伴关系和收益分配,去读读网友提供全文无弹窗免费在线阅读。!



接下来,我们要分析一系列有关n人博弈的具体情境,每种情境的难度逐渐增大。我们假设参与者在博弈之前能够相互沟通并达成协议。跟之前一样,我们要研究的是,哪些联盟方式是可行的,能确保其收益分配让所有的联盟成员都满意,并决定继续下去。

案例1

三位商人安娜(A)、碧翠斯(B)和塞德里克(C)在达成交易后,需要分配20万英镑的收益。他们决定遵照简单多数的原则。每人有一票投票权,至于分配如何实施没有其他限制。要实现简单多数决,有四种可能的联盟方式:ABC、AB、AC和BC。然而,每一种方式都包括多种不同的收益分配方案。安娜提议的分配方案是:A=68000英镑,B=66000英镑,C=66000英镑。碧翠斯提议了另一种对她和塞德里克有利的方案:A=60000英镑,B=70000英镑,C=70000英镑。而塞德里克又提出了第三种方案:A=70000英镑,B=0英镑,C=130000英镑,增加了他自己和安娜的收益。我们之前说过,这类提议还有很多很多,似乎任何联盟方式都无法让三人满足。该博弈没有均衡点,每一项提议都可以被另外一个人加以修改,从而形成新的伙伴关系,并增加合作各方的收益。

在具有伙伴关系的合作博弈中,“解决方案”就是一种稳定的伙伴关系和收益分配方式。也就是说,它能确保联盟成员之间达成令各方均能满意的协议。

案例2

现在我们假设,刚才的分配问题需要跟每个人的投资相匹配。比方说,安娜现在有五票,碧翠斯有三票,塞德里克有一票。那么要决出多数票,可能的联盟方式有:ABC、AB、AC和A。由于安娜的选票占多数,她就可以提出一种让自己获得全部收益的方案:A=200000英镑,B=0英镑,C=0英镑。尽管这种分配并不公平,但却十分稳定。安娜一定会赞成,没有她就不可能形成伙伴关系;这样一来,该方案就满足了我们之前提出的定义。在这类博弈中,如果博弈各方以理性的方式行事,并且独立于其他人的决定,那么其对弈值就是各方一定能够获得的收益。在案例1中,我们无法确保任意一方所能获得的收益,那么该博弈的对弈值就是:A=0,B=0,C=0。而案例2的对弈值则为:A=100,B=0,C=0。

案例3

现在我们将问题进一步复杂化,从而使其更接近现实情况。选举时,五个政党拥有81个席位,分配情况如下:A=33,B=24,C=15,D=6,E=3。鉴于各政党都没有绝对多数的优势(41票),他们就需要结成伙伴关系或者联盟来组成政府。联盟方式将决定预算的分配和责任的分担。我们不考虑思想上的倾向性,并且假定政府职务的重要性取决于他们所承担的预算数额。最后,选举严格按原则进行。

在所有可能的政治伙伴关系中(五党联合的有1种,四党联合的有5种,三党联合的有10种,两党联合的有10种,一党独行的有5种),可行的有16种。由于各个政党没有多数优势,那任一党派的对弈值就是0,因为在建立具有执政能力的联盟过程中,任何政党都不是必不可少的。

数学家、经济学家劳埃德·沙普利就上述情境提出了一个分配体系,即在某些伙伴关系当中,某一方的参与是具有决定性意义的(如果该方退出,该伙伴关系将不再具有决胜优势),而博弈各方的对弈值就与会此类可能获胜的伙伴关系的数量成正比。博弈各方由此获得的收益值就叫作沙普利值。如果一方对于其所在联盟的决胜优势来说可有可无,那么该方就不具有决定性意义。

在我们的案例中,各政党共同结盟,任何一方都没有决定性意义,而在BCDE联盟中,B和C是有决定意义的,因为要是其中任一一方退出,那剩余各方的联盟就不再拥有多数席位了(如果B退出,该联盟就只剩24个席位;如果C退出,则只剩33个席位)。而另一方面,D和E是没有决定性意义的,因为即使其中一方退出,剩余各方的联盟依然拥有多数席位(如果D退出,该联盟还有42个席位;如果E退出,还有45个席位)。我们可以依据这些条件来计算出各个政党起决定性作用的联盟数量,并将结果形成如下表格:

劳埃德·斯托韦尔·沙普利(1923-2016)

沙普利,美国杰出的数学家和经济学家,对博弈论做出了大量贡献,具有奠基性的意义。他曾在哈佛大学学习数学,并在“二战”期间担任空军中士,前往中国支援,之后返回校园,并于1948年毕业。他在兰德公司工作过一年,并于1953年从普林斯顿大学获得博士学位,当时多名最杰出的博弈论专家都在那里任教。之后,他再次回到兰德公司工作,直到1981年,他到美国加州大学洛杉矶分校担任教学工作。

他早在博士论文中,就已经开始介绍一些像沙普利值这样的理念,并且在长期的工作生涯中,继续发表自己最初的研究成果。1979年,他加入了美国国家科学院,一生多次获奖,其中包括1981年荣获的约翰·冯·诺依曼理论奖。

在这些情况下,我们可以按照沙普利提出的方法来分配收益。如果所有政党同时结盟,且预算为26亿英镑,那么按沙普利值所做出的分配方案(单位:百万英镑)为:

A=1000

B=600

C=600

D=200

E=200

在任何一种其他的联盟方式中,每一个参与政党所得预算的计算方法是一样的,但是数额一定会高于这种联盟方式的所得。这种分配提议所给出的解决方案是稳定的,但不是唯一的,还有多种其他的可能。然而,不管怎样,在任何一种联盟形式中,只要以这种方式来分配预算,那么其他任何可能的稳定方案都无法向各个政党分配更高的预算。

不管是冯·诺依曼还是沙普利,按照他们提出的方法,一方面,解决方案不是只有一个估值,而是由一系列估值共同构成,另一方面,我们可以设置一些条件,从而有可能确定某些估值是否可以被囊括于该解决方案当中。

总览最后两章,你会发现,我们分析的情况越来越复杂,越来越接近现实情境,而我们在尝试解决这些问题时所运用的数学方法却越来越不可靠了。这并不是说这些方法不再有效,只是在现实情境中,冲突与合作相结合,每种情况都有某些具体的特点。这说明,我们在用数学方法去尝试解决这些问题时,必须要考虑到,这些方法是否有效,还要看这些问题的具体特点。