去读读

免费在线阅读网

去读读 > 科普学习 > 博弈论:决策制胜的法则

懦夫博弈

    《博弈论:决策制胜的法则》章节:懦夫博弈,去读读网友提供全文无弹窗免费在线阅读。!



除了囚徒困境以外,懦夫博弈也是博弈论中最具代表性的非零和博弈例题之一。这个名字暗指参与该博弈的都是胆小者,游戏中通常有两人,他们面对一种危险的处境,看谁比对方提前让步。

下面我们来看一个博弈模型:两名司机相向高速行驶,双方要在最后时刻决定是否右转,以避免相撞。这样就会出现下面的情况:

罗伯特·阿克塞尔罗德和囚徒困境

罗伯特·阿克塞尔罗德(Rober  Axelrod),密歇根大学公共政策教授、数学家、政治学博士,专门研究合作问题,尤其是像囚徒困境这样的博弈。其代表作为《合作的进化》(The  Evolution  of  Cooperation),本书主要针对合作的“进化”过程展开研究,主要论点是人们采取的策略会逐渐向着更加有效的方向进化;在这个过程中,合作必不可少。

关于囚徒困境,阿克塞尔罗德认为,如果该博弈只进行一次,我们不可能察觉到对方的行为,也就无法回报其合作,或者惩罚其背叛,也就是说一次博弈只提供短期目标。而另一方面,如果博弈重复进行,我们就有可能根据双方之前的互动,从互惠的角度出发,来决定我们的策略。如果对方多次采取合作策略,那或许就是一个值得长期合作的对象。可如果恰恰相反,那就根本不用考虑了。

由于最优策略尚未知晓,阿克塞尔罗德设计了一场竞赛,并邀请了多位著名的博弈论专家参与,试图通过观察他们的行为,找到有效的博弈策略。最终,在所有尝试过的策略当中,所谓的“以眼还眼”策略是最好的,也是最直接的。该策略的基本原则是,以合作开始(绝不能最先背叛),然后再根据对手的上一步行动来决定自己的行为。如果对手合作,那就值得继续合作;如果对手背叛,那就马上与之翻脸。

1.双方都不转向,继而相撞。这是最糟糕的结果,双方的收益值都是0。

2.双方都在最后时刻转向,继而不会相撞。这是比较好的结果,双方表现相同,不过两人都有些“丢脸”,谁也算不上赢家。双方的收益值都是3。

3.一方转向,另一方不转向。转向的一方非常“丢脸”,收益值只有1,而另一方则在博弈中胜出,收益值为5。

不同的策略所对应的回报见下表:

我们可以通过分析得出,如果双方都想获得最大收益,即拒绝转向,以获得收益值5,那么只能以最坏的结果收场。看起来他们最好选择转向,因为只有这样做,他们才能获得理想的结果,但是他们谁也不想先于对方转向,因为这就意味着,他们获得的收益值只有1,而对方的收益值却是5。

我们可以从合作的角度来分析这场博弈,转向即为合作,不转向即为叛离。这样一来,如果双方都选择合作,总体结果就是好的。然而,最重要的一点或许在于,这场博弈代表了某种形式的协商,要想避免灾难,就要做出让步,但参与双方都试图拖延让步,直至最后一刻,其目的就是迫使对方“公平”竞争(在这里就是转向)。

懦夫博弈还有另外一个特点,那就是在博弈开始前,如实宣布将要采取的策略,会对博弈产生一定的影响。比如锁住其中一辆车的方向盘,让其无法转向,这样另一方就只能选择替代策略;也就是说,这种做法能确保另一方转向,不然两车必然相撞。

懦夫博弈

尽管在现实生活中,像懦夫博弈这样极端的情况非常少见,但是也有一些博弈双方都希望掌控大局的冲突情形(比如职场关系和权力冲突等)。当这些情形发展到一定程度的时候,就会类似于懦夫博弈了。

这些冲突在虚构作品中更加常见,例如在尼古拉斯·雷执导的电影《无因的反叛》(Rebel  Without  a  Cause,1955)中,两人驱车驶向悬崖,谁先跳车谁就是懦夫博弈的输家。

囚徒困境和懦夫博弈都是局部冲突博弈,从中可以看出,在某些情况下,一方急于追求眼前利益,就会导致灾难性的结果。因此,从这个角度来看,两种博弈十分相似。但是,二者也有不同之处。在囚徒困境中,双方采取相同策略,结果是最好的;而在懦夫博弈中,情况恰恰相反,双方采取相反策略,结果往往更好。这样的话,参与者最好迅速做出相反的反应。

我们从懦夫博弈和囚徒困境中可以看出,在这类情境中,冲突和合作都是有可能的,我们很难找到解决方案。更要命的是,这类博弈中出现的冲突往往就在我们的切身利益和集体利益之间。