懦夫博弈

    《博弈论：决策制胜的法则》章节:懦夫博弈,去读读网友提供全文无弹窗免费在线阅读。!

除了囚徒困境以外，懦夫博弈也是博弈论中最具代表性的非零和博弈例题之一。这个名字暗指参与该博弈的都是胆小者，游戏中通常有两人，他们面对一种危险的处境，看谁比对方提前让步。

下面我们来看一个博弈模型：两名司机相向高速行驶，双方要在最后时刻决定是否右转，以避免相撞。这样就会出现下面的情况：

罗伯特·阿克塞尔罗德和囚徒困境

罗伯特·阿克塞尔罗德（Rober  Axelrod），密歇根大学公共政策教授、数学家、政治学博士，专门研究合作问题，尤其是像囚徒困境这样的博弈。其代表作为《合作的进化》（The  Evolution  of  Cooperation），本书主要针对合作的“进化”过程展开研究，主要论点是人们采取的策略会逐渐向着更加有效的方向进化；在这个过程中，合作必不可少。

关于囚徒困境，阿克塞尔罗德认为，如果该博弈只进行一次，我们不可能察觉到对方的行为，也就无法回报其合作，或者惩罚其背叛，也就是说一次博弈只提供短期目标。而另一方面，如果博弈重复进行，我们就有可能根据双方之前的互动，从互惠的角度出发，来决定我们的策略。如果对方多次采取合作策略，那或许就是一个值得长期合作的对象。可如果恰恰相反，那就根本不用考虑了。

由于最优策略尚未知晓，阿克塞尔罗德设计了一场竞赛，并邀请了多位著名的博弈论专家参与，试图通过观察他们的行为，找到有效的博弈策略。最终，在所有尝试过的策略当中，所谓的“以眼还眼”策略是最好的，也是最直接的。该策略的基本原则是，以合作开始（绝不能最先背叛），然后再根据对手的上一步行动来决定自己的行为。如果对手合作，那就值得继续合作；如果对手背叛，那就马上与之翻脸。

1.双方都不转向，继而相撞。这是最糟糕的结果，双方的收益值都是0。

2.双方都在最后时刻转向，继而不会相撞。这是比较好的结果，双方表现相同，不过两人都有些“丢脸”，谁也算不上赢家。双方的收益值都是3。

3.一方转向，另一方不转向。转向的一方非常“丢脸”，收益值只有1，而另一方则在博弈中胜出，收益值为5。

不同的策略所对应的回报见下表：

我们可以通过分析得出，如果双方都想获得最大收益，即拒绝转向，以获得收益值5，那么只能以最坏的结果收场。看起来他们最好选择转向，因为只有这样做，他们才能获得理想的结果，但是他们谁也不想先于对方转向，因为这就意味着，他们获得的收益值只有1，而对方的收益值却是5。

我们可以从合作的角度来分析这场博弈，转向即为合作，不转向即为叛离。这样一来，如果双方都选择合作，总体结果就是好的。然而，最重要的一点或许在于，这场博弈代表了某种形式的协商，要想避免灾难，就要做出让步，但参与双方都试图拖延让步，直至最后一刻，其目的就是迫使对方“公平”竞争（在这里就是转向）。

懦夫博弈还有另外一个特点，那就是在博弈开始前，如实宣布将要采取的策略，会对博弈产生一定的影响。比如锁住其中一辆车的方向盘，让其无法转向，这样另一方就只能选择替代策略；也就是说，这种做法能确保另一方转向，不然两车必然相撞。

懦夫博弈

尽管在现实生活中，像懦夫博弈这样极端的情况非常少见，但是也有一些博弈双方都希望掌控大局的冲突情形（比如职场关系和权力冲突等）。当这些情形发展到一定程度的时候，就会类似于懦夫博弈了。

这些冲突在虚构作品中更加常见，例如在尼古拉斯·雷执导的电影《无因的反叛》（Rebel  Without  a  Cause，1955）中，两人驱车驶向悬崖，谁先跳车谁就是懦夫博弈的输家。

囚徒困境和懦夫博弈都是局部冲突博弈，从中可以看出，在某些情况下，一方急于追求眼前利益，就会导致灾难性的结果。因此，从这个角度来看，两种博弈十分相似。但是，二者也有不同之处。在囚徒困境中，双方采取相同策略，结果是最好的；而在懦夫博弈中，情况恰恰相反，双方采取相反策略，结果往往更好。这样的话，参与者最好迅速做出相反的反应。

我们从懦夫博弈和囚徒困境中可以看出，在这类情境中，冲突和合作都是有可能的，我们很难找到解决方案。更要命的是，这类博弈中出现的冲突往往就在我们的切身利益和集体利益之间。