蜈蚣博弈悖论

2019年8月31日14:28:12蜈蚣博弈悖论已关闭评论

有一个人原本打算向邻居借斧子,但又担心邻居不肯借给他,于是他在前往邻居家的路上不断胡思乱想:“如果他说自己正在用怎么办?”“要是他说找不到怎么办?”想到这些,这人自然对邻居产生了不满:“邻里之间本应该和睦相处,他为什么不肯借给我?”“可是假如他向我借东西,我一定会很高兴地借给他。”“如果他不肯借斧头给我,我对他也不应该太客气。”……

这人一路上越想越生气,于是等到敲开邻居的门后,他原本应该说:“请把你的斧子借给我用一下吧!”但是他却鬼使神差地张嘴冲着邻居喊道:“留着你的破斧子吧,我才不稀罕用你的东西呢!”

从上面这个笑话中,可以想象一些喜欢以己度人者在生活中遇到的尴尬。但是笑过之后,我们却发现,这个借斧头的人所运用的思维方法,居然有着倒推法的影子。

难道倒推法真的有什么问题吗?答案是肯定的,这种悖论在博弈论中被称为“蜈蚣博弈悖论”。很多学者已经用科学的方法推导出倒推法是分析完全且完美信息下的动态博弈的有用工具,也符合人们的直觉,但是在某种情况下却存在着无法解释的缺陷。

如下面这样一个博弈。两个博弈方A、B轮流进行策略选择,可供选择的策略有“合作”和“不合作”两种。规则是:A、B两次决策为一组,第一次若A决策结束,A、B都得n;第二次若B决策结束,A得n-1而B得n+2;

下一轮则从A、B都得n+1开始。假定A先选,然后是B,接着是A,如此交替进行,A、B之间的博弈次数为一有限次,比如198次。

现在的问题是:A、B是如何进行策略选择的呢?

为了使问题更加直观,在这里我们再用一对情侣之间的爱情博弈来加以阐明。

爱情就其本质来说是一种交往,人交往的目的在于个人效用最大化。不管这个效用是金钱,还是愉快的感觉、幸福的感觉,只要追求个人效用,就必定存在利益博弈。因而,我们的爱情交往是一个典型的双人动态博弈过程,不过爱情的效用随着交往程度的加深和时间推移有上升趋势。

假定女B和男A是这个蜈蚣博弈的主角,这个博弈中他们每人都有两个战略选择,一是继续,一是分手。这里,假设爱情每继续一次总效用增加1。

那么,首先,在交往初期女B如果甩了男A,则两人各得1的收益;女B如果选择继续,则轮到男A选择。男A如果选择分手,则女B收益为0,男A收益为3,这样完成一个阶段的博弈。可以看到每一轮交往之后,双方了解程度加深,两人爱情总效用在不断增长。这样一直博弈下去,直到最后两人都得到10的圆满收益,为大团圆的结局——总体效益最大。

遗憾的是这个圆满结局很难达到!因为蜈蚣博弈的特别之处是:当男A决策时,他考虑博弈的最后一步即第100步;女B在“合作”和“背叛”之间作出选择时,因“合作”给女B带来100的收益,而“不合作”带来101的收益,根据理性人的假定,女B会选择“背叛”。但是,要经过第99步才到第100步。在第99步,男A的收益是98。男A考虑到女B在第100步时会选择“背叛”,那么在第99步时,男A的最优策略是“背叛”——因为“背叛”的收益99大于“合作”的收益98……按这样的逻辑推论下去,最后的结论是令人悲伤的:在第一步男A将选择“不合作”,此时各自的收益为1!

从逻辑推理来看,倒推法是严密的,但结论是违反直觉的。直觉告诉我们,一开始就采取不合作的策略获取的收益只能为1,而采取合作性策略有可能获取的收益为100,当然,男A一开始采取合作性策略的收益有可能为0,但1或者0与100相比实在是太小了。直觉告诉我们采取合作策略是好的。而从逻辑的角度看,一开始男A应采取不合作的策略。我们不禁要问:是倒推法错了,还是直觉错了?这就是蜈蚣博弈的悖论。

  • 版权声明:本篇文章(包括图片)来自网络,由程序自动采集,著作权(版权)归原作者所有,如有侵权联系我们删除,联系方式(QQ:452038415)。