是沉默还是背叛:囚徒困境

2019年8月29日11:24:52是沉默还是背叛:囚徒困境已关闭评论

基础知识

囚徒困境是博弈论的非零和博弈中具有代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。

举例说明

有一天,有一位富翁在家中被人杀了,财物被盗。

在这个案子的侦破过程中,警方抓到了两个犯罪嫌疑人鲁迪与西恩,并在他们的住处搜出了被害人家里所丢失的财物。然而,他们都矢口否认自己杀过人,辩称先发现富翁被杀,然后顺手牵羊偷了点东西而已。

因此,警方把两个人隔离,分别关在不同的房间里进行审问,由地方检察官分别与每个人单独谈话。检察官说:“因为你的偷盗罪已经有了确凿的证据,因此可以判你一年刑期。不过,我可以与你做一个交易。你如果单独坦白杀人的罪行,我只判你三个月的监禁,可是你的同伙要被判十年刑。你如果拒不坦白而被同伙检举的话,你将被判十年刑,他将只被判三个月的监禁。不过,你们两个人如果都坦白交代的话,你们都要被判五年刑。”

鲁迪与西恩此时应当怎么办呢?两个人都面临着两难的选择,坦白还是抵赖。很明显,最佳策略就是双方都抵赖,大家都只被判一年,但因为两个人是处于隔离的状况下,所以没有办法串通。

由利己的目的出发,他们选择坦白交代是最好的策略。因为这样可以得到最短时间的监禁,即三个月,但前提是同伙抵赖,这明显比自己抵赖后坐十年牢要好。这一策略是损人利己的策略。不只这样,坦白还有更多的好处。因为如果对方坦白而自己抵赖了,那么自己就要坐十年牢,这样太不划算了。所以,在这样的情况下,还是应当选择坦白交代,就算两个人同时都坦白,最多也只判五年,总比判十年要好吧。

因此,两个人最合理的选择就是坦白,本来对双方都有利的策略(抵赖)与结局(被判一年刑)就不会发生。如果两个人都是在坦白和抵赖策略上首先想到了自己,那么他们肯定会被判刑十年。惟有当他们都首先为对方着想或相互合谋时,才会得到三个月的监禁。

这种两个人都选择坦白的策略与因此被判五年的结局,被叫做“纳什均衡”,也称非合作均衡。因为任何一方在选择策略时都没“共谋”,他们仅仅是选择最有利于自己的策略,而未考虑社会福利或者任何其他有关对手的利益。

学习启示

从“囚徒困境”的普遍意义中,我们可以深刻领悟经济、社会、管理和日常生活中的类似于“囚徒的两难处境”这样的博弈现象。例如手机大战、电脑大战、冰箱价格大战等,这些做法的受益者是消费者,而结局却是一个“纳什均衡”,其结果是谁都没有赚到钱,因为博弈双方的利润刚好是零。也许这个结果对消费者而言是有利的,可是对厂商来说却是灾难性的。因此,有些人把厂商的价格战称为自杀行为。

在完全竞争的情况下,非合作行为达到了社会所期望的经济效率状态。厂商如果采取合作行动并决定转向垄断价格,则社会的经济效率就会遭到破坏。这就是为何WTO 与各国政府要加强反垄断的原因。

应该说,“纳什均衡”具有广泛而深刻的意义,它首先对亚当·斯密“看不见的手”这一原理提出了挑战。

根据亚当·斯密的理论,在市场经济中,人人都从利己目的出发,而最终使整个社会达到利他效果。但我们可以从“纳什均衡”原理中却引出亚当·斯密“看不见的手”原理的一个悖论:从利己的目的出发,结果会损人又不利己,既不利己也不利他。上述中那两个罪犯的命运就是这样。

  • 版权声明:本篇文章(包括图片)来自网络,由程序自动采集,著作权(版权)归原作者所有,如有侵权联系我们删除,联系方式(QQ:452038415)。