纳什均衡:金融生活中的非最优选择

2019年8月29日16:41:02纳什均衡:金融生活中的非最优选择已关闭评论

在生活中我们经常会发现这样的情况,为什么许多美女最后嫁给了让人跌碎眼镜的男士,如果我们用纳什均衡对这一现象进行剖析就有许多有趣的结论。纳什均衡的基础原理是,如果对方的策略是确定的,那么我的策略是最优的,而如果对方的策略是不肯定的,那么我的策略就很难是最优的。

约翰·纳什1948年作为年轻数学博士生进入普林斯顿大学。其研究成果见于题为《非合作博弈》(1950)的博士论文。该博士论文促使了《n人博弈中的均衡点》(1950)和题为《非合作博弈》(1951)两篇论文的发表。纳什在上述论文中,介绍了合作博弈与非合作博弈的区别。他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用概念,也就是不限于两人零和博弈。该概念后来被称为纳什均衡。

纳什均衡理论指的是:假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化。所有局中人策略构成一个策略组合。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人的最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡,从实质上说,是一种非合作博弈状态。纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。纳什均衡也不意味着博弈双方达到了一个整体的最优状态,以下的囚徒困境就是一个例子。

假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌疑人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。

对小偷来说,显然最好的策略是双方都抵赖,结果是大家都只被判1年。但是由于两人处于隔离的情况,首先应该是从心理学的角度来看,当事双方都会怀疑对方会出卖自己以求自保,其次才是亚当·斯密的理论,假设每个人都是“理性的经济人”,都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程:假如他坦白,我抵赖,得坐10年监狱,坦白最多才8年;他要是抵赖,我就可以被释放,而他会坐10年牢。综合以上几种情况考虑,不管他坦白与否,对我而言都是坦白了划算。两个人都会动这样的脑筋,最终,两个人都选择了坦白,结果都被判8年刑期。

因为两个人都为了自己的利益而选择了招供坦白,原本对双方都有利的策略不招供从而均被释放就不会出现。这样两人都选择坦白的策略以及因此被判8年的结局被称为“纳什均衡”。“纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战:按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。但是,我们可以从“纳什均衡”中引出“看不见的手”原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。

当然,“纳什均衡”虽然是由单个人的最优战略组成的,但并不意味着是一个总体最优的结果。如上所述,在个人理性与集体理性发生冲突的情况下,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。从这个意义上说,“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。同时,它也提示我们:合作是有利的“利己策略”。实际上,如果上述两个囚徒能够串供进行合作,那么他们一定会选择都抵赖从而只因私入民宅罪被判1年,当然,正是考虑到了这一点,所以警察才对他们隔离审查从而获知了事实真相,对囚徒而言最有利的合作的结果才没有出现。“纳什均衡”描述的就是一种非合作博弈均衡,在现实中非合作的情况要比合作情况普遍,所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作博弈理论的重大发展,甚至可以说是一场革命。

今天,“纳什均衡”被广泛应用于各个领域的研究,尤其在进行制度分析时,我们可应用它得出一个很重要的结论:一种制度(体制)安排要发生效力,必须是一种纳什均衡。

  • 版权声明:本篇文章(包括图片)来自网络,由程序自动采集,著作权(版权)归原作者所有,如有侵权联系我们删除,联系方式(QQ:452038415)。