混合策略纳什均衡求解

2019年11月11日22:39:59混合策略纳什均衡求解已关闭评论

某村庄只有一名巡警,他要负责整个村的治安。小村的两头住着两个全村最富有的村民A和B,A、B分别需要保护的财产为2万元、1万元。一天来了个小偷,要在村中偷盗A和B的财产,这个消息被巡警得知。这个博弈的标准型如图1-1所示,该博弈不存在纯策略均衡。

混合策略纳什均衡求解

图1-1 警察与小偷博弈

在博弈论中,可以选择出具体行动的纳什均衡,这叫做纯策略纳什均衡博弈。凡是用到概率(并且概率不能为0和1,否则就退化为纯策略,可以想见,纯策略的纳什均衡只是博弈的一种特例)的纳什均衡为混合策略博弈。所谓纯策略,更严格地说是指参与者在他的策略空间(策略集)中选取唯一确定的策略,但至少存在一个混合策略均衡点。所谓混合策略是指参与者采取的不是唯一的策略,而是其策略空间上的概率分布。这就是纳什于1950年证明了的纳什定理。而这个博弈没有纯策略纳什均衡点,而有混合策略均衡点。这个混合策略均衡点下的策略选择是每个参与者的混合策略选择。由此可见,纯策略是参与者一次性选取的,并且坚持他选取的策略。而混合策略是参与者在各种备选策略中采取随机方式选取的。根据这个定义,最终博弈者做出的选择必然只能是一个纯策略,混合策略的分析仅仅是我们对博弈者的一种理论分析。

混合策略均衡无法通过划线法或箭头法解决。我们不妨假设巡警选择保护A的概率为q,保护B的概率为1-q;小偷偷窃A的概率为p,偷窃B的概率为1-p,如图1-2所示。

混合策略纳什均衡求解

图1-2 警察与小偷博弈标准型

当巡警选择保护A和B的期望值相等,同时小偷偷窃A和B的期望值相等时,达到混合策略均衡。7p−5=1−2p,p=6/9=2/3,1−p=1/3,同理可以求得q=2/3,1−q=1/3。此时,巡警与小偷的期望收益均为−1/3。

巡警保护A的期望值为p×2−5(1−p)=7p−5;巡警保护B的期望值为−p+(1−p)=1−2p。

当小偷p<2/3,1−p>1/3,比如p=1/2时,

巡警保护A的期望值为p×2−5(1−p)=7p−5=−1.5

巡警保护B的期望值为−p+(1−p)=1−2p=0

在这种情况下,巡警保护A的概率只要超过2/3,巡警的收益就比较大。当巡警保护A的概率为1,也就是只保护A时,巡警的期望收益最大为0,超过均衡时的期望收益−1/3。

当巡警q<2/3,1−q>1/3,比如q=1/2时,

小偷偷窃A的期望值为−q+(1−p)=1−2q=0

小偷偷窃B的期望值为2q−5(1−q)=7q−5=−1.5

在这种情况下,小偷偷窃A的概率只要超过2/3,小偷的损失就比较小。

当小偷偷窃A的概率为1,也就是只偷窃A时,小偷期望收益为0,超过均衡时的期望收益−1/3。

当巡警q<2/3,1−q>1/3,比如q=1/2时,此时巡警必然了解到自己的收益变小,因此会调整自己的概率q数值,一直到2/3。

当小偷p<2/3,1−p>1/3,比如p=1/2时,小偷必然了解到自己的收益变小,因此会调整自己的概率q数值,一直到2/3。

由此可见,当巡警选择保护A和B的期望值相等也就是巡警有2/3的概率去保护A,同时小偷偷窃A和B的期望值相等,即2/3的概率去偷窃A时达到混合策略均衡时,博弈中的任何一方改变选择行动的概率后,都会使得收益减小或损失增加。这也正符合纳什均衡的定义,因此混合策略均衡也是一种纳什均衡。

讲到这里,我们又碰到了一个问题。如果你是小偷,也只有一次偷窃机会,到底应该偷窃A还是B呢?或者你是巡警,也只有做出一次选择决策,那么究竟应该保护A还是B?在这个例子,显然选择的是A。

如果我们将这个例子稍做修改,将A和B的财富设置为相等,可以求得p=q=1/2。这样,我们就会陷入一个逻辑陷阱。警察与小偷都将像“布里丹的驴”这个寓言故事中的毛驴一样无从选择。这个故事是讲,有一头十分聪明的毛驴像理性人一样完全依据逻辑分析来做出决策。现在在它的面前放有两堆完全相同的草料,这头毛驴应该选择先吃那一堆草料呢?从纯粹理性的角度看,由于两队草料完全相同,毛驴选择任意一堆草料的概率为1/2。如果必须要做出一个选择的话,这头驴将会活活饿死在犹豫不决之中。这是因为它没有任何理由选择出进食的顺序。

对于这个问题,物理学家尼尔斯·玻尔给出了一个不算十分完美的答案。既然两堆草料完全相同,毛驴凭什么选择先吃其中一堆草而后吃另一堆草。尼尔斯·玻尔假设毛驴具有自主性,可以完全不依照机械的逻辑分析来选择先吃其中一堆草,而这种选择完全是任意的或真正随机的。不需要任何因果决定关系,这样驴子才可能避免被活活饿死。比如说毛驴可以通过抛掷硬币来随机地决定先吃哪一堆草料。如果按照这种方式,巡警与小偷的选择也由“上帝所掷的骰子”所决定,换而言之就是博弈者可以在无差异的纯战略中随机选择其中之一。

  • 版权声明:本篇文章(包括图片)来自网络,由程序自动采集,著作权(版权)归原作者所有,如有侵权联系我们删除,联系方式(QQ:452038415)。