尽管从理论上说,有限次重复博弈的结果与单次博弈相同,但在实际生活中,有限次重复博弈的结果往往并非如此。这是因为,博弈参与者并非都是理性人,在很多情况下,他们可能是非理性的。比如人质博弈的例子。
假设有一群穷凶极恶的绑匪在飞机上绑架了几十名人质,并向政府索取赎金或提出政治要求等。如图1-1所示,当绑匪不绑架人质时,绑匪与政府收益均是0。当绑匪绑架人质时,政府若与绑匪谈判交换条件,绑匪收益提高为5,而政府损失为10,即收益为−10。当绑匪绑架人质时,政府根本不给予绑匪以任何勒索的可能,则绑匪与人质同归于尽;绑匪的损失为10,政府的损失为20。
图1-1 人质博弈
在图1-2中,当该博弈为一次性博弈时,由于政府攻击时的收益为−20,谈判时的收益为−10,而−20<−10。所以,绑匪绑架人质时,政府的最优反应为谈判。此时绑匪的收益为5,要高于不绑架的收益。因此,在单次人质博弈中,[绑架,谈判]为均衡解。此时,绑匪收益为5,政府损失为10。
图1-2有限次重复人质博弈
不妨假设这群绑匪是惯犯,每隔一段时间就要绑架人质要挟政府,这就是一个重复的人质博弈。如果人质博弈有限次重复,每一轮博弈的结果都与单次性博弈相同,每一次政府声称只要绑架人质就会武力攻击决不谈判妥协的威胁是不可信的,如图9-15所示。绑匪很明白这个重复博弈的结果,于是,他们不会因为政府的强硬态度而不再绑架人质。因此,对于政府来说,无论在哪一次人质绑架事件采取如何强硬的态度,都无法达到杀一儆百的效果,以杜绝绑架人质事件的发生。
只有在人质博弈成为无限次重复博弈的情况下,政府强硬的态度才有可能具有可信性。作为理性人的绑匪必然不再绑架人质。问题在于,如果绑匪金盆洗手不再干绑架人质的勾当,人质博弈总会存在最后一次,这样又变成有限次重复博弈。若绑匪绑架人质是有限次的,则绑匪绑架人质总是会发生的,那又变成无限次博弈。因此,绑架人质博弈应该是存在着一个不为0的博弈结束概率θ值与贴现因子δ值的无限次重复博弈。在现实中,尽管各国政府想尽办法努力预防,人质事件却总是不断发生。由此可见,尽管这是一个无限次重复博弈,其结果却更接近于有限次重复博弈。