股市是典型的多人非合作博弈,每个人都根据他人的策略制订自己的最优策略,这个策略对于投资者个体而言当然是最优策略,但是放到了股民群体之中就未必是最优策略。多个策略博弈之后,可能达成一种暂时的群体共识,这个群体共识就是股市的纳什均衡。
经济学家赵建用纳什均衡解释了股市泡沫的产生及其发展过程:
股市泡沫起源于股市参与者的赚钱效应,当多数股民都赚钱时,做多成为群体共识和最优策略。而当股价上涨超过临界点,出现了股市泡沫。
当股市泡沫产生时,其实所有的人都意识到股价已经涨多了。但是,所有人已经陷入一种“囚徒困境”——每个人都知道泡沫的不利后果,但每个人都选择去参与这个市场享受泡沫。这跟两个囚徒都知道双方最好的策略应该是联合起来都不坦白,但最终的结果却是双方都乖乖地坦白。
在静态完全信息博弈的条件下,股市泡沫的形成过程就是一个不断强化的囚徒困境正反馈过程:交易者知道选择泡沫也是其他交易者的占优策略,那么他的占优策略肯定也是泡沫,于是泡沫成为本次博弈的最终纳什均衡解。
进一步的在动态博弈的条件下,如果泡沫真的自我实现,丰厚的收益会让交易双方继续选择泡沫为占优策略,于是泡沫继续成为最终的纳什均衡解,而拒绝泡沫并不是纳什均衡,因为选择“拒绝泡沫”的交易者的收益会相对受损(踏空),因此不构成占优策略。
对社会长期发展有利的策略(拒绝泡沫)也不是纳什均衡,因为在考虑对手占优策略的情形下,博弈双方都不会选择这组策略,如同囚犯不会选择(不坦白)这组策略。
如果这种博弈在整个市场弥漫,那就形成所谓的“羊群效应”,或者席勒所说的“非理性繁荣”。但问题的根本是,当市场里每个人都选择了疯狂,如果你不去享受这种疯狂,你将付出较大的机会成本,这对一个追求利益最大化的“理性人”来说显然是难以忍受的。
但是,股票市场毕竟不是简单的静态完全信息博弈,而是复杂的动态非完全信息博弈,散户与机构之间、机构与机构之间、投资者与投机者之间、投资者与监管部门之间,众多博弈对手都存在动态博弈,形成了混和策略和多重均衡的合流。
这种非线性、不确定性和复杂性面前,不会形成惟一、稳定和具有收敛性质的纳什均衡,最终形成的纳什均衡不仅取决于自己所拥有的信息,还取决于对他人信念的猜测,也就是“知道别人知道什么”,以及别人对自己想法的猜测,也就是“知道别人知道自己什么”。
在这种情境下,纳什均衡形成的股市泡沫实际上具有内在不稳定性,一旦泡沫的预期无法持续自我实现,且交易者认为对手的交易策略也发生反转,那么做空可能成为整个市场的共同认识,最终强化为新的纳什均衡。这个时候即使盲目抛售并不是社会福利的最优解,个体的理性自利追求也会选择这个新的囚徒困境。
这一演变过程是:从单一泡沫均衡(持续上涨),转变为多重均衡(震荡横盘),最终演变为单一的泡沫破灭均衡,此时,“看谁跑得快”成为理性投资者的占优策略。