《囚徒的困境》博弈论

《囚徒的困境》 冯诺依曼、博弈论和原子弹之谜

 

最近看完了《囚徒的困境》这本书,发现挺有趣的,在此记些自己的理解,很可能是片面的或者错误的,请大家斧正。

首先是对博弈论的一个定性,它是关于在有理性,但彼此互不信任的人之间的冲突的科学。博弈论只研究对赢感兴趣的,有完善逻辑思维能力的游戏参与者的博弈。这里冯诺依曼提出了,下棋不是博弈,下棋有“正确”的方法,下棋是平凡的。他提出用博弈树来表示博弈的方法,然后通过剪枝,最后得出理论上有限的走法以及必然的结果。

零和博弈:极小极大原理。这是冯诺依曼提出的,奠定博弈论基础的定理,同时他也指出,在二人零和博弈中,如果存在鞍点(极小极大值和极大极小值重合的点),则鞍点为最优解。如果不存在鞍点,则混合策略是最优解。鞍点的重要性在于,任何一个局中人都不能由单方面背离它而做出改进,这也是平衡的重要体现,为以后的纳什平衡做了很好的铺垫。最后冯诺依曼还提出多人零和博弈可以通过枚举结盟来组转化成二人零和博弈,从而找出最优解。

非零和博弈:纳什平衡。这个理论是由约翰纳什(《美丽心灵》电影主人翁)提出的,并且很大程度的开拓了博弈论的新篇章。纳什指出,在非零和博弈中,至少存在一个平衡点,从而引出后面各种博弈模型的讨论。

囚徒的困境:存在一个平衡点(相互背叛),相互合作总得回报最高,但引诱回报个人得到的比合作高,总和比合作低,傻瓜回报最低(DC > CC > DD > CD)。 囚徒的困境博弈是博弈论中最集中讨论的一种,也是现实社会中随处可见的数学模型。它的平衡点在项目背叛,但有一个是双方都更好的相互合作回报,从而引出无数的争论,一直延续至今,但其实平衡点是理论上的最优解,所谓的合作回报,只是美好的愿望而已(在博弈论理论中,不是说生活不存在合作)。

胆小鬼博弈:存在两个平衡点,相互合作回报最高,相互背叛回报最低,傻瓜回报比相互背叛好。(DC > CC > CD > DD)。胆小鬼博弈也是一个二难推理。在生活当中更具讽刺信息,并且往往“疯子”能获得更高回报。

围捕牧鹿博弈: 平衡点在相互合作,引诱回报比相互合作少,傻瓜回报最低。(CC > DC > DD > CD)。这本不应该是一个问题,最优解明显在平衡点,然而反应到显示生活中还是令人有许多无奈,而且事实证明还是很多人选择背叛,因为很多人的想法是“双鸟在林不如一鸟在手”。

僵局:平衡点在相互背叛,引诱回报最高,傻瓜回报最低(DC > DD > CC > CD)。这种模型从博弈论上讲没什么好讨论的,但在现实中确是最悲剧的。

生物学与社会学领域的应用:博弈论,纳什平衡在生物学和社会学领域也得到很大的应用,说明了很多生物之间的合作和竞争关系,以及生物进化的规律。在这里再一次体现了囚徒的困境解在于平衡点而不是相互合作,因为相互合作虽然看上去很美,但是不稳定的,任何一种变异的出现都能导致回报的破坏。

反复多次的囚徒困境博弈:在相同对手,反复进行的多次囚徒的困境博弈中,“一报还一报”策略在实际检验中被认为是最好的,而且还是通过类似人工智能比赛这样的形式验证出来的。对于“一报还一报”策略的改进在于解决震荡问题。

最大数博弈:如果无上限的最大数博弈,最优解是不要参加。对于有共同上限的最大数博弈,先手可以通过出价上限对价值的余数来抢占主动权,对于不同上限的最大数博弈,上限高者必胜。而是否吸引对手加入,就要值得思考了,因为最终很可能是两败俱伤。

貌似博弈模型都被分析得很清晰了,但其实离真实应用于生活还是差挺远的,主要难点在于无法完全抽象出所有收益或回报关系,而且生活中人往往就是不理性的,还有我们很多时没意识到我们正在博弈或正在困境中。我个人认为,当作科普书籍看看是挺有意思的,但不要寄望看完能解决什么大难题,博弈论也没有听起来那么犀利。在查资料的过程中发现之前听过,貌似很先进的一门课程——运筹学,也是基于博弈论基础上开设的,如果想深入了解可以看看相关的书。

其实在看完全书,最大的感慨在于,最好解决这些难题的方法就是避免这些难题,这也是法律,国家的作用,然而这个天朝实在令人无力吐槽啊,哎。

 

Bookmark the permalink.

发表评论

邮箱地址不会被公开。