1、术语解释
纳什均衡Nash Equilibrium,是指非合作博弈中,所有的博弈当事人都维持自己的支配性策略的均衡状态。值得说明的是,支配性策略是参与方各自的最优策略,但不一定是总体的最佳策略。
相关概念解释:
合作博弈cooperative game:博弈双方达成一致意见,双方基于互相信任的前提下,按照事先约定的策略来做决策。
非合作博弈non-cooperative game:只考虑自己的利益,而不和别人串谋的情况下进行博弈。
支配性策略dominant strategy:对任何一个博弈参与方,无论对手方采取什么策略,自己都维持不变的策略。支配性策略是参与方的占优策略。(如备考,不管科目难易,都得认真学习,认真学习就是考生的支配性策略)
纳什均衡的几个注意点:
是非合作博弈,不允许串谋。
博弈当事人都是理性人。
博弈各方是同时出招的。
不是任何博弈都会产生纳什均衡的。2、知识扩展
纳什均衡的应用:囚徒困境Prisoners' Dilemma
假设情景:AB都是小偷,被警察逮住了,逮住以后要判罪,但警察也没有其他证据。警察就把AB分别关在两个小黑屋里,按下表所示逐个进行审问,然后根据两个人的招供结果来判罪。
警察是这么审问的:
先去A那边问,你到底招不招,可以招可以不招,但是要想清楚后果。
如果你沉默,你兄弟也保持沉默,那关个半年就把你们放了。
如果你沉默,你兄弟坦白了,那你兄弟会立即释放,而你会被关10年。
如果你坦白,你兄弟保持沉默,你会被立即释放,而你兄弟会被关10年。
如果你坦白,你兄弟也坦白了,那就各关你们2年。
然后警察去了B那边,和B讲了同样的话。
然后警察暂时撤离,留他们自己思考。
A心里会嘀咕:
B无非就两种选择,要么坦白,要么沉默。
B沉默时:如果我也沉默,我会被关半年,如果我坦白,我不会关。所以我还是坦白好;
B坦白时:如果我也坦白,会被关两年,如果我沉默,会被关10年。所以我还是坦白好。
考虑到这两种情况后,理性人的角度,A的支配性策略就是坦白从宽,因为这对他来说是最优策略。
B心里也是这么想的。对B来说,他的支配性策略也是坦白从宽。
所以当警察再次进来确认结果时,他们都会选择坦白,最后都关了两年。
但是从总体角度,最佳的策略反而是他们都选择沉默,因为那样他们仅仅各关半年,总时长最短。这样就解释了为啥支配性策略是参与方各自的最优策略,但不一定是总体的最佳策略。3、实际应用
囚徒困境是假设情景下的一个应用,而实际中,也存在很多纳什均衡的影子。
(1)国家倡导垃圾分类,但对每个人来说,不分类直接扔是最简单省事的,这是自己的支配性策略。但是从社会角度来说,不是利益最大化的,这也是一种囚徒困境。所以就需要通过国家法制规范和道德约束来摆脱这种困境局面。
(2)美女配丑男。美女没病,丑男没钱,双方都很正常但却看似奇特的社会现象也是可以用纳什均衡来解释的。
在社会长期的自然发展中,男的意识到追美女是个成本极高的事情,而且多半不会成功。于是变得务实起来,开始追求身边的普通女孩。这时发现一切都那么简单自然,幸福感越来越强。而美女就变为了被冷落的对象。
在这样的社会大背景下,男性一般会降一格选择异性伙伴。从博弈论的角度看,这样的策略能使自己的期望收益达到最大,即均衡策略。如果将男女按资质分为甲乙丙丁和ABCD不同等级,最后的结果会是A女和丁男轮空。
这个时候丁男可能会鼓起勇气追求一下A女,A女正好也会试一试。一方面是不想被剩下,另一方面因为自己没人追,备受冷落,如果正好丁男来追的话,可能会尝试一下,最后发现人其实挺好,就凑一对了。