怎样向非专业人士专业地解释「纳什均衡」?

本题已加入知乎圆桌 » 日常经济学 · 博弈人生,更多「博弈论」话题讨论欢迎关注
关注者
918
被浏览
253,629

45 个回答

收录于 知乎圆桌 ·
“不后悔”

这是Yale的《博弈论》公开课上给出的一个直观解释,也是我目前看到的最容易理解的解释。

不过我以为这个解释还不够严谨。纳什均衡在一些博弈中并非共同最优的结果,如常被拿出来说事的“囚徒困境”中,纳什均衡结果是两人均认罪,而这个结果对两个人而言都是不如两人均不认罪的结果的。如果不对“不后悔”做一点补充,可能会造成歧义。于是解释不得不变得稍微复杂一点:

给定其他人的策略不变,每一个参与者对于自己的选择都“不后悔”。

而之所以合作结果不能成为均衡结果,正是因为给定一方“合作”(不认罪)时,另一方就会有将策略改为“背叛”(认罪)的激励。即合作结果将会使双方都后悔。

对于这样的“不后悔”,有一个专业术语——“最优反应”(best response),于是可以进一步修改对纳什均衡的解释:

每个人的策略都是对其他人的策略的最优反应。

这个相对规范的表述也不难理解嘛:)


补充:

1、“囚徒困境”中的背叛结果是一个纯策略纳什均衡的例子,对于混合策略纳什均衡,这个解释也是成立的~

2、Dixit的Games of Strategy上更规范的定义:A Nash Equilibrium in a game is a list of strategies, one for each player, such that no player can get a better payoff by switching to some other strategy that is available to her while all other players adhere to the strategies specified for them in the list.
说到简洁,大部分的经济学理论都是几句话可以说清楚的,没有那么玄妙。

纳什均衡有个这样的前提:决策圈中的个体是独立,不合作,不横向沟通的。
然后每个个体在猜测决策圈里的其他人的选择后,作出自己认为最优的决策。
这样的决策简单组合起来,就叫纳什均衡。

囚徒理论广为人知,但是它是证明“纳什均衡不代表整体最优决策”的一个浅显简单的例子。