囚徒困境是这样一种情况的例子:个体决策者为了自己的最大利益而行事,却为个体作为一个群体带来了次优的结果。这是博弈论中最著名的例子之一。
囚徒困境的标准化例子,最初由数学家 Merrill Flood 和 Melvin Dresher 提出,然后由 Albert 形式化W. Tucker 介绍了以下情况:
这种情况可能会导致<三种可能的结果:
背叛对方囚犯比与他们合作能得到更大的回报,因此可以假设所有纯粹理性的囚犯都会背叛对方,导致唯一可能的结果是两者都囚犯之间互相背叛。
逻辑上追求个人奖励应该会带来更好的结果;然而,在囚徒困境中,追求个人奖励会导致更糟糕的个人结果。
囚徒困境发生在经济的许多方面,但人们提出了多种解决方案并随着时间的推移实施,有利于共同利益而不是个人激励。
例如,在现实世界中,大多数交互都会重复多次。如果囚徒困境发生多次,则可以称为迭代囚徒困境。在这种情况下,个体参与者可以实施奖励长期合作的策略。
另一个解决方案是正式的、制度性的策略,它可以改变个体决策者可能面临的激励。通过了解集体目标以及通过各种规则强制执行合作行为的能力,可以将囚徒困境转向对集体更有利的结果。