囚徒困境是這樣一種情況的例子:個體決策者為了自己的最大利益而行事,卻為個體作為一個群體帶來了次優的結果。這是博弈論中最著名的例子之一。
囚徒困境的標準化例子,最初由數學家 Merrill Flood 和 Melvin Dresher 提出,然後由 Albert 形式化 W. Tucker 介紹了以下情況:
這種情況可能會導致<三種可能的結果:
背叛對方囚犯比與他們合作能得到更大的回報,因此可以假設所有純粹理性的囚犯都會背叛對方,導致唯一可能的結果是兩者皆有囚犯之間互相背叛。
邏輯上追求個人獎勵應該會帶來更好的結果;然而,在囚徒困境中,追求個人獎勵會導致更糟糕的個人結果。
囚徒困境發生在經濟的許多方面,但人們提出了多種解決方案並隨著時間的推移實施,有利於共同利益而非個人激勵。
例如,在現實世界中,大多數互動都會重複多次。如果囚徒困境發生多次,可以稱為迭代囚徒困境。在這種情況下,個別參與者可以實施獎勵長期合作的策略。
另一個解決方案是正式的製度策略,它可以改變個別決策者可能面臨的動機。透過了解集體目標以及透過各種規則強制執行合作行為的能力,可以將囚徒困境轉向對集體更有利的結果。