囚人のジレンマ・シミュレーター
準備中...
🔒このコンテンツとは?
「囚人のジレンマ・シミュレーター」は、ゲーム理論の最も有名な問題である 「囚人のジレンマ」を、AI戦略と対戦する形で体験できるインタラクティブコンテンツです。
5つの異なるAI戦略(しっぺ返し、常に協力、常に裏切り、ランダム、しっぺ返し+許し)を相手に 20ラウンドの繰り返しゲームをプレイし、「協力」と「裏切り」の選択がもたらす結果を リアルタイムで確認できます。
📖遊び方
- 対戦相手を選択:5つのAI戦略から対戦相手を選びます。難易度が表示されているので参考にしてください。
- 協力か裏切りを選択:各ラウンドで「協力する」か「裏切る」を選びます。相手のAIも同時に選択します。
- 得点を確認:双方の選択に応じて得点が加算されます。双方協力なら3点ずつ、一方だけ裏切りなら裏切った方が5点、裏切られた方は0点です。
- 20ラウンド後に結果発表:累積スコアのグラフ、全ラウンドの詳細、戦略分析が表示されます。
🧠囚人のジレンマとは?
囚人のジレンマ(Prisoner's Dilemma)は、1950年にRAND研究所のメリル・フラッドとメルビン・ドレシャーが考案し、 アルバート・タッカーが「囚人」の物語として定式化したゲーム理論の基本モデルです。
ナッシュ均衡
このゲームのナッシュ均衡は「双方裏切り」です。相手がどちらを選んでも、自分は裏切った方が得点が高い (相手が協力なら5点>3点、相手が裏切りなら1点>0点)ため、合理的な個人は裏切りを選びます。 しかし、双方が裏切ると各1点で、双方協力の各3点より悪い結果になります。 これが「個人の合理性が集団の合理性に反する」というジレンマの本質です。
繰り返しゲーム
1回きりのゲームでは裏切りが支配戦略ですが、同じ相手と何度も対戦する「繰り返しゲーム」では状況が変わります。 将来の協力関係を考慮すると、協力が合理的になる場合があります。 これは「フォーク定理」として知られ、十分に将来を重視するプレイヤー間では、 協力を含む多くの結果がナッシュ均衡になり得ることが証明されています。
しっぺ返し戦略(Tit-for-Tat)
政治学者ロバート・アクセルロッドは1980年代に「囚人のジレンマ・トーナメント」を開催し、 世界中の研究者から戦略を募集しました。結果、アナトール・ラポポートが提出した 「しっぺ返し(Tit-for-Tat)」が最も高い成績を収めました。
しっぺ返し戦略の特徴は、(1) 最初は協力する(善良性)、(2) 裏切られたら裏切り返す(報復性)、 (3) 相手が協力に戻れば自分も協力に戻る(寛容性)、(4) ルールが単純で相手に理解されやすい(明快性)の4点です。
🌍ゲーム理論の応用
ビジネス
企業間の価格競争は典型的な囚人のジレンマです。各企業が値下げ(裏切り)すれば短期的には顧客を獲得できますが、 全社が値下げすると業界全体の利益が減少します。寡占市場での暗黙の協調や、 繰り返し取引における信頼構築がゲーム理論で分析されています。
国際関係
軍備競争は国家間の囚人のジレンマの代表例です。各国が軍備拡張(裏切り)すれば安全保障上有利ですが、 全国が軍拡すると安全保障は改善せず軍事費だけが増大します。 軍縮条約は「協力」を制度化する試みと言えます。 冷戦期の米ソ関係は、まさに繰り返し囚人のジレンマとして分析されてきました。
生物学
進化生物学者ジョン・メイナード・スミスは、動物の行動を進化的ゲーム理論で分析しました。 吸血コウモリの血液共有、霊長類の毛づくろい交換、さらには細菌間の協力行動まで、 自然界には繰り返し囚人のジレンマの構造が広く見られます。 リチャード・ドーキンスの「利己的な遺伝子」でも、しっぺ返し戦略の進化的安定性が論じられています。
❓よくある質問
Q. 囚人のジレンマで最強の戦略は何ですか?
繰り返しゲームでは「しっぺ返し(Tit-for-Tat)」が最も安定して高い成績を収めることが、 アクセルロッドのトーナメントで実証されました。ただし、絶対的に最強の戦略は存在せず、 相手の戦略によって最適な対応は変わります。
Q. 得点はどのように決まりますか?
双方協力で各3点、一方裏切りで裏切った方が5点・裏切られた方が0点、双方裏切りで各1点です。 これは標準的な囚人のジレンマの利得行列で、DC > CC > DD > CD の順序を満たします。
Q. なぜ20ラウンドなのですか?
繰り返しゲームの効果を体感するのに十分な回数であり、かつ飽きずにプレイできる長さとして 20ラウンドを設定しています。アクセルロッドのトーナメントでは200ラウンドが使用されました。
Q. ナッシュ均衡とは何ですか?
ジョン・ナッシュが提唱した概念で、各プレイヤーが他のプレイヤーの戦略を所与として、 自分の戦略を変更するインセンティブがない状態のことです。 囚人のジレンマでは「双方裏切り」がナッシュ均衡ですが、「双方協力」の方が双方にとって良い結果になるというパラドックスがあります。
📚出典・参考文献
- Robert Axelrod, "The Evolution of Cooperation" (1984)(邦訳:ロバート・アクセルロッド「つきあい方の科学」ミネルヴァ書房)
- John von Neumann & Oskar Morgenstern, "Theory of Games and Economic Behavior" (1944)
- John Nash, "Non-Cooperative Games" (1951), Annals of Mathematics
- Richard Dawkins, "The Selfish Gene" (1976)(邦訳:リチャード・ドーキンス「利己的な遺伝子」紀伊國屋書店)
- John Maynard Smith, "Evolution and the Theory of Games" (1982)