経済 ― 第5章(ミクロ最終章)

ゲームの理論入門

戦略的相互依存を解き明かす ― ナッシュ均衡、囚人のディレンマ、そしてコミットメント。

経済は、企業・消費者・政府など多数の経済主体が相互に依存しながら動く世界。自分の行動が相手にどう影響するか、相手の反応が自分にどう跳ね返るか ― この戦略的行動を分析するのがゲームの理論です。 本章では、ゲーム理論の最重要概念である囚人のディレンマナッシュ均衡ゼロサムゲーム vs ノンゼロサムゲーム繰り返しゲームと協調の発生、そしてゲームの樹コミットメントまで、5 枚の図で一気に俯瞰します。ミクロ経済学の最終章であり、マクロ経済政策の議論(第 9 章)にもつながる重要な内容です。

🎯 この章でマスターしておきたいこと

📚 本章の流れ

  1. ゲームの理論とは ― 戦略的行動の分析
  2. 囚人のディレンマ
  3. ジャンケン・チキンゲーム・バトル・オブ・セックス
  4. 繰り返しゲームと協調のメカニズム
  5. ゲームの樹・ルールか裁量か・参入阻止
  6. 要点まとめ
  7. 演習

1. ゲームの理論とは ― 戦略的行動の分析

1.1 戦略的行動 ― 自分の行動が相手の行動を変える

第 1 章〜第 4 章では、多数の売り手・買い手が価格を受容する「完全競争」を扱ってきました。しかし現実の経済には、少数の企業がお互いの行動を読み合って意思決定する場面が多くあります。たとえば自動車業界のトヨタとホンダ。トヨタが新型車を出せばホンダも対抗策を打ってくる ― こうした相互依存関係が戦略的行動(strategic behavior)です。

1.2 ゲーム理論の 3 つの基本要素

ゲーム理論の基本用語

1.3 歴史 ― フォン・ノイマンとナッシュ

ゲーム理論は、20 世紀の大数学者フォン・ノイマンと経済学者モルゲンシュテルンが 1944 年に出版した『ゲームの理論と経済行動』で体系化されました。その後、プリンストン大学の数学者ジョン・ナッシュナッシュ均衡という概念を提示し、ゲーム理論は大きく発展。1970 年代以降の経済学では、寡占・オークション・労使交渉など多様な場面でゲーム理論が標準的な分析手法となっています。

ジョン・ナッシュは映画『ビューティフル・マインド』の主人公のモデル。若くして精神的な病を抱えながらも、ナッシュ均衡の概念で経済学に革命を起こし、1994 年にノーベル経済学賞を受賞しました。アクチュアリー試験にゲーム理論が入っているのも、このナッシュ均衡の概念がリスク分析・戦略決定の基盤として不可欠だからです。

2. 囚人のディレンマ

2.1 古典的な設定

共犯の罪で逮捕された 2 人の容疑者(山田と加藤)がいます。それぞれ別室で取り調べを受けており、お互い相談はできません。2 人は「白状」するか「否認」するかを選びます。次の利得表のもとで、2 人はどう行動するでしょうか。

囚人のディレンマ
図 5-1 囚人のディレンマ ― 左下:山田の利得、右上:加藤の利得

2.2 支配戦略 ― 「相手が何をしても最適」な戦略

山田の立場で考えてみましょう。加藤が白状する場合:自分が白状すると −8、否認すると −12 → 白状が有利。加藤が否認する場合:自分が白状すると 0、否認すると −1 → やはり白状が有利。

支配戦略(dominant strategy)相手がどの戦略を選んでも、自分にとって他のどの戦略よりも有利な戦略
このゲームでは「白状」が両プレイヤーの支配戦略。
→ 結果:両者とも「白状」を選び、利得 (−8, −8) に落ち着く。これがナッシュ均衡

2.3 ジレンマの本質

ここが面白いポイント。両者とも否認すれば利得は (−1, −1)、現在のナッシュ均衡 (−8, −8) よりも明らかに良い結果。なのに両者とも否認に踏み切れないのはなぜか?

答え:相互の意思疎通ができず、相手を信頼できないから。相手を信じて否認しても、自分だけ −12 を食らうリスクがある。そのため両者とも「裏切られるくらいなら自分も裏切ろう」と合理的に判断 → 結果として双方とも悪い結果に陥る。これがディレンマの正体。

2.4 囚人のディレンマの応用例

囚人のディレンマと同じ構造のゲームは、現実の経済・政治・国際関係のいたる所にあります。

囚人のディレンマの応用例
図 5-2 囚人のディレンマの応用例 ― 価格競争・軍拡競争・貿易政策、すべて同じ構造
応用プレイヤー支配戦略ジレンマ
価格競争寡占企業 A・B価格競争(安売り)両社とも協調して高価格にすれば双方 6、でも抜け駆けの誘惑で 2
軍拡競争A 国・B 国軍備拡張両国とも軍縮すれば双方 6、でも相手が拡張なら自国も、で双方 2
貿易政策甲国・乙国保護貿易両国とも自由貿易なら双方 6、でも自国だけ保護で 9 を狙って結果 2
冷戦時代、米ソの軍拡競争はまさに囚人のディレンマの典型。両国が核軍縮すれば双方楽になるのに、相手を信頼できないため軍拡が続きました。1960 年代にホットライン(両国首脳直通電話)が設置されたのも、意思疎通を確保してディレンマを脱出するための工夫。KKT 試験では「囚人のディレンマ的状況」の事例を見抜く問題がよく出るので、構造を体得しておきましょう。

3. ジャンケン・チキンゲーム・バトル・オブ・セックス

3.1 ジャンケン ― ゼロサムゲームと混合戦略

ジャンケンは、囚人のディレンマとはまったく異なる性質のゲームです。どのケースでも、勝者の利得 + 敗者の利得 = 0(勝ち +1、負け −1、引き分け 0)。こうしたゲームをゼロサムゲームと呼びます(チェス・将棋・野球も同じ)。

ジャンケンの最適戦略

ジャンケンには「常にこれを出せば勝てる」純粋戦略のナッシュ均衡はありません。かわりに「グー・チョキ・パーをそれぞれ $1/3$ ずつの確率で出す」混合戦略がナッシュ均衡となります。

なぜか?もし自分が「常にグー」なら相手は「常にパー」で勝ててしまう。自分の戦略が読まれないよう、確率的に手を選ぶのが最適なのです。

3.2 ノンゼロサムゲーム ― 協調の可能性

一方、囚人のディレンマや以下のチキンゲームはノンゼロサムゲーム。利得の合計が変動し、全員が得する or 全員が損する状況もあり得ます。協調のチャンスがあるのもノンゼロサム特有。

3.3 チキンゲーム ― ナッシュ均衡が 2 つ

映画でよくある、2 人の若者が崖に向かってオートバイを加速する「度胸試し」。早く減速した方がチキン(臆病者)。

チキンゲームとバトル・オブ・セックス
図 5-3 複数のナッシュ均衡を持つゲーム ― チキンゲーム(衝突型)とバトル・オブ・セックス(協調型)

このゲームでは、支配戦略は存在しません。代わりにナッシュ均衡が2 つ

どちらの均衡が実現するかは、プレイヤーの性格・過去の戦歴・コミュニケーションで決まります。

3.4 バトル・オブ・セックス ― 協調ゲーム

太郎と花子のデート問題。太郎はボクシング好き、花子はミュージカル好き。でも 2 人で一緒にいることが最優先。

このゲームにもナッシュ均衡が 2 つ:

違いは「協調のインセンティブ」がある点。どちらでも 2 人一緒にいられれば 0 よりマシ。しかしどちらを選ぶかは交渉・慣習・譲り合いなど外部要素で決まります。

ナッシュ均衡(Nash equilibrium)の定義
すべてのプレイヤーが「相手の戦略に対して最適応答」になっている状態。つまり、誰も自分だけ戦略を変えても利得が上がらない均衡。
→ 囚人のディレンマ:均衡 1 つ/チキン・バトル:均衡 2 つ/ジャンケン:純粋戦略では均衡なし(混合戦略で 1 つ)。

4. 繰り返しゲームと協調のメカニズム

4.1 現実は 1 回きりではない

囚人のディレンマは「双方とも最悪の選択に陥る」モデル。でも現実の世界では、なぜかカルテルが結ばれたり、軍縮が実現したりしています。なぜ?

答えの 1 つは繰り返しゲーム(repeated game)。現実のゲームは 1 回きりではなく、何度も繰り返されることが多い。繰り返されるからこそ、裏切りに対する「仕返し」が可能になり、協調が維持されるのです。

4.2 しっぺ返し戦略(tit-for-tat)

しっぺ返し戦略
  1. 初回は協調する
  2. 相手が協調を続ける限り、自分も協調を続ける
  3. 相手が 1 度でも裏切ったら、次回からずっと裏切り返す(報復)

「目には目を、歯には歯を」の戦略。

この戦略のもとで、相手はどう動くでしょうか。

しっぺ返し戦略での協調の維持
図 5-5 繰り返しゲームと「しっぺ返し戦略」 ― 協調は自発的に維持される
協調が維持されるメカニズム(価格競争の例)

→ 長期の累積利得を考えると、協調を続けた方が圧倒的に有利。相手の仕返しを恐れて裏切れない = 協調が自発的に維持される

4.3 現実世界の応用

R. アクセルロッド『つきあい方の科学』(ミネルヴァ書房)は、第一次大戦中のドイツ軍とイギリス軍の塹壕戦を分析。敵同士なのに、長期対峙のもと「こちらが 5 人殺せば相手も 5 人殺し返す」という暗黙の了解が成立し、過度な攻撃が抑制されていたそうです。まさに繰り返しゲームの協調。

戦後日本経済を支えた終身雇用制・メインバンク制・系列取引など、「日本的取引慣行」もすべて繰り返しゲームの協調として説明できます。一生同じ会社で働くなら労働者は裏切らないし、会社も短期の利益で労働者を裏切らない。長期関係こそが裏切りを抑止するのです。グローバル経済化で短期取引が増えた現代、この日本的強みをどう再構築するかは大きな課題ですね。

5. ゲームの樹・ルールか裁量か・参入阻止

5.1 ゲームの樹 ― 時系列的な意思決定の表現

これまでの利得表は「同時に行動を決める」ゲームの表現。実際には順番に意思決定するゲームも多いです。それを表現するのがゲームの樹(game tree)。

5.2 ルールか裁量か ― 金融政策論争

中央銀行の金融政策はどうあるべきか。この問題にゲーム理論がどう光を当てるか見てみましょう。

立場主張代表的経済学者
裁量主義(ケインジアン)経済の状況に応じて、金融政策を機動的に調整(ファインチューニング)ケインズ、ソロー
ルール主義(マネタリスト)マネーストックを一定率で成長($k$ % ルール)させ、余計な介入はしないフリードマン

実はこの論争の核心は、ゲーム理論的なコミットメント問題です。日銀が「裁量」の立場だと、市中銀行は「どうせ困ったら日銀が助けてくれる」と読んで過剰融資に走ります(モラルハザード)。日銀が「$k$ % ルールを絶対に守る」とコミットすると、市中銀行は慎重にならざるを得ません。

コミットメント(commitment)の威力
自分の将来の行動を事前に縛ることで、相手の現在の行動を変えられる。一見すると「選択肢を減らす=不利」に思えるが、相手の戦略を変える力としてはむしろ強力な武器になる。これがゲーム理論の最も深い洞察の一つ。

5.3 参入阻止行動 ― ゲームの樹で解く

具体的な応用例として、参入阻止行動を見てみましょう。ある街でヨーカ堂が独占的に営業しています。そこにイオンが新規参入を検討中。

ゲームの樹による参入阻止分析
図 5-4 ゲームの樹による参入阻止行動 ― コミットメントの威力

ケース ①:現状維持(コミットメントなし)

イオンは次のように考えます:「自分が参入したら、ヨーカ堂はどう動くか?」
→ 価格競争なら(−40, −40)、共存なら(40, 60)。ヨーカ堂にとって共存が有利(60 > −40)なので、ヨーカ堂は合理的には価格競争を仕掛けない
→ イオンは安心して参入 → (40, 60)。ヨーカ堂の「価格競争するぞ」はから脅し(合理的行動でないので効力なし)。

ケース ②:店舗拡張(コミットメント)

ヨーカ堂がイオン参入前に店舗を拡張(固定投資)しておく。すると:

店舗拡張は先行投資のコミットメントであり、相手の意思決定を自分有利に変える戦略。「小さな町には大きな店を、大きな町には小さな店を」(ウォルマート戦略)はまさにこれ。

設例:参入阻止の数値計算

→ 店舗拡張コスト(現状維持時の 120 → 80 への利得減少)を負担しても、イオンの参入を阻止することでトータルでは有利(60 より 80 が大きい)。

5.4 ビジネスでのコミットメント事例

💡 第 5 章 要点まとめ

✍️ 演習(クリックで解答表示)

問 1 次の点について答えてください。
(1) 囚人のディレンマとはどのような現象か。具体的な例を 1 つあげて説明してください。
(2) 寡占的な産業でカルテルが維持される条件を、ゲーム理論的に説明してください。
(3) マクロ経済政策における「裁量主義」とはどのようなものか、またその問題点を述べてください。

解答を見る

(1) 囚人のディレンマは、各プレイヤーが個別に合理的な行動をとっても、全体として最悪の結果に陥ってしまう状況。典型例として寡占企業の価格競争:両社が協調して高価格を維持すれば双方の利得が高い(例:6, 6)が、抜け駆けして単独で安売りすれば利得 9、しかし相手も同じ計算で安売り → 結局双方が安売りで低利得(2, 2)。

(2) カルテルを維持する条件:(a)繰り返しゲームであること(一回きりでなく継続的な取引)、(b)裏切りが検知可能であること、(c)裏切りに対する報復戦略(しっぺ返し)が信頼できること、(d)将来の利得を現在価値で十分重視すること(高い割引率だと協調は崩れる)。これらが満たされると、長期の協調利得が短期の裏切り利得を上回り、カルテルが自発的に維持される。

(3) 裁量主義とは、経済の状況に応じて財政・金融政策を機動的に調整する立場(ケインジアン)。問題点は、民間が「政府は困ったら助けてくれる」と読むためモラルハザードが発生し、過剰融資や過剰投資を招きやすい。また時間的非整合性(今日の最適政策と明日の最適政策が矛盾する)によって、長期的な政策の信頼性が失われる。そのためマネタリストは「ルール主義」($k$ % ルールなど)への固定化=コミットメントを主張する。

問 2 次のゲームについて考えてください。プレイヤーは A と B の 2 人で、A は戦略 a と b、B は戦略 c と d をとれる。左の数値が A の利得、右の数値が B の利得。

B: cB: d
A: a1, 1100, 0
A: b0, 1005, 5

A と B はそれぞれどのような戦略をとるか。ナッシュ均衡はどこか。

解答を見る

A の視点

  • B が c を選ぶ場合:a → 利得 1、b → 利得 0 → a が有利
  • B が d を選ぶ場合:a → 利得 100、b → 利得 5 → a が有利
  • → A にとって a は支配戦略

B の視点(対称):

  • A が a を選ぶ場合:c → 利得 1、d → 利得 0 → c が有利
  • A が b を選ぶ場合:c → 利得 100、d → 利得 5 → c が有利
  • → B にとって c は支配戦略

結果としてナッシュ均衡 = (a, c)、利得 (1, 1)。

ジレンマ:(b, d) を選べば双方の利得は 5 でより良いが、それぞれの支配戦略に従う合理的行動の結果、(1, 1) に陥る。これも囚人のディレンマの一種。

問 3 高速道路の混雑現象は、囚人のディレンマと似た性格を持つといわれます。その理由を説明してください。

解答を見る

囚人のディレンマと高速道路混雑の対応:

  • プレイヤー:各ドライバー
  • 戦略:高速道路を使う/使わない(または時間をずらす)
  • 利得の構造
     ・みんなが高速を使う → 大渋滞、各自の利得低い
     ・みんなが空いている時間帯を選ぶ → 円滑な交通、各自の利得高い
     ・自分だけ使わない/時間をずらすと、便利な時間帯に高速を使えず自分の利得はさらに低い

→ 各ドライバーは「自分一人くらい混雑しても大した影響はない」と判断して、個別に合理的には高速道路のピーク時間帯を使うことを選ぶ。結果として全員が同じ行動をとり、大渋滞という全員にとって悪い結果を招く。

解決策はコミットメントに相当するもの:混雑料金(時間帯別の通行料引上げ)、信号統制、走行時間の規制など。個々の利得構造を変えることで、均衡を移動させる。

問 4 次の 2 つのゲームについて、ナッシュ均衡を求めてください。

ゲーム ①

B: cB: d
A: a3, 30, 4
A: b4, 01, 1

ゲーム ②

B: cB: d
A: a2, 20, 0
A: b0, 03, 3
解答を見る

ゲーム ①(囚人のディレンマ型):

A の視点:B=c → a:3, b:4 で b有利/B=d → a:0, b:1 で b 有利 → b は支配戦略。同様に B も d が支配戦略。

ナッシュ均衡 = (b, d)、利得 (1, 1)。(a, c) を選べば (3, 3) でより良いが、支配戦略に従う結果悪い均衡に陥る。

ゲーム ②(協調ゲーム):

A=a のとき、B は c で 2、d で 0 → c 有利。逆に A=b のとき、B は d で 3、c で 0 → d 有利。

A の視点も同様。

ナッシュ均衡は 2 つ:(a, c) 利得 (2, 2) と (b, d) 利得 (3, 3)。後者のほうが両者にとって有利だが、(a, c) もナッシュ均衡として成立しうる。実際にどちらが実現するかはプレイヤー間の慣習・コミュニケーションで決まる(バトル・オブ・セックス型)。

問 5 ある街に老舗のスーパー P 社が独占的に営業している。そこに新規参入を検討している Q 社がある。以下のゲームの樹が与えられたとき、Q 社は参入するか、しないか。P 社は新規参入を阻止するため何をすべきか。

価格競争 → (Q: -30, P: -30) 参入 → P → Q → 共存 → (Q: 30, P: 50) 参入しない → (Q: 0, P: 100)
解答を見る

Q 社の意思決定プロセス(バックワード・インダクション):

  1. Q が参入した場合、P はどう動く?
      ・価格競争 → P の利得 −30
      ・共存 → P の利得 50
      → P は共存を選ぶ(合理的)。「価格競争するぞ」はから脅しで信用できない。
  2. したがって Q は参入 → (30, 50)。
  3. Q が参入しない場合は (0, 100)。
  4. Q は 30 > 0 なので参入する

P の参入阻止策:事前に店舗拡張・広告投資などのコミットメントを行い、「Q が参入しても Q の利得がマイナスになる」状況を作る。例えば店舗拡張後の利得表:Q が参入すれば (−10, 40)、参入しなければ (0, 80)。このとき Q は参入しない選択を取るので、P は独占維持 (80) を実現できる。コミットメントコスト(現状維持時の 100 → 80 の低下 20)を払う価値がある(共存時の 50 より高い利得を確保)。

問 6 繰り返しゲームにおける「しっぺ返し戦略」について、その内容と、なぜ協調が自発的に維持されるのかを説明してください。

解答を見る

しっぺ返し戦略(tit-for-tat)

  1. 初回は協調する(友好的に始める)
  2. 相手が協調を続ける限り、自分も協調を続ける
  3. 相手が 1 度でも裏切ったら、次回から裏切り返す(報復)
  4. 場合によっては、相手が再び協調に戻れば自分も協調に戻る(寛容型)

協調維持のメカニズム

  • 短期的には裏切りが有利:1 回だけなら抜け駆けで高い利得を得られる。
  • 長期的には協調が有利:相手の報復が続くため、将来の利得が大きく減る。
  • たとえば、協調の毎期利得が 6、裏切り 1 回で 9、以後報復で 1 になるとすると:
      8 期の累積 = 協調なら 48、裏切りなら 6+9+6 = 21。協調が圧倒的に有利。
  • この「将来の仕返しへの恐れ」が現在の協調行動を動機づける → 協調が自発的に維持される均衡状態に。

R. アクセルロッドのコンピュータ・シミュレーションでは、多くの戦略の中でシンプルなしっぺ返し戦略が繰り返しゲームで最も高い累積利得を実現することが示されている。日本の終身雇用・メインバンク・系列取引など、長期継続的な取引関係は、この繰り返しゲームの協調メカニズムで説明できる。

🎯
演習問題の理解度を自己診断
この章の演習に取り組んだ後、自分の手応えを記録しましょう(ダッシュボードに進捗として表示されます)
🔒 自己診断機能は無料会員登録でご利用いただけます。

プレミアム会員の質問とAI回答をみんなで共有

読み込み中...
🎓

無料会員登録でロック解除!

講師から一言・本章のポイント・演習問題は
無料会員登録でご利用いただけます。
登録は無料なので、ぜひ!

既にアカウントをお持ちの方は ログイン