戦略的相互依存を解き明かす ― ナッシュ均衡、囚人のディレンマ、そしてコミットメント。
第 1 章〜第 4 章では、多数の売り手・買い手が価格を受容する「完全競争」を扱ってきました。しかし現実の経済には、少数の企業がお互いの行動を読み合って意思決定する場面が多くあります。たとえば自動車業界のトヨタとホンダ。トヨタが新型車を出せばホンダも対抗策を打ってくる ― こうした相互依存関係が戦略的行動(strategic behavior)です。
ゲーム理論は、20 世紀の大数学者フォン・ノイマンと経済学者モルゲンシュテルンが 1944 年に出版した『ゲームの理論と経済行動』で体系化されました。その後、プリンストン大学の数学者ジョン・ナッシュがナッシュ均衡という概念を提示し、ゲーム理論は大きく発展。1970 年代以降の経済学では、寡占・オークション・労使交渉など多様な場面でゲーム理論が標準的な分析手法となっています。
共犯の罪で逮捕された 2 人の容疑者(山田と加藤)がいます。それぞれ別室で取り調べを受けており、お互い相談はできません。2 人は「白状」するか「否認」するかを選びます。次の利得表のもとで、2 人はどう行動するでしょうか。
山田の立場で考えてみましょう。加藤が白状する場合:自分が白状すると −8、否認すると −12 → 白状が有利。加藤が否認する場合:自分が白状すると 0、否認すると −1 → やはり白状が有利。
ここが面白いポイント。両者とも否認すれば利得は (−1, −1)、現在のナッシュ均衡 (−8, −8) よりも明らかに良い結果。なのに両者とも否認に踏み切れないのはなぜか?
答え:相互の意思疎通ができず、相手を信頼できないから。相手を信じて否認しても、自分だけ −12 を食らうリスクがある。そのため両者とも「裏切られるくらいなら自分も裏切ろう」と合理的に判断 → 結果として双方とも悪い結果に陥る。これがディレンマの正体。
囚人のディレンマと同じ構造のゲームは、現実の経済・政治・国際関係のいたる所にあります。
| 応用 | プレイヤー | 支配戦略 | ジレンマ |
|---|---|---|---|
| 価格競争 | 寡占企業 A・B | 価格競争(安売り) | 両社とも協調して高価格にすれば双方 6、でも抜け駆けの誘惑で 2 |
| 軍拡競争 | A 国・B 国 | 軍備拡張 | 両国とも軍縮すれば双方 6、でも相手が拡張なら自国も、で双方 2 |
| 貿易政策 | 甲国・乙国 | 保護貿易 | 両国とも自由貿易なら双方 6、でも自国だけ保護で 9 を狙って結果 2 |
ジャンケンは、囚人のディレンマとはまったく異なる性質のゲームです。どのケースでも、勝者の利得 + 敗者の利得 = 0(勝ち +1、負け −1、引き分け 0)。こうしたゲームをゼロサムゲームと呼びます(チェス・将棋・野球も同じ)。
ジャンケンには「常にこれを出せば勝てる」純粋戦略のナッシュ均衡はありません。かわりに「グー・チョキ・パーをそれぞれ $1/3$ ずつの確率で出す」混合戦略がナッシュ均衡となります。
なぜか?もし自分が「常にグー」なら相手は「常にパー」で勝ててしまう。自分の戦略が読まれないよう、確率的に手を選ぶのが最適なのです。
一方、囚人のディレンマや以下のチキンゲームはノンゼロサムゲーム。利得の合計が変動し、全員が得する or 全員が損する状況もあり得ます。協調のチャンスがあるのもノンゼロサム特有。
映画でよくある、2 人の若者が崖に向かってオートバイを加速する「度胸試し」。早く減速した方がチキン(臆病者)。
このゲームでは、支配戦略は存在しません。代わりにナッシュ均衡が2 つ:
どちらの均衡が実現するかは、プレイヤーの性格・過去の戦歴・コミュニケーションで決まります。
太郎と花子のデート問題。太郎はボクシング好き、花子はミュージカル好き。でも 2 人で一緒にいることが最優先。
このゲームにもナッシュ均衡が 2 つ:
違いは「協調のインセンティブ」がある点。どちらでも 2 人一緒にいられれば 0 よりマシ。しかしどちらを選ぶかは交渉・慣習・譲り合いなど外部要素で決まります。
囚人のディレンマは「双方とも最悪の選択に陥る」モデル。でも現実の世界では、なぜかカルテルが結ばれたり、軍縮が実現したりしています。なぜ?
答えの 1 つは繰り返しゲーム(repeated game)。現実のゲームは 1 回きりではなく、何度も繰り返されることが多い。繰り返されるからこそ、裏切りに対する「仕返し」が可能になり、協調が維持されるのです。
「目には目を、歯には歯を」の戦略。
この戦略のもとで、相手はどう動くでしょうか。
→ 長期の累積利得を考えると、協調を続けた方が圧倒的に有利。相手の仕返しを恐れて裏切れない = 協調が自発的に維持される。
R. アクセルロッド『つきあい方の科学』(ミネルヴァ書房)は、第一次大戦中のドイツ軍とイギリス軍の塹壕戦を分析。敵同士なのに、長期対峙のもと「こちらが 5 人殺せば相手も 5 人殺し返す」という暗黙の了解が成立し、過度な攻撃が抑制されていたそうです。まさに繰り返しゲームの協調。
これまでの利得表は「同時に行動を決める」ゲームの表現。実際には順番に意思決定するゲームも多いです。それを表現するのがゲームの樹(game tree)。
中央銀行の金融政策はどうあるべきか。この問題にゲーム理論がどう光を当てるか見てみましょう。
| 立場 | 主張 | 代表的経済学者 |
|---|---|---|
| 裁量主義(ケインジアン) | 経済の状況に応じて、金融政策を機動的に調整(ファインチューニング) | ケインズ、ソロー |
| ルール主義(マネタリスト) | マネーストックを一定率で成長($k$ % ルール)させ、余計な介入はしない | フリードマン |
実はこの論争の核心は、ゲーム理論的なコミットメント問題です。日銀が「裁量」の立場だと、市中銀行は「どうせ困ったら日銀が助けてくれる」と読んで過剰融資に走ります(モラルハザード)。日銀が「$k$ % ルールを絶対に守る」とコミットすると、市中銀行は慎重にならざるを得ません。
具体的な応用例として、参入阻止行動を見てみましょう。ある街でヨーカ堂が独占的に営業しています。そこにイオンが新規参入を検討中。
イオンは次のように考えます:「自分が参入したら、ヨーカ堂はどう動くか?」
→ 価格競争なら(−40, −40)、共存なら(40, 60)。ヨーカ堂にとって共存が有利(60 > −40)なので、ヨーカ堂は合理的には価格競争を仕掛けない。
→ イオンは安心して参入 → (40, 60)。ヨーカ堂の「価格競争するぞ」はから脅し(合理的行動でないので効力なし)。
ヨーカ堂がイオン参入前に店舗を拡張(固定投資)しておく。すると:
店舗拡張は先行投資のコミットメントであり、相手の意思決定を自分有利に変える戦略。「小さな町には大きな店を、大きな町には小さな店を」(ウォルマート戦略)はまさにこれ。
→ 店舗拡張コスト(現状維持時の 120 → 80 への利得減少)を負担しても、イオンの参入を阻止することでトータルでは有利(60 より 80 が大きい)。
問 1 次の点について答えてください。
(1) 囚人のディレンマとはどのような現象か。具体的な例を 1 つあげて説明してください。
(2) 寡占的な産業でカルテルが維持される条件を、ゲーム理論的に説明してください。
(3) マクロ経済政策における「裁量主義」とはどのようなものか、またその問題点を述べてください。
(1) 囚人のディレンマは、各プレイヤーが個別に合理的な行動をとっても、全体として最悪の結果に陥ってしまう状況。典型例として寡占企業の価格競争:両社が協調して高価格を維持すれば双方の利得が高い(例:6, 6)が、抜け駆けして単独で安売りすれば利得 9、しかし相手も同じ計算で安売り → 結局双方が安売りで低利得(2, 2)。
(2) カルテルを維持する条件:(a)繰り返しゲームであること(一回きりでなく継続的な取引)、(b)裏切りが検知可能であること、(c)裏切りに対する報復戦略(しっぺ返し)が信頼できること、(d)将来の利得を現在価値で十分重視すること(高い割引率だと協調は崩れる)。これらが満たされると、長期の協調利得が短期の裏切り利得を上回り、カルテルが自発的に維持される。
(3) 裁量主義とは、経済の状況に応じて財政・金融政策を機動的に調整する立場(ケインジアン)。問題点は、民間が「政府は困ったら助けてくれる」と読むためモラルハザードが発生し、過剰融資や過剰投資を招きやすい。また時間的非整合性(今日の最適政策と明日の最適政策が矛盾する)によって、長期的な政策の信頼性が失われる。そのためマネタリストは「ルール主義」($k$ % ルールなど)への固定化=コミットメントを主張する。
問 2 次のゲームについて考えてください。プレイヤーは A と B の 2 人で、A は戦略 a と b、B は戦略 c と d をとれる。左の数値が A の利得、右の数値が B の利得。
| B: c | B: d | |
|---|---|---|
| A: a | 1, 1 | 100, 0 |
| A: b | 0, 100 | 5, 5 |
A と B はそれぞれどのような戦略をとるか。ナッシュ均衡はどこか。
A の視点:
B の視点(対称):
結果としてナッシュ均衡 = (a, c)、利得 (1, 1)。
ジレンマ:(b, d) を選べば双方の利得は 5 でより良いが、それぞれの支配戦略に従う合理的行動の結果、(1, 1) に陥る。これも囚人のディレンマの一種。
問 3 高速道路の混雑現象は、囚人のディレンマと似た性格を持つといわれます。その理由を説明してください。
囚人のディレンマと高速道路混雑の対応:
→ 各ドライバーは「自分一人くらい混雑しても大した影響はない」と判断して、個別に合理的には高速道路のピーク時間帯を使うことを選ぶ。結果として全員が同じ行動をとり、大渋滞という全員にとって悪い結果を招く。
解決策はコミットメントに相当するもの:混雑料金(時間帯別の通行料引上げ)、信号統制、走行時間の規制など。個々の利得構造を変えることで、均衡を移動させる。
問 4 次の 2 つのゲームについて、ナッシュ均衡を求めてください。
ゲーム ①:
| B: c | B: d | |
|---|---|---|
| A: a | 3, 3 | 0, 4 |
| A: b | 4, 0 | 1, 1 |
ゲーム ②:
| B: c | B: d | |
|---|---|---|
| A: a | 2, 2 | 0, 0 |
| A: b | 0, 0 | 3, 3 |
ゲーム ①(囚人のディレンマ型):
A の視点:B=c → a:3, b:4 で b有利/B=d → a:0, b:1 で b 有利 → b は支配戦略。同様に B も d が支配戦略。
→ ナッシュ均衡 = (b, d)、利得 (1, 1)。(a, c) を選べば (3, 3) でより良いが、支配戦略に従う結果悪い均衡に陥る。
ゲーム ②(協調ゲーム):
A=a のとき、B は c で 2、d で 0 → c 有利。逆に A=b のとき、B は d で 3、c で 0 → d 有利。
A の視点も同様。
→ ナッシュ均衡は 2 つ:(a, c) 利得 (2, 2) と (b, d) 利得 (3, 3)。後者のほうが両者にとって有利だが、(a, c) もナッシュ均衡として成立しうる。実際にどちらが実現するかはプレイヤー間の慣習・コミュニケーションで決まる(バトル・オブ・セックス型)。
問 5 ある街に老舗のスーパー P 社が独占的に営業している。そこに新規参入を検討している Q 社がある。以下のゲームの樹が与えられたとき、Q 社は参入するか、しないか。P 社は新規参入を阻止するため何をすべきか。
Q 社の意思決定プロセス(バックワード・インダクション):
P の参入阻止策:事前に店舗拡張・広告投資などのコミットメントを行い、「Q が参入しても Q の利得がマイナスになる」状況を作る。例えば店舗拡張後の利得表:Q が参入すれば (−10, 40)、参入しなければ (0, 80)。このとき Q は参入しない選択を取るので、P は独占維持 (80) を実現できる。コミットメントコスト(現状維持時の 100 → 80 の低下 20)を払う価値がある(共存時の 50 より高い利得を確保)。
問 6 繰り返しゲームにおける「しっぺ返し戦略」について、その内容と、なぜ協調が自発的に維持されるのかを説明してください。
しっぺ返し戦略(tit-for-tat):
協調維持のメカニズム:
R. アクセルロッドのコンピュータ・シミュレーションでは、多くの戦略の中でシンプルなしっぺ返し戦略が繰り返しゲームで最も高い累積利得を実現することが示されている。日本の終身雇用・メインバンク・系列取引など、長期継続的な取引関係は、この繰り返しゲームの協調メカニズムで説明できる。
プレミアム会員の質問とAI回答をみんなで共有