ゲームとしての相互確証破壊: ゲームの説明

ゲームの説明

最初に,合理的ということの意味が,定義せずとも明らかであるかのように見える簡単なケースを分析する。その上で,有限性を導入して,再帰的に合理的行動を定義し,ゲームの規則を確定させる。

実際にこのようにしてみると,これ程までに単純化したゲームにおいても, 相互に合理的に行動する という概念自体の,扱いづらさが明らかになると思う。

設定

  • [プレーヤー]  プレーヤーは \(A\) と \(B\) の\(2\) 名。
  • [価値関数]  価値関数を以下のように与える:
    1. 初期状態では,プレーヤー\(A\), \(B\) は,それぞれ,いくつかの(もちろん有限個の)「都市」 を所有している。
    2. 各都市には,それぞれ,価値を表す数値が与えられている(負の値でない実数値だが,零でも良い)。この値を,まとめて, $$ \begin{gather*} \vec{a} = (a_1,a_2,\ldots,a_m)\\ \vec{b} = (b_1,b_2,\ldots,b_n) \end{gather*} $$ と表す。
    3. プレーヤー \(A,B\) は,
      • 自分の都市の価値合計は大きいほど好ましく,
      • 相手の都市の価値合計は小さいほど好ましい
      と考え,それぞれ,相手の都市の価値(の合計)をどの程度嫌っているかを表す固定された定数 \(k,\ell\) を持つ。それにより,プレーヤー \(A,B\) に対して,価値関数 $$ \begin{gather*} \varphi_A(\vec{a},\vec{b}) = a_1+a_2+\cdots+a_m - k(b_1+b_2+\dots+b_n)\\ \varphi_B(\vec{a},\vec{b}) = b_1+b_2+\cdots+b_n - \ell(a_1+a_2+\cdots+a_m) \end{gather*} $$ が定められる。
  • [確証的な攻撃] プレーヤー \(A,B\) は,相手の都市のいくつか(すべてでも良い)を消滅させることができる。零個の都市に対する攻撃をパスと言うことにする。プレーヤーは,攻撃をせずにパスを選択することもできる。攻撃は,何回でも行うことができる(ただし,相手の都市がまだ残っていればだが)。また,消滅した都市は,復活しない。
  • [最終的な目的] プレーヤー \(A,B\) は,相互の攻撃の結果として決まる,自身の価値関数の最終的値が最大になるように,合理的に行動する。

このゲームでは,プレーヤーの目的は,相手に勝つことではなく,自身の価値関数を最大にすることであることに注意。 また,プレーヤー \(A,B\) は, 相手も自身の価値関数を最大にするために合理的に行動する として相手の行動を推論し,自身の行動を決定する。相手が,非合理な行動(例えば復讐心による選択)とか,能力の欠如による判断ミスはしないと仮定している。

攻撃が確証されている世界を想定しているので,軍事力の増加や壊滅を考える必要はない。ここでは,軍事力の最終的価値は相手の都市を壊滅させることのみにある,と考えている。相手の軍事力を部分的に壊滅させても(例えば,通常戦力を壊滅させたり,味方の軍事基地に対する攻撃力を削ぐことができたとしても),味方の都市に対しての攻撃能力を完全に削がない限り,意味がないとしている。そのような攻撃を行ったところで,メリットがあるどころか,相手の\(k\) (もしくは \(\ell\) )の値を増加させ都市攻撃を「合理的」に選択させてしまう結果に繋がりそうなのだ。なお,都市の価値については,都市の成長や衰退などの長期的時間変化は考えていない。

簡単な状況

実は,例えばプレーヤー \(A\) が, 相手(この場合はプレーヤー \(B\) )も合理的に行動するとして相手の行動を推論し,自身の行動を決定する という想定は,相手(プレーヤー \(B\) )もまた,この「自身の行動を決定する」ときに(プレーヤー \(A\) が)決定した行動を推論して行動を決定するので,すでに自己言及のパラドックスに接触している。

したがって,これでは「合理的な判断に基づく行動」が定義されていることにはならないのだが,簡単な状況では,「合理的判断」らしきものが観察される。

Example 1. \(m=n=1\) とする。この場合,\(\vec{a} = (a_1),\quad \vec{b} = (b_1)\) であり(一つの数値に括弧をつけるのは見かけが悪いのだが,やむを得ない), $$ \varphi_A(\vec{a},\vec{b})= a_1 - kb_1,\quad \varphi_B(\vec{a},\vec{b}) = b_1 - \ell a_1 $$ なので,条件 $$ a_1 > kb_1,\quad b_1 > \ell a_1 $$ が満たされている限りでは,攻撃を行わないことが合理的である。

要点は,

ひとつの都市に対しての攻撃は,完全にその価値を零に変えてしまう。例えばその価値を半減させるような部分的な攻撃は,行えない
ということである。したがって,例えばプレーヤー \(A\) が攻撃を選択すると,プレーヤー \(B\) のただ一つの都市の価値 \(b_1\) を \(0\) に変えてしまうことになり,\(\varphi_B = 0 - \ell a_1 < 0\) となってしまう。こうなると,プレーヤー \(B\) も攻撃を選択することになり,相互の攻撃により両者の価値関数の値は共に零になってしまう。両者共に「相互確証攻撃による安全保障」に安住していれば価値関数の値は正だったのだから,攻撃は合理的でない。

\(\varphi_B(\vec{a},\vec{b})\)のように関数の引数を書くのは煩わしいので,省略して \(\varphi_B\) と表した。これは,その時点での \(\varphi_B\) の値であり,引数が攻撃により変化すると,それに依存して値は変わる。

互いに攻撃を選択しないことが合理的な場合, \( a_1 > kb_1 > k(\ell a_1) \) となるので不等式 \(k\ell <1\) が成り立つ。\(k\ell > 1\) の場合,「相互核抑止」は成立しない。

簡単だが異常な状況

Example 1 は「相互核抑止」の原形なのだろうが,プレーヤーが完全に合理的に振る舞うと決めてしまっているゲームの世界は,次の例が示すように,身も蓋もない。

Example 2. 具体的に数値を決めてしまうことにする。\(m=1, n=2\) で,\(k=0.2, \ell=0.3\) とする。さらに, \(a_1=5\), \(b_1 = 7, b_2 = 3\) とする。このとき,初期状態では $$ \begin{gather} \varphi_A = 5 - 0.2\times (7+3) = 3.0\\ \varphi_B = (7+3) - 0.3\times 5 = 8.5 \end{gather} $$ であり,価値関数の値は,両者共に正の値。したがって,これで満足しても平和なのだが,プレーヤー \(A\) の「合理的選択」は,\(b_1 = 7\) を攻撃して\(b_1 = 0\) に変えることなのだ(ひどい話しだが)。その結果 $$ \begin{gather} \varphi_A = 5 - 0.2\times 3 = 4.4\\ \varphi_B = (0+3) - 0.3\times 5 = 1.5 \end{gather} $$ であり,Example \(1\)での「相互確証攻撃による安全保障」が成立している状況に変わる。したがって,

プレーヤー \(A\) は,安心して(プレーヤー \(B\) の限りなき合理性を信頼して)攻撃を選ぶことができる。

とんでもない話なのだが,攻撃を受けてしまった後の状況では,報復攻撃は互いの不幸を大きくするだけで,愚かな感情的行動に過ぎない。それならば,あらかじめ 攻撃を受けたら必ず報復します と宣言しておけば良さそうなものだが,プレーヤー \(A\) はその宣言は謹んで拝聴しておいた上で,平然と攻撃をすることになる。プレーヤー \(B\) にとって,攻撃を受けてしまった状況では,もはや宣言を実行することは結果を悪化させるだけなのだ。プレーヤー \(B\) の理性を全面的に信頼することにしよう。

要するに,このゲームは,神々のような理性を前提としたゲームとして設定されているのだ。

しかし,これを「理性」といって良いものなのだろうか。攻撃を受けた惨状を目前にして,より結果を悪化させないことのみを考慮するのは,理性なのだろうか。ましてや,相手の理性につけ込むことは,理性なのだろうか。おそらく,「理性」という言葉は相応しくなく,せいぜい「合理的」と言うところだろう。

プレーヤー \(A\) は,\(b_2 = 3\) を攻撃することもできる。しかし,最終的な結果は \(b_1 = 7\) を攻撃した場合に劣るので,これは合理的な選択ではない。

価値関数の値は,都市の価値の合計のみで決まり( \(b_1+b_2\) の値のみで決まり),その価値がどのように分割されているか(\(b_1\) と \(b_2\) への分け方)とは無関係である。

  • \(A\) は,「最終的全面攻撃」以外にも部分的な攻撃を行うことが可能であり,\(b_1,b_2\) は,\(A\) が行うことが可能な部分的攻撃を規定している。
  • \(B\) は,\(A\) への攻撃として,「最終的全面攻撃」以外の手段を持たない。
このことが,\(B\) が攻撃を受けてしまう結果をもたらしている。

Example 2 は「戦術核兵器が必要となる理由を説明している」と言いたいところだが,戦術核兵器の存在理由は,「都市ではなく軍事施設への攻撃」というプロトコルに関わる要因が強いのだろう。 核の使用に絡むこの 都市と軍事施設の区別(という相互理解?) があるからこそ,「部分的攻撃」ではなく「限定的攻撃」と言うのだろが,本当のところ,この区別はかなり危うい。

プレーヤー \(B\) は 「\(A\) の攻撃に先立って」自国の都市 \(b_2 = 3\) を消滅させてしまった方が,良い結果が得られる とも考えられる。ただし,このゲームでは, 攻撃は相手の都市に対してのみ行える としているので,この選択は不可能。

それ以前に,ゲームの規則が有ろうと無かろうと,そのような選択は実行不可能なのだろうが。

Example 2 の結論は非常識なのだが,その点については今は触れず,後に回すことにする。

望ましい状況

純理論としてのゲームに戻る。

この辺りまで来ると,これだけの「ゲームの規則」だけで「合理的判断」が定められているとして良いものなのか,かなり濃厚な疑惑の香りが漂ってくる。

結論を言うと,ゲームの規則が不足している。しかし,ゲームの規則を付け足す前に,もうひとつの例で,相互確証攻撃による均衡の「望ましい状況」に戻っておこう。

Example 3. \(m=n=2,\,\, k = 0.2,\, \ell = 0.3,\,\, a_1 = 8, a_2 = 5,\,\, b_1 = 7, b_2 = 3\) とする。つまり, $$ \vec{a} = (8,5),\,\vec{b} = (7,3). $$ であり,また,まとめて, $$ \begin{pmatrix} 8 & 5\\ 7 & 3 \end{pmatrix} $$ と表しても良いことにする。 まず,初期状態では,価値関数の値は $$ \begin{gather*} \varphi_A = (8+5)-0.2\times (7+3) = 11.0\\ \varphi_B = (7+3)-0.3\times (8+4) = 6.4 \end{gather*} $$ であり,両者共に正の値なので,プレーヤーが合理的に行動する限り,相互の全滅を選ぶことは,あり得ない。

また, $$ \begin{gather*} 8-0.2\times 7 = 6.6 > 0, \quad 8-0.2\times 3 = 7.4 > 0\\ 5-0.2\times 7 = 3.6 > 0, \quad 5-0.2\times 3 = 4.4 > 0\\ 7-0.3\times 8 = 4.6 > 0, \quad 7-0.3\times 5 = 5.5 > 0\\ 3-0.3\times 8 = 0.6 > 0, \quad 3-0.3\times 5 = 1.5 > 0 \end{gather*} $$ なので,互いに都市が一つだけ残っている状態では,これ以上の攻撃はしないことが合理的。

したがって,どちらか一方は \(2\) 都市が残存,もう一方は \(1\) 都市のみ残っている場合(一方のみが攻撃を受け一つの都市を失っている場合),あたかも報復攻撃をしているかのように,相手の都市をひとつだけ,しかも,価値の高い方の都市を,それ以上の「報復攻撃」を受ける心配なしに消去することができる。

その結果,
  1. プレーヤー \(A\) が \(b_1=7,\,b_2=3\) のどちらを攻撃しても(値を零に変えても),プレーヤー \(B\) は \(a_1=8\) を零に変えることになり,価値関数 \(\varphi_A\) の値は $$ 5-0.2\times 7 = 3.6,\quad 5-0.2\times 3 = 4.4 $$ のいずれか。しかし,どちらも初期状態での \(\varphi_A\) の値 \(11.0\) の値よりも小さく,\(A\) にとって好ましい結果ではない。
  2. プレーヤー \(B\) が \(a_1=8,\,a_2=5\) のどちらを攻撃しても,プレーヤー \(A\) は \(b_1=7\) を零に変えることになり,価値関数 \(\varphi_B\) の値は $$ 3-0.3\times 8 = 0.6,\quad 3-0.3\times 5 = 1.5 $$ のいずれか。しかし,どちらも初期状態での \(\varphi_B\) の値 \(6.4\) の値よりも小さく,\(B\) にとって好ましい結果ではない。
したがって,攻撃は,どちらのプレーヤーにとっても合理的な選択ではなく,初期状態は維持される。

解析は多少は長くなっているのだが,平和な均衡が保障されていることは確認できた。