攻撃が確証されている世界を想定しているので,軍事力の増加や壊滅を考える必要はない。ここでは,軍事力の最終的価値は相手の都市を壊滅させることのみにある,と考えている。相手の軍事力を部分的に壊滅させても(例えば,通常戦力を壊滅させたり,味方の軍事基地に対する攻撃力を削ぐことができたとしても),味方の都市に対しての攻撃能力を完全に削がない限り,意味がないとしている。そのような攻撃を行ったところで,メリットがあるどころか,相手の\(k\) (もしくは \(\ell\) )の値を増加させ都市攻撃を「合理的」に選択させてしまう結果に繋がりそうなのだ。なお,都市の価値については,都市の成長や衰退などの長期的時間変化は考えていない。
ゲームの説明
最初に,合理的ということの意味が,定義せずとも明らかであるかのように見える簡単なケースを分析する。その上で,有限性を導入して,再帰的に合理的行動を定義し,ゲームの規則を確定させる。
実際にこのようにしてみると,これ程までに単純化したゲームにおいても, 相互に合理的に行動する という概念自体の,扱いづらさが明らかになると思う。
設定
- [プレーヤー] プレーヤーは \(A\) と \(B\) の\(2\) 名。
- [価値関数] 価値関数を以下のように与える:
- 初期状態では,プレーヤー\(A\), \(B\) は,それぞれ,いくつかの(もちろん有限個の)「都市」 を所有している。
- 各都市には,それぞれ,価値を表す数値が与えられている(負の値でない実数値だが,零でも良い)。この値を,まとめて, $$ \begin{gather*} \vec{a} = (a_1,a_2,\ldots,a_m)\\ \vec{b} = (b_1,b_2,\ldots,b_n) \end{gather*} $$ と表す。
-
プレーヤー \(A,B\) は, - 自分の都市の価値合計は大きいほど好ましく,
- 相手の都市の価値合計は小さいほど好ましい
- [確証的な攻撃] プレーヤー \(A,B\) は,相手の都市のいくつか(すべてでも良い)を消滅させることができる。零個の都市に対する攻撃をパスと言うことにする。プレーヤーは,攻撃をせずにパスを選択することもできる。攻撃は,何回でも行うことができる(ただし,相手の都市がまだ残っていればだが)。また,消滅した都市は,復活しない。
- [最終的な目的] プレーヤー \(A,B\) は,相互の攻撃の結果として決まる,自身の価値関数の最終的値が最大になるように,合理的に行動する。
このゲームでは,プレーヤーの目的は,相手に勝つことではなく,自身の価値関数を最大にすることであることに注意。 また,プレーヤー \(A,B\) は, 相手も自身の価値関数を最大にするために合理的に行動する として相手の行動を推論し,自身の行動を決定する。相手が,非合理な行動(例えば復讐心による選択)とか,能力の欠如による判断ミスはしないと仮定している。
簡単な状況
実は,例えばプレーヤー \(A\) が, 相手(この場合はプレーヤー \(B\) )も合理的に行動するとして相手の行動を推論し,自身の行動を決定する という想定は,相手(プレーヤー \(B\) )もまた,この「自身の行動を決定する」ときに(プレーヤー \(A\) が)決定した行動を推論して行動を決定するので,すでに自己言及のパラドックスに接触している。
したがって,これでは「合理的な判断に基づく行動」が定義されていることにはならないのだが,簡単な状況では,「合理的判断」らしきものが観察される。
要点は,
ひとつの都市に対しての攻撃は,完全にその価値を零に変えてしまう。例えばその価値を半減させるような部分的な攻撃は,行えないということである。したがって,例えばプレーヤー \(A\) が攻撃を選択すると,プレーヤー \(B\) のただ一つの都市の価値 \(b_1\) を \(0\) に変えてしまうことになり,\(\varphi_B = 0 - \ell a_1 < 0\) となってしまう。こうなると,プレーヤー \(B\) も攻撃を選択することになり,相互の攻撃により両者の価値関数の値は共に零になってしまう。両者共に「相互確証攻撃による安全保障」に安住していれば価値関数の値は正だったのだから,攻撃は合理的でない。
\(\varphi_B(\vec{a},\vec{b})\)のように関数の引数を書くのは煩わしいので,省略して \(\varphi_B\) と表した。これは,その時点での \(\varphi_B\) の値であり,引数が攻撃により変化すると,それに依存して値は変わる。
互いに攻撃を選択しないことが合理的な場合, \( a_1 > kb_1 > k(\ell a_1) \) となるので不等式 \(k\ell <1\) が成り立つ。\(k\ell > 1\) の場合,「相互核抑止」は成立しない。
簡単だが異常な状況
Example 1 は「相互核抑止」の原形なのだろうが,プレーヤーが完全に合理的に振る舞うと決めてしまっているゲームの世界は,次の例が示すように,身も蓋もない。
Example 2. 具体的に数値を決めてしまうことにする。\(m=1, n=2\) で,\(k=0.2, \ell=0.3\) とする。さらに, \(a_1=5\), \(b_1 = 7, b_2 = 3\) とする。このとき,初期状態では $$ \begin{gather} \varphi_A = 5 - 0.2\times (7+3) = 3.0\\ \varphi_B = (7+3) - 0.3\times 5 = 8.5 \end{gather} $$ であり,価値関数の値は,両者共に正の値。したがって,これで満足しても平和なのだが,プレーヤー \(A\) の「合理的選択」は,\(b_1 = 7\) を攻撃して\(b_1 = 0\) に変えることなのだ(ひどい話しだが)。その結果 $$ \begin{gather} \varphi_A = 5 - 0.2\times 3 = 4.4\\ \varphi_B = (0+3) - 0.3\times 5 = 1.5 \end{gather} $$ であり,Example \(1\)での「相互確証攻撃による安全保障」が成立している状況に変わる。したがって,
プレーヤー \(A\) は,安心して(プレーヤー \(B\) の限りなき合理性を信頼して)攻撃を選ぶことができる。とんでもない話なのだが,攻撃を受けてしまった後の状況では,報復攻撃は互いの不幸を大きくするだけで,愚かな感情的行動に過ぎない。それならば,あらかじめ 攻撃を受けたら必ず報復します と宣言しておけば良さそうなものだが,プレーヤー \(A\) はその宣言は謹んで拝聴しておいた上で,平然と攻撃をすることになる。プレーヤー \(B\) にとって,攻撃を受けてしまった状況では,もはや宣言を実行することは結果を悪化させるだけなのだ。プレーヤー \(B\) の理性を全面的に信頼することにしよう。
要するに,このゲームは,神々のような理性を前提としたゲームとして設定されているのだ。
しかし,これを「理性」といって良いものなのだろうか。攻撃を受けた惨状を目前にして,より結果を悪化させないことのみを考慮するのは,理性なのだろうか。ましてや,相手の理性につけ込むことは,理性なのだろうか。おそらく,「理性」という言葉は相応しくなく,せいぜい「合理的」と言うところだろう。
プレーヤー \(A\) は,\(b_2 = 3\) を攻撃することもできる。しかし,最終的な結果は \(b_1 = 7\) を攻撃した場合に劣るので,これは合理的な選択ではない。
価値関数の値は,都市の価値の合計のみで決まり( \(b_1+b_2\) の値のみで決まり),その価値がどのように分割されているか(\(b_1\) と \(b_2\) への分け方)とは無関係である。
- \(A\) は,「最終的全面攻撃」以外にも部分的な攻撃を行うことが可能であり,\(b_1,b_2\) は,\(A\) が行うことが可能な部分的攻撃を規定している。
- \(B\) は,\(A\) への攻撃として,「最終的全面攻撃」以外の手段を持たない。
Example 2 は「戦術核兵器が必要となる理由を説明している」と言いたいところだが,戦術核兵器の存在理由は,「都市ではなく軍事施設への攻撃」というプロトコルに関わる要因が強いのだろう。 核の使用に絡むこの 都市と軍事施設の区別(という相互理解?) があるからこそ,「部分的攻撃」ではなく「限定的攻撃」と言うのだろが,本当のところ,この区別はかなり危うい。
プレーヤー \(B\) は 「\(A\) の攻撃に先立って」自国の都市 \(b_2 = 3\) を消滅させてしまった方が,良い結果が得られる とも考えられる。ただし,このゲームでは, 攻撃は相手の都市に対してのみ行える としているので,この選択は不可能。
それ以前に,ゲームの規則が有ろうと無かろうと,そのような選択は実行不可能なのだろうが。
Example 2 の結論は非常識なのだが,その点については今は触れず,後に回すことにする。
望ましい状況
純理論としてのゲームに戻る。
この辺りまで来ると,これだけの「ゲームの規則」だけで「合理的判断」が定められているとして良いものなのか,かなり濃厚な疑惑の香りが漂ってくる。
結論を言うと,ゲームの規則が不足している。しかし,ゲームの規則を付け足す前に,もうひとつの例で,相互確証攻撃による均衡の「望ましい状況」に戻っておこう。
Example 3. \(m=n=2,\,\, k = 0.2,\, \ell = 0.3,\,\, a_1 = 8, a_2 = 5,\,\, b_1 = 7, b_2 = 3\) とする。つまり, $$ \vec{a} = (8,5),\,\vec{b} = (7,3). $$ であり,また,まとめて, $$ \begin{pmatrix} 8 & 5\\ 7 & 3 \end{pmatrix} $$ と表しても良いことにする。 まず,初期状態では,価値関数の値は $$ \begin{gather*} \varphi_A = (8+5)-0.2\times (7+3) = 11.0\\ \varphi_B = (7+3)-0.3\times (8+4) = 6.4 \end{gather*} $$ であり,両者共に正の値なので,プレーヤーが合理的に行動する限り,相互の全滅を選ぶことは,あり得ない。
また, $$ \begin{gather*} 8-0.2\times 7 = 6.6 > 0, \quad 8-0.2\times 3 = 7.4 > 0\\ 5-0.2\times 7 = 3.6 > 0, \quad 5-0.2\times 3 = 4.4 > 0\\ 7-0.3\times 8 = 4.6 > 0, \quad 7-0.3\times 5 = 5.5 > 0\\ 3-0.3\times 8 = 0.6 > 0, \quad 3-0.3\times 5 = 1.5 > 0 \end{gather*} $$ なので,互いに都市が一つだけ残っている状態では,これ以上の攻撃はしないことが合理的。
したがって,どちらか一方は \(2\) 都市が残存,もう一方は \(1\) 都市のみ残っている場合(一方のみが攻撃を受け一つの都市を失っている場合),あたかも報復攻撃をしているかのように,相手の都市をひとつだけ,しかも,価値の高い方の都市を,それ以上の「報復攻撃」を受ける心配なしに消去することができる。
したがって,攻撃は,どちらのプレーヤーにとっても合理的な選択ではなく,初期状態は維持される。
解析は多少は長くなっているのだが,平和な均衡が保障されていることは確認できた。