ゲームの説明

最初に，合理的ということの意味が，定義せずとも明らかであるかのように見える簡単なケースを分析する。その上で，有限性を導入して，再帰的に合理的行動を定義し，ゲームの規則を確定させる。

実際にこのようにしてみると，これ程までに単純化したゲームにおいても，相互に合理的に行動するという概念自体の，扱いづらさが明らかになると思う。

設定

[プレーヤー] 　プレーヤーは $A$ と $B$ の$2$ 名。
[価値関数] 　価値関数を以下のように与える：
1. 初期状態では，プレーヤー$A$, $B$ は，それぞれ，いくつかの（もちろん有限個の）「都市」を所有している。
2. 各都市には，それぞれ，価値を表す数値が与えられている（負の値でない実数値だが，零でも良い）。この値を，まとめて， $$ \begin{gather*} \vec{a} = (a_1,a_2,\ldots,a_m)\\ \vec{b} = (b_1,b_2,\ldots,b_n) \end{gather*} $$ と表す。
3. プレーヤー $A,B$ は，
  - 自分の都市の価値合計は大きいほど好ましく，
  - 相手の都市の価値合計は小さいほど好ましい
  と考え，それぞれ，相手の都市の価値（の合計）をどの程度嫌っているかを表す固定された定数 $k,\ell$ を持つ。それにより，プレーヤー $A,B$ に対して，価値関数 $$ \begin{gather*} \varphi_A(\vec{a},\vec{b}) = a_1+a_2+\cdots+a_m - k(b_1+b_2+\dots+b_n)\\ \varphi_B(\vec{a},\vec{b}) = b_1+b_2+\cdots+b_n - \ell(a_1+a_2+\cdots+a_m) \end{gather*} $$ が定められる。
[確証的な攻撃] プレーヤー $A,B$ は，相手の都市のいくつか（すべてでも良い）を消滅させることができる。零個の都市に対する攻撃をパスと言うことにする。プレーヤーは，攻撃をせずにパスを選択することもできる。攻撃は，何回でも行うことができる（ただし，相手の都市がまだ残っていればだが）。また，消滅した都市は，復活しない。
[最終的な目的] プレーヤー $A,B$ は，相互の攻撃の結果として決まる，自身の価値関数の最終的値が最大になるように，合理的に行動する。

このゲームでは，プレーヤーの目的は，相手に勝つことではなく，自身の価値関数を最大にすることであることに注意。また，プレーヤー $A,B$ は，相手も自身の価値関数を最大にするために合理的に行動するとして相手の行動を推論し，自身の行動を決定する。相手が，非合理な行動（例えば復讐心による選択）とか，能力の欠如による判断ミスはしないと仮定している。

攻撃が確証されている世界を想定しているので，軍事力の増加や壊滅を考える必要はない。ここでは，軍事力の最終的価値は相手の都市を壊滅させることのみにある，と考えている。相手の軍事力を部分的に壊滅させても（例えば，通常戦力を壊滅させたり，味方の軍事基地に対する攻撃力を削ぐことができたとしても），味方の都市に対しての攻撃能力を完全に削がない限り，意味がないとしている。そのような攻撃を行ったところで，メリットがあるどころか，相手の$k$ （もしくは $\ell$ ）の値を増加させ都市攻撃を「合理的」に選択させてしまう結果に繋がりそうなのだ。なお，都市の価値については，都市の成長や衰退などの長期的時間変化は考えていない。

簡単な状況

実は，例えばプレーヤー $A$ が，相手（この場合はプレーヤー $B$ ）も合理的に行動するとして相手の行動を推論し，自身の行動を決定するという想定は，相手（プレーヤー $B$ ）もまた，この「自身の行動を決定する」ときに（プレーヤー $A$ が）決定した行動を推論して行動を決定するので，すでに自己言及のパラドックスに接触している。

したがって，これでは「合理的な判断に基づく行動」が定義されていることにはならないのだが，簡単な状況では，「合理的判断」らしきものが観察される。

Example 1. $m=n=1$ とする。この場合，$\vec{a} = (a_1),\quad \vec{b} = (b_1)$ であり（一つの数値に括弧をつけるのは見かけが悪いのだが，やむを得ない）， $$ \varphi_A(\vec{a},\vec{b})= a_1 - kb_1,\quad \varphi_B(\vec{a},\vec{b}) = b_1 - \ell a_1 $$ なので，条件 $$ a_1 > kb_1,\quad b_1 > \ell a_1 $$ が満たされている限りでは，攻撃を行わないことが合理的である。

要点は，

ひとつの都市に対しての攻撃は，完全にその価値を零に変えてしまう。例えばその価値を半減させるような部分的な攻撃は，行えない

ということである。したがって，例えばプレーヤー $A$ が攻撃を選択すると，プレーヤー $B$ のただ一つの都市の価値 $b_1$ を $0$ に変えてしまうことになり，$\varphi_B = 0 - \ell a_1 < 0$ となってしまう。こうなると，プレーヤー $B$ も攻撃を選択することになり，相互の攻撃により両者の価値関数の値は共に零になってしまう。両者共に「相互確証攻撃による安全保障」に安住していれば価値関数の値は正だったのだから，攻撃は合理的でない。

$\varphi_B(\vec{a},\vec{b})$のように関数の引数を書くのは煩わしいので，省略して $\varphi_B$ と表した。これは，その時点での $\varphi_B$ の値であり，引数が攻撃により変化すると，それに依存して値は変わる。

互いに攻撃を選択しないことが合理的な場合， $ a_1 > kb_1 > k(\ell a_1) $ となるので不等式 $k\ell <1$ が成り立つ。$k\ell > 1$ の場合，「相互核抑止」は成立しない。

簡単だが異常な状況

Example 1 は「相互核抑止」の原形なのだろうが，プレーヤーが完全に合理的に振る舞うと決めてしまっているゲームの世界は，次の例が示すように，身も蓋もない。

Example 2. 具体的に数値を決めてしまうことにする。$m=1, n=2$ で，$k=0.2, \ell=0.3$ とする。さらに， $a_1=5$, $b_1 = 7, b_2 = 3$ とする。このとき，初期状態では $$ \begin{gather} \varphi_A = 5 - 0.2\times (7+3) = 3.0\\ \varphi_B = (7+3) - 0.3\times 5 = 8.5 \end{gather} $$ であり，価値関数の値は，両者共に正の値。したがって，これで満足しても平和なのだが，プレーヤー $A$ の「合理的選択」は，$b_1 = 7$ を攻撃して$b_1 = 0$ に変えることなのだ（ひどい話しだが）。その結果 $$ \begin{gather} \varphi_A = 5 - 0.2\times 3 = 4.4\\ \varphi_B = (0+3) - 0.3\times 5 = 1.5 \end{gather} $$ であり，Example $1$での「相互確証攻撃による安全保障」が成立している状況に変わる。したがって，

プレーヤー $A$ は，安心して（プレーヤー $B$ の限りなき合理性を信頼して）攻撃を選ぶことができる。

とんでもない話なのだが，攻撃を受けてしまった後の状況では，報復攻撃は互いの不幸を大きくするだけで，愚かな感情的行動に過ぎない。それならば，あらかじめ攻撃を受けたら必ず報復しますと宣言しておけば良さそうなものだが，プレーヤー $A$ はその宣言は謹んで拝聴しておいた上で，平然と攻撃をすることになる。プレーヤー $B$ にとって，攻撃を受けてしまった状況では，もはや宣言を実行することは結果を悪化させるだけなのだ。プレーヤー $B$ の理性を全面的に信頼することにしよう。

要するに，このゲームは，神々のような理性を前提としたゲームとして設定されているのだ。

しかし，これを「理性」といって良いものなのだろうか。攻撃を受けた惨状を目前にして，より結果を悪化させないことのみを考慮するのは，理性なのだろうか。ましてや，相手の理性につけ込むことは，理性なのだろうか。おそらく，「理性」という言葉は相応しくなく，せいぜい「合理的」と言うところだろう。

プレーヤー $A$ は，$b_2 = 3$ を攻撃することもできる。しかし，最終的な結果は $b_1 = 7$ を攻撃した場合に劣るので，これは合理的な選択ではない。

価値関数の値は，都市の価値の合計のみで決まり（ $b_1+b_2$ の値のみで決まり），その価値がどのように分割されているか（$b_1$ と $b_2$ への分け方）とは無関係である。

$A$ は，「最終的全面攻撃」以外にも部分的な攻撃を行うことが可能であり，$b_1,b_2$ は，$A$ が行うことが可能な部分的攻撃を規定している。
$B$ は，$A$ への攻撃として，「最終的全面攻撃」以外の手段を持たない。

このことが，$B$ が攻撃を受けてしまう結果をもたらしている。

Example 2 は「戦術核兵器が必要となる理由を説明している」と言いたいところだが，戦術核兵器の存在理由は，「都市ではなく軍事施設への攻撃」というプロトコルに関わる要因が強いのだろう。核の使用に絡むこの都市と軍事施設の区別（という相互理解？）があるからこそ，「部分的攻撃」ではなく「限定的攻撃」と言うのだろが，本当のところ，この区別はかなり危うい。

プレーヤー $B$ は「$A$ の攻撃に先立って」自国の都市 $b_2 = 3$ を消滅させてしまった方が，良い結果が得られるとも考えられる。ただし，このゲームでは，攻撃は相手の都市に対してのみ行えるとしているので，この選択は不可能。

それ以前に，ゲームの規則が有ろうと無かろうと，そのような選択は実行不可能なのだろうが。

Example 2 の結論は非常識なのだが，その点については今は触れず，後に回すことにする。

望ましい状況

純理論としてのゲームに戻る。

この辺りまで来ると，これだけの「ゲームの規則」だけで「合理的判断」が定められているとして良いものなのか，かなり濃厚な疑惑の香りが漂ってくる。

結論を言うと，ゲームの規則が不足している。しかし，ゲームの規則を付け足す前に，もうひとつの例で，相互確証攻撃による均衡の「望ましい状況」に戻っておこう。

Example 3. $m=n=2,\,\, k = 0.2,\, \ell = 0.3,\,\, a_1 = 8, a_2 = 5,\,\, b_1 = 7, b_2 = 3$ とする。つまり， $$ \vec{a} = (8,5),\,\vec{b} = (7,3). $$ であり，また，まとめて， $$ \begin{pmatrix} 8 & 5\\ 7 & 3 \end{pmatrix} $$ と表しても良いことにする。まず，初期状態では，価値関数の値は $$ \begin{gather*} \varphi_A = (8+5)-0.2\times (7+3) = 11.0\\ \varphi_B = (7+3)-0.3\times (8+4) = 6.4 \end{gather*} $$ であり，両者共に正の値なので，プレーヤーが合理的に行動する限り，相互の全滅を選ぶことは，あり得ない。

また， $$ \begin{gather*} 8-0.2\times 7 = 6.6 > 0, \quad 8-0.2\times 3 = 7.4 > 0\\ 5-0.2\times 7 = 3.6 > 0, \quad 5-0.2\times 3 = 4.4 > 0\\ 7-0.3\times 8 = 4.6 > 0, \quad 7-0.3\times 5 = 5.5 > 0\\ 3-0.3\times 8 = 0.6 > 0, \quad 3-0.3\times 5 = 1.5 > 0 \end{gather*} $$ なので，互いに都市が一つだけ残っている状態では，これ以上の攻撃はしないことが合理的。

したがって，どちらか一方は $2$ 都市が残存，もう一方は $1$ 都市のみ残っている場合（一方のみが攻撃を受け一つの都市を失っている場合），あたかも報復攻撃をしているかのように，相手の都市をひとつだけ，しかも，価値の高い方の都市を，それ以上の「報復攻撃」を受ける心配なしに消去することができる。

その結果，

プレーヤー $A$ が $b_1=7,\,b_2=3$ のどちらを攻撃しても（値を零に変えても），プレーヤー $B$ は $a_1=8$ を零に変えることになり，価値関数 $\varphi_A$ の値は $$ 5-0.2\times 7 = 3.6,\quad 5-0.2\times 3 = 4.4 $$ のいずれか。しかし，どちらも初期状態での $\varphi_A$ の値 $11.0$ の値よりも小さく，$A$ にとって好ましい結果ではない。
プレーヤー $B$ が $a_1=8,\,a_2=5$ のどちらを攻撃しても，プレーヤー $A$ は $b_1=7$ を零に変えることになり，価値関数 $\varphi_B$ の値は $$ 3-0.3\times 8 = 0.6,\quad 3-0.3\times 5 = 1.5 $$ のいずれか。しかし，どちらも初期状態での $\varphi_B$ の値 $6.4$ の値よりも小さく，$B$ にとって好ましい結果ではない。

したがって，攻撃は，どちらのプレーヤーにとっても合理的な選択ではなく，初期状態は維持される。

解析は多少は長くなっているのだが，平和な均衡が保障されていることは確認できた。