ゲームとしての相互確証破壊: \(p\) の値の問題

\(p\) の値の問題

\(p=2\) と \(p=3\) の違い

ここまでの例では,連続パスの制限回数 \(p\) は本質的でなく,また,パスを \(2\) 回続けると同じ手番で元の配置に戻っているので, \(p=2\) と \(p=3\) の違いはないように思える。しかし, \(p=2\) の場合には,パスを選んだプレーヤーは,相手にパスを選んでゲームを終了させる権利を与えてしまう。

パスが \(2\) 度続くと,もとの状態に戻っているように見えるのだが,最初は \(j=0\) であった状態が \(j=2\) に変わっているのであり,同じ状態ではない。

極端な微調整を避けるために,\(k,\ell\) の値は \(k = \ell = 0.8\) とかなり大きな値を指定し, 初期状態での配列が $$ I = \begin{pmatrix} 8.4 & 8.3 & 1.5\\ 11.0 & 5.4 & 5.2 \end{pmatrix} $$ であるゲームの帰結を調べる。

記述を短くするための表現するために「対抗できる」という用語を用いる。定義はしないが,文脈から意味が分かると思う。

安定な配列

指数が小さなものから,安定な配列となる可能性を調べる。

指数が \(1\)

\(\vec{a}\) もしくは \(\vec{b}\) の指数が \(1\) の場合について,準安定な配列を調べる。

  1. \(a_1,a_2,a_3\) の一つしか残存していないならば,\(DSP\):
    1. \(a_3=1.5\) のみ残存の場合,\(1.5\) 単独では最小の \(b_3=5.2\) にも対抗できない( \(1.5 - k\times 5.2 > 0\) とならない)ことから明らか。
    2. \(a_1=8.4\), もしくは,\(a_2=8.3\) のみが残存の場合,
      1. 単独では \(b_1=11.0\) には対抗できないので,\(b_1\) は消滅させる必要がある。
      2. 一方,\(b_2=5.4\), \(b_3=5.2\) 単独では,\(a_1, a_2\) のいずれにも対抗できないので,\(EX\) を避けるためには \(b_2,\, b_3\) の両方が残存している必要がある。しかし,
      3. \(b_2+b_3 = 10.6\) には \(a_1,\, a_2\) 単独では対抗できないので,
      この場合も \(DSP\)
  2. \(b_2\) だけ残存,もしくは,\(b_3\) だけ残存の場合,\(DSP\);
    1. \(b_2=5.4,\,b_3=5.2\) はいずれも,単独では \(a_1=8.4,a_2=8.3\) にどちらにも対抗できないので, \(a_1\) と \(a_2\) は消滅している必要がある。
    2. したがって,\(a_3\) が一つだけ残存ということになるが,それは \(DSP\)
  3. \(b_1\) のみが残存しているケース: \(b_1=11.0\) は,\(a_1+a_2 = 16.7\) には対抗できないが,\(a_1+a_3,\, a_2+a_3\) には対抗できる。 $$ S_5 = \begin{pmatrix} 8.4 & 0 & 1.5\\ 11.0 & 0 & 0 \end{pmatrix} ,\qquad S_6 = \begin{pmatrix} 0 & 8.3 & 1.5\\ 11.0 & 0 & 0 \end{pmatrix} $$ これ以上の攻撃をすると \(DSP\) になることが確かめられているので( \(a_1,a_2,a_3\) の一つだけ残存は \(DSP\) ),\(S_5\) と \(S_6\) は安定。

以上により,\(\vec{a}\) もしくは \(\vec{b}\) の指数が \(1\) の配列では,準安定なものは \(S_5\) と \(S_6\) のみであり,これらは安定。変則的な添え字を付けているが,これは,後で最終的価値関数の値を比較しやすくするため。

指数が \(2\)

次に,\(\vec{a}\) の指数が \(2\) の場合について調べる。

  1. \(a_2, a_3\) が残存の場合; \(a_2+a_3 = 9.8\) は,\(b_2+b_3 = 10.6,\, b_1 = 11.0\) には対抗できるが,\(b_1+b_2,b_1+b_3,b_1+b_2+b_3\) には対抗できない。\(b_2,\, b_3\) 単独は \(DSP\) となることが既に示されているので,準安定なケースの可能性は, $$ S_4 = \begin{pmatrix} 0 & 8.3 & 1.5\\ 0 & 5.4 & 5.2 \end{pmatrix} $$ と,既出の \(S_6\) のみ。また,\(a_2,a_3,b_2,b_3\) のうちの単独では \(DSP\) であることから,\(S_4\) は安定。
  2. \(a_1,a_3\) が残存の場合も,同様に考えて,準安定なケースは $$ S_3 = \begin{pmatrix} 8.4 & 0 & 1.5\\ 0 & 5.4 & 5.2 \end{pmatrix} $$ と既出の \(S_5\) のみであり,\(S_5\) は安定。
  3. \(a_1,a_2\) が残存の場合,\(b_1=11.0\) 単独では \(a_1+a_2=16.7\) に対抗できず,また,\(b_2+b_3=10.6\) でも対抗できない。一方,\(b_1+b_2+b_3= 21.6\) には,\(a_1+a_2=16.7\) は対抗できない。したがって,準安定となる可能性があるのは, $$ S_1 = \begin{pmatrix} 8.4 & 8.3 & 0\\ 11.0 & 0 & 5.2 \end{pmatrix}, \qquad S_2 = \begin{pmatrix} 8.4 & 8.3 & 0\\ 11.0 & 5.4 & 0 \end{pmatrix} $$ のみ。\(S_1\) と \(S_2\) が安定であることも,指数 \(1\) で \(DSP\) でない場合の分析から明らか。

これら安定な状態,\(S_1,\ldots,S_6\) と,初期状態 $$ I = \begin{pmatrix} 8.4 & 8.3 & 1.5\\ 11.0 & 5.4 & 5.2 \end{pmatrix} $$ のそれぞれについて,\(\varphi_A\) と \(\varphi_B\) の値を計算しておく:

   \(\varphi_A\)    \(\varphi_B\)
\(S_1\) \(3.74\) \(2.84\)
\(S_2\) \(3.58\) \(3.04\)
\(S_3\) \(1.42\) \(2.68\)
\(S_4\) \(1.32\) \(2.76\)
\(S_5\) \(1.10\) \(3.08\)
\(S_6\) \(1.00\) \(3.16\)
\(I\) \(0.92\) \(7.04\)

初期状態は,プレーヤー \(B\) にとって最も好ましいのだが, \(A\) にとっては,\(S_1,\ldots,S_6\) のいずれにも劣ることに注意。

どれか一つが消滅

ここまでで得た安定な配列 $$ \begin{gather*} S_1 = \begin{pmatrix} 8.4 & 8.3 & 0\\ 11.0 & 0 & 5.2 \end{pmatrix}, \qquad S_2 = \begin{pmatrix} 8.4 & 8.3 & 0\\ 11.0 & 5.4 & 0 \end{pmatrix}. \qquad S_3 = \begin{pmatrix} 8.4 & 0 & 1.5\\ 0 & 5.4 & 5.2 \end{pmatrix} \\ S_4 = \begin{pmatrix} 0 & 8.3 & 1.5\\ 0 & 5.4 & 5.2 \end{pmatrix}, \qquad S_5 = \begin{pmatrix} 8.4 & 0 & 1.5\\ 11.0 & 0 & 0 \end{pmatrix}, \qquad S_6 = \begin{pmatrix} 0 & 8.3 & 1.5\\ 11.0 & 0 & 0 \end{pmatrix} \end{gather*} $$ を手がかりに, \(\vec{a}\) もしくは \(\vec{b}\) どちらか一方の指数が \(3\) の配列 \(A_1,A_2,A_3\) と \(B_1,B_2,B_3\) について調べる:

$$ \begin{gather*} A_1 = \begin{pmatrix} 0 & 8.3 & 1.5\\ 11.0 & 5.4 & 5.2 \end{pmatrix},\quad A_2 = \begin{pmatrix} 8.4 & 0 & 1.5\\ 11.0 & 5.4 & 5.2 \end{pmatrix},\quad A_3 = \begin{pmatrix} 8.4 & 8.3 & 0\\ 11.0 & 5.4 & 5.2 \end{pmatrix}\\ B_1 = \begin{pmatrix} 8.4 & 8.3 & 1.5\\ 0 & 5.4 & 5.2 \end{pmatrix},\quad B_2 = \begin{pmatrix} 8.4 & 8.3 & 1.5\\ 11.0 & 0 & 5.2 \end{pmatrix},\quad B_3 = \begin{pmatrix} 8.4 & 8.3 & 1.5\\ 11.0 & 5.4 & 0 \end{pmatrix} \end{gather*} $$

これらの配列がゲームの途中で最初に現れた時点での状態では,\(j=0\) であり,

  • \(A_1,A_2,A_3\) はプレーヤー \(B\) の攻撃によってのみ生じるので,手番は \(A\)
  • \(B_1,B_2,B_3\) はプレーヤー \(A\) の攻撃によってのみ生じるので,手番は \(B\)
となっている。

\(B_1,B_2,B_3\) について

\(DSP\) を避けたいプレーヤー \(B\) は, \(A\) の都市をひとつだけしか攻撃できない。
  • 状態 \({}^{B}_{0}{B_1}\) において,プレーヤー \(B\) が \(a_1 = 8.4\),もしくは,\(a_2=8.3\) を攻撃しても,結果は安定。プレーヤー \(B\) はより効果の大きな \(a_1=8.4\) を攻撃することを選ぶので,帰結は安定な配列 \(S_4\) であり,\(\varphi^{fl}_A = 1.32\).
  • 状態 \({}^{B}_{0}{B_2}\) において,プレーヤー \(B\) は,
    • \(a_3 = 1.5\) を攻撃すると,結果は安定な配列 \(S_1\) であり,\(\varphi^{fl}_B = 2.84\).
    • \(a_1 = 8.4\) を攻撃すると,この場合,プレーヤー \(A\) は \(b_3\) を攻撃して安定な配列 \(S_6\) に至ることを選ぶので,\(\varphi^{fl}_B = 3.16\).
    • \(a_2 = 8.3\) を攻撃した場合も同様で,帰結は \(S_5\) で,\(\varphi^{fl}_B = 3.08\).
    プレーヤー \(B\) は,\(2.84,\,3.16,\,3.08\) を比較して \(a_1\) を攻撃することを選ぶ。したがって,帰結は \(S_6\) であり,\(\varphi^{fl}_A = 1.00\).
  • 状態 \({}^{B}_{0}{B_3}\) の場合も,プレーヤー \(B\) は \(a_1\) を攻撃することになり,\({}^{B}_{0}{B_2}\) と同じ帰結となる。\(\varphi^{fl}_A = 1.00\).

以上により,状態 \({}^{B}_{0}{B_1},\, {}^{B}_{0}{B_2},\, {}^{B}_{0}{B_3}\) はいずれも安定ではなく,帰結は, \({}^{B}_{0}{B_1}\) からの帰結は \(S_4\),   \({}^{B}_{0}{B_2}\) と \({}^{B}_{0}{B_3}\) からの帰結は \(S_6\) ということがわかった。

プレーヤー \(A\) にとって最も好ましい帰結は,\(S_4\) と\(S_6\) の価値関数 \(1.32,\,1.00\) を比較して, \({}^{B}_{0}{B_1}\) からの帰結 \(S_4\), という結論が得られる。

したがって,プレーヤー \(A\) が初期の配列 \(I\) に対しての攻撃を選択するならば,必ず,

\(b_1\) を攻撃して配列を \(B_1\) に変え,帰結は \(S_4\)
という結論が得られる。 \(A\) が攻撃を選択するならば という条件付きであることに注意。

\(A\) は初手で \(b_2, b_3\) を同時に消去することもできるが,その場合の帰結は \(S_6\) であり,\(A\) にとって \(S_4\) より劣る。

\(A_1,A_2,A_3\) について

$$ \begin{gather*} S_1 = \begin{pmatrix} 8.4 & 8.3 & 0\\ 11.0 & 0 & 5.2 \end{pmatrix}, \qquad S_2 = \begin{pmatrix} 8.4 & 8.3 & 0\\ 11.0 & 5.4 & 0 \end{pmatrix}. \qquad S_3 = \begin{pmatrix} 8.4 & 0 & 1.5\\ 0 & 5.4 & 5.2 \end{pmatrix} \\ S_4 = \begin{pmatrix} 0 & 8.3 & 1.5\\ 0 & 5.4 & 5.2 \end{pmatrix}, \qquad S_5 = \begin{pmatrix} 8.4 & 0 & 1.5\\ 11.0 & 0 & 0 \end{pmatrix}, \qquad S_6 = \begin{pmatrix} 0 & 8.3 & 1.5\\ 11.0 & 0 & 0 \end{pmatrix} \end{gather*} $$ $$ \begin{gather*} A_1 = \begin{pmatrix} 0 & 8.3 & 1.5\\ 11.0 & 5.4 & 5.2 \end{pmatrix},\quad A_2 = \begin{pmatrix} 8.4 & 0 & 1.5\\ 11.0 & 5.4 & 5.2 \end{pmatrix},\quad A_3 = \begin{pmatrix} 8.4 & 8.3 & 0\\ 11.0 & 5.4 & 5.2 \end{pmatrix} \end{gather*} $$

配列が \(A_1,A_2,A_3\) の場合,\(A\) がパスをしたとしても,\(B\) は(\(DSP\) を避けたいので)パスしか選択できない。したがって,\(p\) の値が許すならば,\(A\) はパスで様子見をすることもできる。しかし,\(B\) から反撃を受けることなしに攻撃することができるならば,パスを続けてこのままゲームを終わらせることは(\(A\) にとって)合理的でない。

\(A_1,A_2,A_3\) のそれぞれについて,プレーヤー\(A\) の合理的な行動を調べる:

  • 状態 \({}^A_0{A_1}\) において,プレーヤー \(A\) は,\(DSP\) を避けながら,価値関数を改善する行動として,以下の選択肢を持つ:
    • \(b_1 = 11.0\) を攻撃: 帰結は,安定な配列 \(S_4\) であり \(\varphi^{fl}_A = 1.32\).
    • \(b_2 = 5.4\) と \(b_3=5.2\) の両方を攻撃: 帰結は,安定な配列 \(S_6\) であり \(\varphi^{fl}_A = 1.00\).
    \(1.32\) と \(1.0\) を比較して,\(b_1\) を攻撃することを選ぶので,
    状態 \({}^A_0{A_1}\) の帰結は \(S_4\) であり,\(\varphi^{fl}_B = 2.76\).
  • 状態 \({}^A_0{A_2}\) についても同様であり,プレーヤー \(A\) は,
    • \(b_1 = 11.0\) を攻撃: 帰結は,安定な配置 \(S_3\) であり \(\varphi^{fl}_A = 1.42\).
    • \(b_2 = 5.4\) と \(b_3=5.2\) の両方を攻撃: 帰結は,安定な配置 \(S_5\) であり \(\varphi^{fl}_A = 1.10\).
    の \(1.42\) と \(1.10\) を比較して,\(b_1\) を攻撃することを選ぶので,
    状態 \({}^A_0{A_2}\) の帰結は \(S_3\) であり,\(\varphi^{fl}_B = 2.68\).
  • 状態 \({}^A_0{A_3}\) において,プレーヤー \(A\) が\(DSP\) を避けながら攻撃する選択肢は,
    • \(b_2 = 5.4\) を攻撃: 帰結は,安定な配置 \(S_1\) であり \(\varphi^{fl}_A = 3.74\),
    • \(b_3 = 5.2\) を攻撃: 帰結は,安定な配置 \(S_2\) であり \(\varphi^{fl}_A = 3.58\)
    のふたつなので,\(3.74\) と \(3.58\) を比較して,\(b_2\) を攻撃することを選ぶ。したがって,
    状態 \({}^A_0{A_3}\) の帰結は \(S_1\) であり,\(\varphi^{fl}_B = 2.84\).

以上により,状態 \({}^A_0{A_1},\, {}^{A}_{0}{A_2},\, {}^{A}_{0}{A_3}\) はいずれも安定ではないが,プレーヤー \(B\) にとって最も望ましい帰結は,\(2.76,\,2.68,\,2.84\) を比較して, \({}^A_0{A_3}\) からの帰結 \(S_1\) という結論が得られる。

したがって,プレーヤー \(B\) が初期の配列に対しての攻撃を選択するならば,必ず

\(a_3\) を攻撃して配列を \(A_3\) に変え,帰結は \(S_1\)
という結論が得られる。この場合も, \(B\) が攻撃を選択するならば,という条件付きである。

少し変わった先手有利

\(p=2\) の場合

それでは, \(p=2\) として,ゲームの展開を調べてみよう。

\(A\) が先手の場合

プレーヤー \(A\) は,初手で攻撃をするならば,既に調べたように \(b_1\) を攻撃することを選ぶので,帰結は \(S_4\) となる。パスをする選択肢もあるのだが,その場合,プレーヤー \(B\) にパスをしてゲームを終了させる権利を与えてしまう。初期配列 \(I\) は \(A\) にとって好ましいものではないのだが, \(B\) にとっては,最も好ましい配列となっているので, \(A\) がパスをした場合, \(B\) もパスを選ぶことになる。したがって,プレーヤー \(A\) は初手で攻撃をすることになり,ゲームの帰結は \(S_4\) となる。

\(B\) が先手の場合

プレーヤー \(B\) は,初手で攻撃するならば,既に調べたように \(a_3\) を攻撃することを選ぶので,帰結は \(S_1\) となる。 \(B\) がパスをすると, \(A\) は攻撃を選択せざるを得なくなり,帰結は \(S_4\) となる。プレーヤー \(B\) にとって,\(S_4\) より \(S_1\) の方が好ましいので, \(B\) は初手で攻撃をすることになり,ゲームの帰結は \(S_1\)。

先手後手の相違

以上により,先手後手の違いが生じることわかった。ただし,これは,少し変わった状況であり,プレーヤー \(A\) にとっても,また,プレーヤー \(B\) にとっても,\(S_1\) の方が \(S_4\) より好ましい。したがって,

  • プレーヤー \(A\) にとって,プレーヤー \(B\) が先手である方が望ましく,また,
  • プレーヤー \(B\) にとっても,プレーヤー \(B\) が先手である方が望ましい
ということになる。

\(p=3\) の場合

プレーヤー \(A\) は, \(p=2\) の場合には,

\(B\) に手を渡して先手の権利を譲る
という手段を持たない。うっかりパスをしてしまうと,プレーヤー \(B\) はパスをして即座にゲームを終了させてしまう。

一方, \(p=3\) の場合,先手の \(A\) は,パスをしても,次のチャンスで攻撃をする権利を持つ:

\(A\) が先手

プレーヤー \(A\) は,初手でパスを選択する。プレーヤー \(B\) もパスを選ぶことができるのだが,その場合,\(j=2\) の状態でプレーヤーに決断を迫ることになってしまう。この状態で \(A\) がパスをするとゲームは終了してしまうので,プレーヤー \(A\) は攻撃により帰結 \(S_4\) を選ばざるを得ない。しかし,これは,プレーヤー \(B\) にとっても,帰結 \(S_1\) に劣るので, \(B\) は,攻撃により帰結 \(S_1\) を選択する方が良い選択となる。したがって, \(A\) が先手の場合の帰結は,\(S_1\) となる。

\(B\) が先手

プレーヤー \(B\) が先手の場合も, \(B\) が初手でパスを選ぶと,\(j=1\) の状態で決断を迫られたプレーヤー \(A\) を,

パスをすると \(B\) に 「パスによりゲームを終了させる権利」を与えてしまう
という状況に追い込んでしまう。その結果は帰結 \(S_4\) となるので,先手の場合にも,プレーヤー \(B\) は攻撃をせざるを得ない。したがって,帰結は \(S_1\) となる。

\(p=3\) の場合の結論

以上により, \(p=3\) の場合は,先手後手に影響されず,帰結は \(S_1\) となる。

トリック

\(p=2\) と \(p=3\) で帰結が異なる例を作ったわけだが,トリックは

\(p=3\) の場合には,手を渡すという高等戦術が可能になる
ということ。