非合理的行動選択による勝率の上昇

「相手が意味不明な行動を取ったから負けた」という主張の妥当性について書きます*1

以下,客観的なプレイヤー1と主観的なプレイヤー2の対戦における1つの局面を考え,プレイヤー1の選択肢はAのみ,プレイヤー2の選択肢はa,bとし,それらの組み合わせにより一意に決定される結果をプレイヤー1の勝率に代表させて記述します*2*3

表1:プレイヤー1の想定する利得表(実際の利得表に一致)*4

a b
A 1.00 0.00


表2:プレイヤー2の想定する利得表(実際の利得表には一致せず)

a b
A 0.00 1.00


各プレイヤーは表1,2に示す利得表を想定した上で行動します.
プレイヤー1の想定する利得表は十分に客観的であり,実際の利得表に一致しています.
一方,プレイヤー2の想定する利得表は主観的で,実際の利得表には一致していません.
さらに,プレイヤー1はプレイヤー2が表2の利得表を想定していることを知っているものとします.

この局面において,プレイヤー2にとってaは支配戦略ですが,実際の利得表は表1のものであるため,aが選択されるとプレイヤー1の勝利が決定します.
これに対し,プレイヤー2が被支配戦略であるbを選択した場合には,プレイヤー1が敗北します.

さて,この例ではプレイヤー2は被支配戦略を選択することで,支配戦略を選択した場合よりも良い結果を得られる構造となっています.
すなわち,この局面においては非合理的な行動により勝率が上昇します.
このような局面を考えることができるため,冒頭の主張を直ちに非妥当とするのは早計であるということになります.
ただし,相手の想定する利得表を知っているとはどのような状態を指すのかに関しては議論の余地があることを,ここに明示しておきます.

今回はここまでです.
最後まで読んでくださり,ありがとうございました.

*1:「のに」ではなく「から」である点に注意する.

*2:「勝率」とはこの対戦に限ったそれを指す.

*3:プレイヤー2の勝率は1からプレイヤー1の勝率を減ずることで得られる.

*4:(プレイヤー1が行を,)プレイヤー2が列を選択する.表2も同様である.

広告を非表示にする