不意打ち択の理論的な話
不意打ち択とはなんぞや? 以下の状況を想定します。
体力1のガブリアス(地震・剣舞)VS体力50ぐらいのメガクチート(不意打ち・叩き落とす)
これクチート側はPP切れるまで不意打ちしてればいいし、ガブは切れるまで剣舞してればいい、
って感じがしますけど、実際論理的に考えると解答はあるのか考えてみたいと思います。
細かく見ていきましょう。
不意打ちのPP8だとして、最高ターン数は9ですよね。
9ターン目まで行くとクチート側は負けます。ガブに地震打たれるんで。
つまり不意打ち8回打つとクチートは負けるんで、8ターン目にはたいた方が良い、って話になります。
ガブリアス側もそれが分かるので、8ターン目にクチートは普通にはたいてくる→じゃあ殴ればいいと考えられます。
それをクチート側も読めるので、7ターン目にクチートは殴った方がいい。
でもガブ側もそれが読めるので・・・って続くと、最終的にクチートはどのタイミングでも殴れないってことになります。
(実際には何らかの行動を選択するけど)
まぁ一種のパラドックスですよね。択ゲーになってるんだから当たり前っちゃ当たり前かもですけど。
だからこそ相手が殴ってくるかもしれんから不意打ち8回押せばいいじゃんってお話なのですが、
この”相手が殴ってくるかもしれん”っていう考えは論理的に見てみるとおかしく感じちゃいますよね
(だって8回不意打ち打つまでクチート側は殴らない、っていう大前提があるのだから)
でも実際不意打ち8回押すのは割と安定と言われます。これは何ででしょう?
この疑問を割と上手く説明してくれそうな実験が、ゲーム理論では既に行われてます。
いわゆる美人投票ゲーム、というものです。(詳しく知りたい人はゲーム理論の本見れば大体載ってます)
ルールは、100人に一人ずつ一枚だけ紙を渡して、1~100のいずれかの数字を一つ書いてもらう。
で、皆が書いた数字の平均値の0.7倍に近い数字を書いた人に賞金を上げる、ってものです。
これの答えなんですけど、100人いるんで、まぁ1~100をまんべんなく書いたとして平均値は大体50くらいになる、
って推測できます。これの0.7倍だから35辺り書いておけばいいって話ですね。
でもだからって35を皆が書いたら平均値が35になるから、0.7倍すると24.5。
じゃあ24って書いたら平均値が24になって~~~~~~
って繰り返すと、皆1を書くのが解答ってことになります。(いわゆるナッシュ均衡解ですかね?)
解答あるから不意打ち択と若干ちげーじゃんって意見もあるかもしれないっすけど、
思考の方法として他者はこうするだろうから自分はこうしよう、っていうのが似てると思うんで状況的には大差ないと思ってます。
で、実際にこのゲームをやって見ると、大体書かれた数字の平均値は20前後に収まったらしいんですね。
このゲームって、この1~100を書いた時の平均値50の0.7倍の35、の0.7倍の24・5、の0.7倍の17・15、
って感じで推測を繰り返して数字を書くわけですけど、それで平均値20ぐらいに収まるってことは、
大体この推測ってのが3~4回ぐらいしか行われてないっていう証明なんです。
つまり、50が平均になるから35が平均、になると読めるから24、ってのも読めるだろうから17!か0.7倍の12!
この辺りで思考やめちゃうってことなんですね。
で、まぁこの実験結果踏まえて不意打ち択に戻るんすけど、
9ターン目になったらクチート側は負けるので、8ターン目に殴るってのが第一推測。
これは読まれるから7ターン目に殴るってのが第2推測。
それも読まれるから6ターン目に殴るってのが第3推測。
それも読まれるので、5ターン目に殴るってのが第4推測。
こうやって考えていくと、
5~6ターン目辺りにガブは勝負択である地震を選択しやすいのでは?
という結果になります。だからこそ8回きっちり不意打ち押す、というのが安定と言われるんじゃないでしょうか。
でまぁ論理的な感じで考えていくとこんな感じかなぁ、って思うんすけど
体感、実際は3~4ターン目の方がガブが地震押したり、クチートが叩き押す時が多い気がします。
この3~4ターン目ってのは3~4回の推測を行うっていう結論から考えると、
ポケモンプレイヤーは9ターン目を念頭に置いて推測してるんじゃなくて、始まりの対面を念頭に推測を開始している、
って可能性があるのかなぁって思います。つまり剣舞・不意打ちを2~3回繰り返した後、
次は殴ってくる(次も舞ってくる)かもしれないって推測をしているのかもな、って。
まぁ長々と書きましたが、何がいいたいかと言うとクチートはしっかり8回不意打ちしようね、ってことでした。
<追記>
RTふぁぼ結構もらったんすけど、やっぱ美人投票ゲームと不意打ち択は状況違うっしょって指摘あって、
まぁ僕も割とそう感じる所あったっていうか「解なし」と「解がある」ものを並べて説明している、
っていうのは確かにおかしいっしょと思うので、
「人間はある一定数までしか推測しない」っていう説明をしたかったので美人投票ゲームの例を使った。
って言い訳をしておきます。(これだけなら限定合理性の説明だけすれば良かったっすかね?)
ゲーム理論的に不意打ち択説明するなら混合戦略で見た方が良いみたいです。
混合戦略自体の説明はめんどいので割愛します。
大学の専攻は一応経済学なんすけどゲーム理論はあんま勉強してないんで今回みたいに指摘食らいそうっすし。
まぁ不意打ち択は択っていうだけあってどこで不意打てば勝てる、みたいな完璧な正解は勿論ないです。
強いて言えば8/9で勝つってのが正解でしょう。
8回打った方が良い、ってのはなんつーか迷信的な答えで、3~4回しか推測しない人間に勝ちやすくする、
みたいな効果しかないんで、実際8回打った方が良いと思ってる同士で戦うと大体7回打ち合って最終的に択になると思います。
でも択になって、んで最終的に負けてもなんつーか、やりきって負けたからいいか、みたいな。
そんな感じでいいのかなーって思ってます。精神論だけど。
そう、それで思ったんすけど、不意打ち択は7回やった後ラスト2ターンは完全択ゲーになるので、
そこに至るまでに勝負をつけようとして3~4回推測している→3~4ターン目が勝負ターンになる?
って考えもあるのかな、って少し思いました。
似た様なゲームである逆境無頼カイジの作中ゲーム「Eカード」だとそこらへん多少説明してましたかね?(覚えてない
後、「一番最初に殴れば?」って指摘もあって、まぁ確かに割と決まりやすいのは体感分かるんすけど、
思考放棄(もう負けだからさっさと殴って死ぬか)プレイヤーに負けるので、あんまやりたくはないかなぁと思います。
体力1のガブリアス(地震・剣舞)VS体力50ぐらいのメガクチート(不意打ち・叩き落とす)
これクチート側はPP切れるまで不意打ちしてればいいし、ガブは切れるまで剣舞してればいい、
って感じがしますけど、実際論理的に考えると解答はあるのか考えてみたいと思います。
細かく見ていきましょう。
不意打ちのPP8だとして、最高ターン数は9ですよね。
9ターン目まで行くとクチート側は負けます。ガブに地震打たれるんで。
つまり不意打ち8回打つとクチートは負けるんで、8ターン目にはたいた方が良い、って話になります。
ガブリアス側もそれが分かるので、8ターン目にクチートは普通にはたいてくる→じゃあ殴ればいいと考えられます。
それをクチート側も読めるので、7ターン目にクチートは殴った方がいい。
でもガブ側もそれが読めるので・・・って続くと、最終的にクチートはどのタイミングでも殴れないってことになります。
(実際には何らかの行動を選択するけど)
まぁ一種のパラドックスですよね。択ゲーになってるんだから当たり前っちゃ当たり前かもですけど。
だからこそ相手が殴ってくるかもしれんから不意打ち8回押せばいいじゃんってお話なのですが、
この”相手が殴ってくるかもしれん”っていう考えは論理的に見てみるとおかしく感じちゃいますよね
(だって8回不意打ち打つまでクチート側は殴らない、っていう大前提があるのだから)
でも実際不意打ち8回押すのは割と安定と言われます。これは何ででしょう?
この疑問を割と上手く説明してくれそうな実験が、ゲーム理論では既に行われてます。
いわゆる美人投票ゲーム、というものです。(詳しく知りたい人はゲーム理論の本見れば大体載ってます)
ルールは、100人に一人ずつ一枚だけ紙を渡して、1~100のいずれかの数字を一つ書いてもらう。
で、皆が書いた数字の平均値の0.7倍に近い数字を書いた人に賞金を上げる、ってものです。
これの答えなんですけど、100人いるんで、まぁ1~100をまんべんなく書いたとして平均値は大体50くらいになる、
って推測できます。これの0.7倍だから35辺り書いておけばいいって話ですね。
でもだからって35を皆が書いたら平均値が35になるから、0.7倍すると24.5。
じゃあ24って書いたら平均値が24になって~~~~~~
って繰り返すと、皆1を書くのが解答ってことになります。(いわゆるナッシュ均衡解ですかね?)
解答あるから不意打ち択と若干ちげーじゃんって意見もあるかもしれないっすけど、
思考の方法として他者はこうするだろうから自分はこうしよう、っていうのが似てると思うんで状況的には大差ないと思ってます。
で、実際にこのゲームをやって見ると、大体書かれた数字の平均値は20前後に収まったらしいんですね。
このゲームって、この1~100を書いた時の平均値50の0.7倍の35、の0.7倍の24・5、の0.7倍の17・15、
って感じで推測を繰り返して数字を書くわけですけど、それで平均値20ぐらいに収まるってことは、
大体この推測ってのが3~4回ぐらいしか行われてないっていう証明なんです。
つまり、50が平均になるから35が平均、になると読めるから24、ってのも読めるだろうから17!か0.7倍の12!
この辺りで思考やめちゃうってことなんですね。
で、まぁこの実験結果踏まえて不意打ち択に戻るんすけど、
9ターン目になったらクチート側は負けるので、8ターン目に殴るってのが第一推測。
これは読まれるから7ターン目に殴るってのが第2推測。
それも読まれるから6ターン目に殴るってのが第3推測。
それも読まれるので、5ターン目に殴るってのが第4推測。
こうやって考えていくと、
5~6ターン目辺りにガブは勝負択である地震を選択しやすいのでは?
という結果になります。だからこそ8回きっちり不意打ち押す、というのが安定と言われるんじゃないでしょうか。
でまぁ論理的な感じで考えていくとこんな感じかなぁ、って思うんすけど
体感、実際は3~4ターン目の方がガブが地震押したり、クチートが叩き押す時が多い気がします。
この3~4ターン目ってのは3~4回の推測を行うっていう結論から考えると、
ポケモンプレイヤーは9ターン目を念頭に置いて推測してるんじゃなくて、始まりの対面を念頭に推測を開始している、
って可能性があるのかなぁって思います。つまり剣舞・不意打ちを2~3回繰り返した後、
次は殴ってくる(次も舞ってくる)かもしれないって推測をしているのかもな、って。
まぁ長々と書きましたが、何がいいたいかと言うとクチートはしっかり8回不意打ちしようね、ってことでした。
<追記>
RTふぁぼ結構もらったんすけど、やっぱ美人投票ゲームと不意打ち択は状況違うっしょって指摘あって、
まぁ僕も割とそう感じる所あったっていうか「解なし」と「解がある」ものを並べて説明している、
っていうのは確かにおかしいっしょと思うので、
「人間はある一定数までしか推測しない」っていう説明をしたかったので美人投票ゲームの例を使った。
って言い訳をしておきます。(これだけなら限定合理性の説明だけすれば良かったっすかね?)
ゲーム理論的に不意打ち択説明するなら混合戦略で見た方が良いみたいです。
混合戦略自体の説明はめんどいので割愛します。
大学の専攻は一応経済学なんすけどゲーム理論はあんま勉強してないんで今回みたいに指摘食らいそうっすし。
まぁ不意打ち択は択っていうだけあってどこで不意打てば勝てる、みたいな完璧な正解は勿論ないです。
強いて言えば8/9で勝つってのが正解でしょう。
8回打った方が良い、ってのはなんつーか迷信的な答えで、3~4回しか推測しない人間に勝ちやすくする、
みたいな効果しかないんで、実際8回打った方が良いと思ってる同士で戦うと大体7回打ち合って最終的に択になると思います。
でも択になって、んで最終的に負けてもなんつーか、やりきって負けたからいいか、みたいな。
そんな感じでいいのかなーって思ってます。精神論だけど。
そう、それで思ったんすけど、不意打ち択は7回やった後ラスト2ターンは完全択ゲーになるので、
そこに至るまでに勝負をつけようとして3~4回推測している→3~4ターン目が勝負ターンになる?
って考えもあるのかな、って少し思いました。
似た様なゲームである逆境無頼カイジの作中ゲーム「Eカード」だとそこらへん多少説明してましたかね?(覚えてない
後、「一番最初に殴れば?」って指摘もあって、まぁ確かに割と決まりやすいのは体感分かるんすけど、
思考放棄(もう負けだからさっさと殴って死ぬか)プレイヤーに負けるので、あんまやりたくはないかなぁと思います。