混合戦略の意味 — 実戦でどう丸めるか
君が自作の CFR+ を回して収束させたとき、出力は決して「ベット 100%」のような綺麗な整数では返ってこない。ベット 68.4%、チェック 31.6% ——そういう半端な小数の海が広がっているはずだ。
ここで初心者は固まる。「68.4% って、卓でどう打てばいいんだ?」
答えは単純だ。君は卓上で乱数生成器になる必要はない。 混合戦略の正体を理解すれば、丸め方は自然に決まる。
混合戦略とは「君個人の指示」ではない
まず根本的な誤解を潰しておく。ソルバーの 68.4% は、目の前のそのハンドを 68.4% の確率でベットしろという命令ではない。
それは「このアクションを取るレンジ全体のうち、戦略的にこの比率の組み合わせが最適」という、レンジ視点の設計図だ。CFR+ は各情報集合(infoset)でリグレットを最小化した結果、複数のアクションに確率質量を分散させる。その分散が 68.4/31.6 という数字になっているにすぎない。
丸め方その1:コンボ分割(最も正確)
K♠8♦3♣ のボードで、君の A5s〜A9s のスーテッドエース群が、ソルバー出力で ベット 66% / チェック 33% だったとする。
この A エース群が君のレンジに 6 コンボあるなら、4 コンボをベット固定、2 コンボをチェック固定に割り当てる。これで卓全体としての比率はぴったり 2:1 になる。
A エース群 6 コンボの割り当て(ベット 66%)
--------------------------------------------
A5s, A6s, A8s, A9s → ベット固定 (4/6 = 67%)
A4s, A7s → チェック固定 (2/6 = 33%)どのコンボをどちらに振るかは、ブロッカー価値とエクイティで決める。ナッツをブロックするコンボをブラフ側(=ベット側)に、ショーダウン価値が高いコンボをチェック側に寄せると、混合の意図が崩れない。これが乱雑なサイコロより優れている理由だ。
丸め方その2:端数の切り捨て規則
68.4/31.6 のような半端を、君は実戦で 70/30 に丸めて構わない。±5% の誤差で失う EV はほぼゼロだからだ(理由は L11 のインディファレンスで証明する)。
ただし丸める方向には規則がある。
出力 実戦の丸め 理由
-----------------------------------------------------
55/45 50/50 (2:2) 純粋に近い → 散らす価値が薄い
68/32 66/33 (2:1) 最も扱いやすい整数比
78/22 80/20 (4:1) 高頻度側を固定化してよい
92/8 100/0 8% 側は捨てる。ピュア化92% のような出力を君が 100/0 に潰すと、理屈上は搾取の隙を作る。だが相手が GTO で打ち返してこない限り、その 8% を君が再現する手間は EV に見合わない。君は人間相手に勝つために回しているのであって、ソルバー同士の決闘をしているのではない。
丸め方その3:時間で散らす(セッション分散)
複数の同型スポットが 1 セッションで何度も来るタイプ(例:BTN オープンに対する BB の 3bet/コール判断)では、コンボ分割が使えない。手札は毎回違うからだ。
ここでは「直前の自分のアクションと逆を選ぶ」緩い交互化を使う。前のハンドでこのスポットをベットしたなら、今回は閾値を少しチェック寄りに倒す。完璧な乱数でなくていい。相手が君の頻度を読みづらくなる程度に散ればいい。
なぜ丸めても勝てるのか
混合戦略の周辺は EV が平坦だ。ソルバーがある点で混合するということは、その点の近傍でベットとチェックの EV がほぼ等しいことを意味する。だからこそ複数アクションに質量が分散している。
つまり 68/32 を 70/30 に丸めても、君が落ちる EV はその平坦な谷の中での微小な移動にすぎない。混合点は『どっちでもほぼ同じ』だからこそ混合になっている——この一点を腹に落とせば、半端な小数に怯える必要は二度となくなる。
このレッスンの要点
- 混合戦略は個別ハンドの確率ではなく、レンジ全体の配分設計だ
- 実戦の第一選択はコンボ分割。比率どおりに固定割り当てして再現性を取る
- ±5% の丸めは EV をほぼ失わない。整数比(2:1, 4:1)に潰してよい
- 感情と無相関なトリガーで散らせ。「気分」は混合を崩す