探索ツリーの組み方 — アクションとサイズの離散化
ここから先は、ソルバーの「出力」ではなく「入力」を疑う話だ。
赤緑黄のマトリクスを読むのは、もう君にはできる。だが、その解は 君がツリーに入れた選択肢の中だけで 最適化された解だということを、君は本当に分かっているか。ソルバーは万能ではない。与えられたアクション集合の中で ナッシュ均衡を探すだけの機械だ。33% ベットと 75% ベットしか入れなければ、たとえ実戦で 50% が最善でも、ソルバーは永遠に 50% を出さない。
ツリーの組み方を間違えれば、どれだけ収束させても答えは間違う。これは「翻訳」以前の、出力の信頼性そのものに関わる話だ。
離散化(discretization)とは何か
現実のポーカーでは、ベットサイズは連続だ。ポットが 10bb なら、1bb から 10bb まで、理屈の上では無限の選択肢がある。だが連続値を解くと計算が爆発する。そこでソルバーは、君が指定した 有限個のサイズ にアクションを丸める。これが離散化だ。
連続の現実 : 0.1pot 〜 1.5pot まで無限段階
↓ 君が離散化する
ツリーの選択肢 : Check / 33% / 75% / 125% + All-inソルバーが返す「33% で 60%」という頻度は、「33%・75%・125% という3択の中で」33% を 60% 選ぶ という意味だ。選択肢が変われば、この 60% も動く。出力の数字は、ツリーの形に依存している。
サイズを増やすと何が起きるか
「選択肢を増やせば正確になる」——半分正しく、半分罠だ。
フロップで 1サイズ(例:33% のみ)しか許さないツリーと、3サイズ(33/75/125%)許すツリーを比べると、後者の方が EV は高く出る。ソルバーがより細かくレンジを使い分けられるからだ。だが、その EV 差は思ったより小さい。
ツリー設計 アグレッサーの EV(bb) 計算時間
33% 単独 +2.10 1x
33% / 75% +2.18 2.5x
33% / 75% / 125% +2.21 5x
33/50/75/100/125% + AI +2.23 15xサイズを 1個から 3個に増やすと EV は +0.08bb ほど伸びる。だが 3個から 6個に増やしても伸びは +0.02bb。収穫逓減が激しい。 計算時間とのトレードオフを考えれば、ほとんどのスポットで 2〜3サイズあれば実戦上は十分だ。
サイズ汚染(size pollution)の罠
ここが上級者でも引っかかる落とし穴だ。似たサイズを2つ入れると、ソルバーは両者に頻度を散らして、どちらの戦略も曖昧にする。
例えばフロップに 50% と 66% の両方を入れたとする。実戦ではこの2つはほぼ同じ意味を持つ。するとソルバーは、本来 50% に集約すべき頻度を 50% と 66% に二分し、「50% で 35%、66% で 30%」のような 読みにくいミックス を返す。これは戦略的に意味のある分岐ではなく、ただの計算上のノイズだ。
悪いツリー: 50% と 66%(近すぎる)
→ 50%:35% / 66%:30% / check:35% ……どっちを打てばいいか分からない
良いツリー: 33% と 75%(役割が違う)
→ 33%:55% / 75%:20% / check:25% ……小さく広く or 大きく尖る、が読めるレイズツリーの省略とその代償
ベットサイズだけでなく、レイズの有無 もツリー設計だ。計算を軽くするため、フロップのレイズを「コール or フォールド」だけに省略する研究者は多い。だがこれには代償がある。
レイズを切り落としたツリーで C-bet 頻度を見ると、実際より高く出る。 なぜなら、ソルバーは「打ってもレイズされない」前提で計算するから、ブラフのリスクが過小評価されるのだ。実戦の相手はレイズしてくる。レイズノードを省いたツリーの C-bet 80% を鵜呑みにすると、君は打ちすぎる。
実戦への翻訳:自作ツリーの検算
君が自作 CFR を回しているなら、ツリー設計は君の責任だ。次の手順で検算しろ。
- ベースは3サイズ … 小(33%)・中(75%)・大+AI。これを標準形にする
- サイズ間隔を確認 … 隣接サイズが 2倍未満なら片方を削る
- EV の収穫逓減を見る … サイズを足して EV 改善が +0.03bb 未満なら、その追加は不要
- 省略ノードに印 … レイズを切ったスポットは「C-bet 高めに出ている」と注記する
ツリーは「精密に組むほど良い」のではない。実戦で使える解像度で、最小のノイズで組む のが正解だ。6サイズの汚れた解より、3サイズの澄んだ解の方が、卓上では遥かに役に立つ。
ソルバーは君の出した問いにしか答えない。問いの立て方=ツリーの組み方 こそが、出力の質を決める。
このレッスンの要点
- ソルバー出力は「君が入れた離散アクションの中での最適解」にすぎない
- サイズ追加の EV 改善は収穫逓減。実戦は 2〜3サイズで十分
- 近接サイズ(2倍未満)は解を濁す「サイズ汚染」を生む
- 省略したノード(レイズ等)が解をどちらに歪めるかを把握して補正する