GTOとは何か(直感編)
ここまで何度か出てきた「GTO」。数式抜きで、なぜそれが「最強」なのか、直感的に理解しましょう。
GTO とは
GTO = Game Theory Optimal(=ゲーム理論最適)
直訳すると「ゲーム理論的に最適な戦略」。ポーカーでは:
「相手がどんなプレイをしても、自分が長期的に負けない戦略」
を指します。
「負けない」≠「最大利益」
GTO の最大の特徴:
- GTO = 損しない戦略
- エクスプロイト = 最大利益狙う戦略
両者は別物。GTO は「ディフェンシブ」、エクスプロイトは「オフェンシブ」。
なぜ GTO が「最強」と言われるか
① 相手のレベル不問
- 相手が初心者でも上級者でも、GTO で対抗可能
- 相手の戦略を読む必要なし
② 自分の戦略がバレても OK
- GTO 戦略が完全に開示されても、相手は損なし
- 「透明性」がある
③ 数学的に最適
- ゲーム理論の「ナッシュ均衡」状態
- 「逸脱すると損する」均衡点
ナッシュ均衡(直感編)
「ナッシュ均衡」 = 「全員が最善を尽くしている状態」。
例:じゃんけん
- 自分:グー / チョキ / パー を 1/3 ずつ
- 相手:同じく 1/3 ずつ
- これがじゃんけんの GTO 均衡
- どちらかが偏らせると、相手にエクスプロイトされる
ポーカーの均衡
- 169 ハンドそれぞれに最適頻度のアクション
- ベットサイズも均衡的に決まる
- 「相手の最善行動」に対する最善行動
GTO の「ミックス戦略」
GTO では、同じハンドでも 複数のアクションを混ぜる:
例:AA をオープン or リンプ
- AA を 100 % オープン → 読まれる
- AA を時々リンプ → 隠す
- GTO 的には「90 % オープン、10 % リンプ」のような混合
例:A5s で 3-bet or コール
- 100 % 3-bet → 読まれる
- 70 % 3-bet、30 % コール → バランス
「確率的に混ぜる」のが GTO の特徴。
ライブで完全 GTO は不可能
GTO 戦略は数百のノードに対するレンジ計算が必要:
- 169 ハンド × 6 ポジション × 数十シチュエーション
- 人間が完璧に実行は不可能
→ 実戦では「GTO に近い戦略」を目指す。
エクスプロイトとの使い分け
| 状況 | 戦略 |
|---|---|
| 相手が強い(プロ)、情報少 | GTO 寄り |
| 相手が弱い、傾向明確 | エクスプロイト |
| 自分のイメージ気になる | GTO |
| 短期勝負 | エクスプロイト |
| 長期勝負 | GTO ベース |
中級者は GTO ベース + 明確な弱点だけエクスプロイト が現実解。
GTO 学習の「段階」
ステップ 1:プリフロップレンジ暗記
- Phase 3 のオープンレンジ、3-bet レンジ
- これだけで GTO の 50 % 完成
ステップ 2:C-ベット率把握
- Phase 4 のボードカテゴリ別 C-ベット率
- フロップ戦略の体系化
ステップ 3:ターン・リバー判断
- Phase 4-5 の意思決定フレーム
- 数学(MDF / アルファ)を意識
ステップ 4:ソルバー研究
- GTO Wizard、PioSolver で具体ノード研究
- 上級者の世界
GTO の「現実的応用」
完璧な GTO は不要、「重要な瞬間に近い判断ができる」 で十分:
重要な瞬間
- リバーの大ポット判断
- バブル前のジャム判断
- 4-bet ジャム vs コール
日常の瞬間
- ヒューリスティック(=経験則)で OK
- 1 ハンドの 0.1 BB 損失は許容
GTO の限界
GTO 戦略にも限界:
限界 ①:相手も GTO の前提
- 実戦の相手は不完全
- エクスプロイトの方が稼げる場面多
限界 ②:計算量が膨大
- 全ノードの完璧な GTO は不可能
- 簡略化が必要
限界 ③:「降りすぎ」になる
- GTO は「最大利益」ではなく「最小損失」
- 弱い相手相手では収益率が下がる
「ヒューリスティック」の重要性
GTO に近づく「経験則」:
例:プリフロップ・ヒューリスティック
- 「ハンド強度トップ 15 % で UTG オープン」
- 「3-bet レンジに A2s-A5s を入れる」
例:ポストフロップ・ヒューリスティック
- 「A 高ドライで C-ベット 80 %」
- 「セットでチェックレイズ」
これらは GTO の近似、覚えやすい。
GTO の「直感化」
GTO 戦略の本質は 「相手にエクスプロイトされない」:
自分の戦略の透明性
- どんなにバレても、相手の最善行動でも自分が損しない
- → 自分の戦略を秘密にする必要なし
バランス取り
- バリュー:ブラフ = 数学的に決まる比率
- ベットサイズ:頻度の組み合わせ
実戦の判断フロー
GTO ベースの判断ステップ:
- プリフロップ:レンジ暗記で自動化
- フロップ:C-ベット率 + サイズで自動化
- ターン:ヒューリスティック + 軽い計算
- リバー:フレーム適用、深く考える
「重要な瞬間に深く、それ以外は速く」。
GTO の「自己中心バイアス」
GTO は「自分のレンジ全体」を意識:
NG :自分のハンドだけ見る
- 「自分は AA だから打つ」
- これは GTO ではない
GTO :レンジで考える
- 「自分のレンジ全体の中で、AA は何 % か」
- 「レンジ全体としてどう行動すべきか」
GTO のメリット・デメリット
メリット
- 相手のレベル不問
- 透明性、長期勝率安定
- 心理戦不要
デメリット
- 学習コスト高
- 弱い相手から最大利益取れない
- 実行困難
練習:GTO の理解度
問 ①:GTO 戦略を完全に開示されたら、相手は損する?
答え
損しない(=均衡)。GTO の特徴は「透明性」、開示されても相手は最善行動でも自分が勝てない。
問 ②:相手がコーリングステーション、GTO とエクスプロイトどちらが稼げる?
答え
エクスプロイト。コーリングステーション = ブラフ効かない、バリュー特化 = 最大利益。
GTO だと「均衡戦略」になり、バリュー利益を取り損ねる。
用語まとめ
- GTO:Game Theory Optimal、ゲーム理論最適
- ナッシュ均衡:全員が最善を尽くしている状態
- ミックス戦略:同じハンドで複数アクションを確率混合
- ヒューリスティック:経験則による近似戦略
- 透明性:戦略が開示されても損しない性質
このレッスンの要点
- GTO = 「相手がどんなプレイをしても、自分が負けない戦略」
- ナッシュ均衡 = 全員最善の状態
- 中級者は「GTO ベース + 明確な弱点だけエクスプロイト」
- 完璧な GTO 不可能、ヒューリスティックで近似
おすすめ書籍・グッズ
世界のヨコサワの世界一やさしいポーカーの勝ち方
プリフロップからポストフロップまで、このサイトの基礎を体系的に復習できる一冊。中級者になっても手元に置きたいベストセラー。