レッスン 86 / 100 Phase 6:中級者への入口

GTOとは何か(直感編)

ここまで何度か出てきた「GTO」。数式抜きで、なぜそれが「最強」なのか、直感的に理解しましょう。

GTO とは

GTO = Game Theory Optimal(=ゲーム理論最適)

直訳すると「ゲーム理論的に最適な戦略」。ポーカーでは:

「相手がどんなプレイをしても、自分が長期的に負けない戦略」

を指します。

負けない」≠「最大利益

GTO の最大の特徴:

  • GTO = 損しない戦略
  • エクスプロイト = 最大利益狙う戦略

両者は別物。GTO は「ディフェンシブ」、エクスプロイトは「オフェンシブ」。

なぜ GTO が「最強」と言われるか

① 相手のレベル不問

  • 相手が初心者でも上級者でも、GTO で対抗可能
  • 相手の戦略を読む必要なし

② 自分の戦略がバレても OK

  • GTO 戦略が完全に開示されても、相手は損なし
  • 透明性」がある

③ 数学的に最適

  • ゲーム理論の「ナッシュ均衡」状態
  • 逸脱すると損する」均衡点

ナッシュ均衡(直感編)

ナッシュ均衡」 = 「全員が最善を尽くしている状態」。

例:じゃんけん

  • 自分:グー / チョキ / パー を 1/3 ずつ
  • 相手:同じく 1/3 ずつ
  • これがじゃんけんの GTO 均衡
  • どちらかが偏らせると、相手にエクスプロイトされる

ポーカーの均衡

  • 169 ハンドそれぞれに最適頻度のアクション
  • ベットサイズも均衡的に決まる
  • 「相手の最善行動」に対する最善行動

GTO の「ミックス戦略

GTO では、同じハンドでも 複数のアクションを混ぜる

例:AA をオープン or リンプ

  • AA を 100 % オープン → 読まれる
  • AA を時々リンプ → 隠す
  • GTO 的には「90 % オープン、10 % リンプ」のような混合

例:A5s で 3-bet or コール

  • 100 % 3-bet → 読まれる
  • 70 % 3-bet、30 % コール → バランス

確率的に混ぜる」のが GTO の特徴。

ライブで完全 GTO は不可能

GTO 戦略は数百のノードに対するレンジ計算が必要:

  • 169 ハンド × 6 ポジション × 数十シチュエーション
  • 人間が完璧に実行は不可能

→ 実戦では「GTO に近い戦略」を目指す。

POKER UTG MP CO BTN SB BB D
6max では 6 ポジション × 169 ハンド × ノード分岐 = 兆単位。人間は『近似』が現実解。

エクスプロイトとの使い分け

状況戦略
相手が強い(プロ)、情報少GTO 寄り
相手が弱い、傾向明確エクスプロイト
自分のイメージ気になるGTO
短期勝負エクスプロイト
長期勝負GTO ベース

中級者は GTO ベース + 明確な弱点だけエクスプロイト が現実解。

GTO 学習の「段階

ステップ 1:プリフロップレンジ暗記

  • Phase 3 のオープンレンジ、3-bet レンジ
  • これだけで GTO の 50 % 完成

ステップ 2:C-ベット率把握

  • Phase 4 のボードカテゴリ別 C-ベット率
  • フロップ戦略の体系化

ステップ 3:ターン・リバー判断

  • Phase 4-5 の意思決定フレーム
  • 数学(MDF / アルファ)を意識

ステップ 4:ソルバー研究

  • GTO Wizard、PioSolver で具体ノード研究
  • 上級者の世界

GTO の「現実的応用

完璧な GTO は不要、「重要な瞬間に近い判断ができる」 で十分:

重要な瞬間

  • リバーの大ポット判断
  • バブル前のジャム判断
  • 4-bet ジャム vs コール

日常の瞬間

  • ヒューリスティック(=経験則)で OK
  • 1 ハンドの 0.1 BB 損失は許容

GTO の限界

GTO 戦略にも限界:

限界 ①:相手も GTO の前提

  • 実戦の相手は不完全
  • エクスプロイトの方が稼げる場面多

限界 ②:計算量が膨大

  • 全ノードの完璧な GTO は不可能
  • 簡略化が必要

限界 ③:「降りすぎ」になる

  • GTO は「最大利益」ではなく「最小損失
  • 弱い相手相手では収益率が下がる

ヒューリスティック」の重要性

GTO に近づく「経験則」:

例:プリフロップ・ヒューリスティック

  • 「ハンド強度トップ 15 % で UTG オープン」
  • 「3-bet レンジに A2s-A5s を入れる」

例:ポストフロップ・ヒューリスティック

  • 「A 高ドライで C-ベット 80 %」
  • 「セットでチェックレイズ」

これらは GTO の近似、覚えやすい。

GTO の「直感化

GTO 戦略の本質は 「相手にエクスプロイトされない」

自分の戦略の透明性

  • どんなにバレても、相手の最善行動でも自分が損しない
  • → 自分の戦略を秘密にする必要なし

バランス取り

  • バリュー:ブラフ = 数学的に決まる比率
  • ベットサイズ:頻度の組み合わせ

実戦の判断フロー

GTO ベースの判断ステップ:

  1. プリフロップ:レンジ暗記で自動化
  2. フロップ:C-ベット率 + サイズで自動化
  3. ターン:ヒューリスティック + 軽い計算
  4. リバー:フレーム適用、深く考える

重要な瞬間に深く、それ以外は速く」。

GTO の「自己中心バイアス

GTO は「自分のレンジ全体」を意識:

NG :自分のハンドだけ見る

  • 「自分は AA だから打つ」
  • これは GTO ではない

GTO :レンジで考える

  • 「自分のレンジ全体の中で、AA は何 % か」
  • 「レンジ全体としてどう行動すべきか」

GTO のメリット・デメリット

メリット

  • 相手のレベル不問
  • 透明性、長期勝率安定
  • 心理戦不要

デメリット

  • 学習コスト高
  • 弱い相手から最大利益取れない
  • 実行困難

練習:GTO の理解度

問 ①:GTO 戦略を完全に開示されたら、相手は損する?

答え

損しない(=均衡)。GTO の特徴は「透明性」、開示されても相手は最善行動でも自分が勝てない。

問 ②:相手がコーリングステーション、GTO とエクスプロイトどちらが稼げる?

答え

エクスプロイト。コーリングステーション = ブラフ効かない、バリュー特化 = 最大利益。
GTO だと「均衡戦略」になり、バリュー利益を取り損ねる。

用語まとめ

  • GTO:Game Theory Optimal、ゲーム理論最適
  • ナッシュ均衡:全員が最善を尽くしている状態
  • ミックス戦略:同じハンドで複数アクションを確率混合
  • ヒューリスティック:経験則による近似戦略
  • 透明性:戦略が開示されても損しない性質

このレッスンの要点

  • GTO = 「相手がどんなプレイをしても、自分が負けない戦略」
  • ナッシュ均衡 = 全員最善の状態
  • 中級者は「GTO ベース + 明確な弱点だけエクスプロイト」
  • 完璧な GTO 不可能、ヒューリスティックで近似

おすすめ書籍・グッズ
世界のヨコサワの世界一やさしいポーカーの勝ち方
プリフロップからポストフロップまで、このサイトの基礎を体系的に復習できる一冊。中級者になっても手元に置きたいベストセラー。