レッスン 87 / 100 Phase 6:中級者への入口

ナッシュ均衡の入り口

ノーベル経済学賞も受賞したナッシュ均衡。ポーカーで使われる「Nashチャート」など、数式抜きで概念を掴みます。

ナッシュ均衡とは

全員が最善を尽くしているとき、誰も戦略を変えても得しない状態」。

ノーベル経済学賞の数学者 ジョン・ナッシュ が証明した、ゲーム理論の最重要概念。

ポーカーでは

  • 「全プレイヤーの GTO 戦略の組み合わせ」
  • それぞれが「逸脱しても損する」均衡点

ナッシュ均衡の例:じゃんけん

じゃんけんの均衡

  • 各プレイヤーが「グー 1/3、チョキ 1/3、パー 1/3」
  • 誰かが「グー 50 %」に偏ると、相手は「パー」を増やしてエクスプロイト
  • → 全員 1/3 ずつが「逸脱しても損する」均衡

ポーカーの均衡

  • 各ハンドに最適な「アクション頻度」がある
  • AA をオープン 100 %、KK をオープン 100 %、A5s を 3-bet 70 % / コール 30 % など
  • 全員が均衡戦略でプレイすれば、ナッシュ均衡

ポーカーでの「Nash 均衡」の応用

プッシュ・フォールド・ナッシュ

  • ショートスタック(〜 15 BB)の「ジャム or フォールド」最適戦略
  • ナッシュチャートとして広く公開されている

プリフロップ・ナッシュ

  • オープンレンジ、3-bet レンジ、4-bet レンジの均衡
  • ソルバーで計算可能

Nash チャート」とは

ショートスタック戦略の代表的なツール:

ジャム表

  • スタックサイズ × ハンド = ジャム / フォールド の判定
  • 例:12 BB の UTG なら 55+ / A7s+ / AJo+

コール表

  • 相手のジャムへのコール判定
  • 例:自分 15 BB、相手 8 BB ジャム → 77+ / ATs+ コール

ナッシュ均衡の「美しさ

数学的に証明された「最適」

  • 1950 年代のナッシュの証明
  • 全ての有限ゲームに均衡が存在

戦略の安定性

  • 全員が均衡から逸脱したくない
  • 一度均衡に達したら維持

ナッシュ均衡 vs エクスプロイト

戦略特徴
ナッシュ均衡損しない、長期安定
エクスプロイト相手の弱点突き、最大利益

両者を使い分けるのが上級者。

ナッシュ均衡の「逆エクスプロイト」耐性

GTO(=ナッシュ)戦略の最大の強み:

相手がエクスプロイトしようとすると

  • 自分の戦略から偏らせる
  • でも GTO 側は影響なし(=均衡)

安全網

  • 相手のレベル不明
  • GTO で最低限の損失保証

ポーカーの「完全 GTO」は存在しない

理論的にはナッシュ均衡があるが、実戦では:

計算量問題

  • 169 ハンド × 全ノード = 兆単位の組み合わせ
  • スーパーコンピュータでも完全計算不可能

近似 GTO

  • ソルバーが「近似解」を計算
  • 実用上「ほぼ GTO」で十分

ポーカー解の「収束

ソルバーの動作原理:

  • 初期戦略から開始
  • 「もっと良い戦略」を反復計算
  • 「もう良くならない」点 = 近似均衡

例:GTO Wizard

  • 数十秒〜数時間でノード解を出す
  • 95 % 解」程度なら短時間
  • 完全解は数日〜

ナッシュチャートの読み方

例:12 BB UTG オープンジャム表

         A K Q J T 9 8 7 6 5 4 3 2
        ┌─────────────────────────
      A │ ★ ★ ★ ★ ★ ★ ★ . . . . . .
      K │ ★ ★ ★ ★ . . . . . . . . .
      Q │ ★ ★ ★ ★ . . . . . . . . .
      J │ ★ ★ . ★ . . . . . . . . .
      T │ . . . . ★ . . . . . . . .
      9 │ . . . . . ★ . . . . . . .
      ...

「★ = ジャム」「. = フォールド」。

実戦での Nash 利用

ショートスタック時

  • ナッシュチャート通り」で十分
  • 1 BB の差で判断変わる細かいライン

ディープスタック時

  • 通常戦略
  • Nash は参考程度、レンジで戦う

ナッシュ均衡から逸脱」の損失

意図的に逸脱する場合:

バリュー偏重

  • 強いハンドだけ打つ → 読まれる
  • 損失:相手が降りすぎる

ブラフ偏重

  • ブラフ多すぎ → コールされる
  • 損失:相手がコールで取る

エクスプロイトとの最適ブレンド

中級者の現実解

  • 80 % GTO + 20 % エクスプロイト

上級者の現実解

  • 60 % GTO + 40 % エクスプロイト

完全プロ

  • 状況依存、相手ごとに完全カスタマイズ

メタ・ナッシュ」の概念

ナッシュ均衡の上に「メタ層」:

  • 「相手が GTO だと思って GTO」
  • 「相手がエクスプロイトしてくると読んで、エクスプロイト返し」
  • 「相手が私のエクスプロイト返しを読んで、もう一度 GTO」

→ 無限再帰、実用性は低い。

ナッシュ均衡の制限

マルチプレイヤー

  • ヘッズアップは厳密なナッシュ存在
  • 3 人以上は「ナッシュが複数」「均衡到達難」

情報不完全

  • ポーカーは情報不完全ゲーム
  • 純粋ナッシュよりミックス戦略がベース

ナッシュ的思考」の習慣

毎ハンド「もし相手が GTO だったら、自分の戦略は最適か?」を自問:

  • この 3-bet レンジでバリュー / ブラフのバランスは?
  • この C-ベット率は GTO 的に正しい?

→ レンジ全体の整合性を意識。

練習:ナッシュ理解

問 ①:じゃんけんで自分が「グー 50 %、チョキ 25 %、パー 25 %」を打つ。相手は最適に?

答え

相手はあなたのグーを破る 「パー 100 %」 で最大利益。
→ あなたは均衡から逸脱した → 損する。

問 ②:ポーカーで「AA を 100 % リンプ」は GTO か?

答え

GTO ではない。相手が「リンプ = AA」と読み、フロップで強気に打てない → AA の価値を取り損ね。
GTO は「AA をオープン中心、たまにリンプ」のミックス。

用語まとめ

  • ナッシュ均衡:全員が最善を尽くす状態
  • Nash チャート:ショートスタックのジャム / コール表
  • メタ・ナッシュ:ナッシュの上の心理戦
  • 収束:ソルバーが均衡に近づくプロセス
  • GTO 近似:完全 GTO の近似値

このレッスンの要点

  • ナッシュ均衡 = 全員最善、誰も逸脱したくない状態
  • ポーカーで完全 GTO は計算困難、近似で実用
  • ナッシュチャートはショートスタックに有用
  • 中級者は 80 % GTO + 20 % エクスプロイトが現実解

おすすめ書籍・グッズ
世界のヨコサワの世界一やさしいポーカーの勝ち方
プリフロップからポストフロップまで、このサイトの基礎を体系的に復習できる一冊。中級者になっても手元に置きたいベストセラー。