レッスン 87 / 100 Phase 6：中級者への入口

ナッシュ均衡の入り口

ノーベル経済学賞も受賞したナッシュ均衡。ポーカーで使われる「Nashチャート」など、数式抜きで概念を掴みます。

ナッシュ均衡（きんこう）とは

「全員が最善を尽くしているとき、誰も戦略を変えても得しない状態」。

ノーベル経済学賞の数学者ジョン・ナッシュが証明した、ゲーム理論の最重要概念。

ポーカーでは

「全プレイヤーのゲーム理論的最適（GTO）戦略の組み合わせ」
それぞれが「逸脱（いつだつ）しても損する」均衡（きんこう）点

ナッシュ均衡（きんこう）の例：じゃんけん

じゃんけんの均衡（きんこう）

各プレイヤーが「グー 1/3、チョキ 1/3、パー 1/3」
誰かが「グー 50 %」に偏ると、相手は「パー」を増やしてエクスプロイト
→ 全員 1/3 ずつが「逸脱（いつだつ）しても損する」均衡（きんこう）

ポーカーの均衡（きんこう）

各ハンドに最適な「アクション頻度」がある
AA をオープン 100 %、KK をオープン 100 %、A5s を 3-bet 70 % / コール 30 % など
全員が均衡（きんこう）戦略でプレイすれば、ナッシュ均衡（きんこう）

ポーカーでの「Nash 均衡（きんこう）」の応用

プッシュ・フォールド・ナッシュ

ショートスタック（〜 15 BB）の「ジャム or フォールド」最適戦略
ナッシュチャートとして広く公開されている

プリフロップ・ナッシュ

オープンレンジ、3-bet レンジ、4-bet レンジの均衡（きんこう）
ソルバーで計算可能

「Nash チャート」とは

ショートスタック戦略の代表的なツール：

ジャム表

スタックサイズ × ハンド = ジャム / フォールドの判定
例：12 BB のアンダーザガン（UTG）なら 55+ / A7s+ / AJo+

コール表

相手のジャムへのコール判定
例：自分 15 BB、相手 8 BB ジャム → 77+ / ATs+ コール

ナッシュ均衡（きんこう）の「美しさ」

数学的に証明された「最適」

1950 年代のナッシュの証明
全ての有限ゲームに均衡（きんこう）が存在

「戦略の安定性」

全員が均衡（きんこう）から逸脱（いつだつ）したくない
一度均衡（きんこう）に達したら維持

ナッシュ均衡（きんこう） vs エクスプロイト

戦略	特徴
ナッシュ均衡（きんこう）	損しない、長期安定
エクスプロイト	相手の弱点突き、最大利益

両者を使い分けるのが上級者。

ナッシュ均衡（きんこう）の「逆エクスプロイト」耐性

ゲーム理論的最適（GTO）（=ナッシュ）戦略の最大の強み：

相手がエクスプロイトしようとすると

自分の戦略から偏らせる
でもゲーム理論的最適（GTO）側は影響なし（=均衡（きんこう））

「安全網」

相手のレベル不明
ゲーム理論的最適（GTO）で最低限の損失保証

ポーカーの「完全ゲーム理論的最適（GTO）」は存在しない

理論的にはナッシュ均衡（きんこう）があるが、実戦では：

計算量問題

169 ハンド × 全ノード = 兆単位の組み合わせ
スーパーコンピュータでも完全計算不可能

近似ゲーム理論的最適（GTO）

ソルバーが「近似解」を計算
実用上「ほぼゲーム理論的最適（GTO）」で十分

ポーカー解の「収束」

ソルバーの動作原理：

初期戦略から開始
「もっと良い戦略」を反復計算
「もう良くならない」点 = 近似均衡（きんこう）

例：GTO Wizard

数十秒〜数時間でノード解を出す
「95 % 解」程度なら短時間
完全解は数日〜

ナッシュチャートの読み方

例：12 BB アンダーザガン（UTG）オープンジャム表

         A K Q J T 9 8 7 6 5 4 3 2
        ┌─────────────────────────
      A │ ★ ★ ★ ★ ★ ★ ★ . . . . . .
      K │ ★ ★ ★ ★ . . . . . . . . .
      Q │ ★ ★ ★ ★ . . . . . . . . .
      J │ ★ ★ . ★ . . . . . . . . .
      T │ . . . . ★ . . . . . . . .
      9 │ . . . . . ★ . . . . . . .
      ...

「★ = ジャム」「. = フォールド」。

実戦での Nash 利用

ショートスタック時

「ナッシュチャート通り」で十分
1 BB の差で判断変わる細かいライン

ディープスタック時

通常戦略
Nash は参考程度、レンジで戦う

「ナッシュ均衡（きんこう）から逸脱（いつだつ）」の損失

意図的に逸脱（いつだつ）する場合：

バリュー偏重

強いハンドだけ打つ → 読まれる
損失：相手が降りすぎる

ブラフ偏重

ブラフ多すぎ → コールされる
損失：相手がコールで取る

エクスプロイトとの最適ブレンド

中級者の現実解

80 % ゲーム理論的最適（GTO） + 20 % エクスプロイト

上級者の現実解

60 % ゲーム理論的最適（GTO） + 40 % エクスプロイト

完全プロ

状況依存、相手ごとに完全カスタマイズ

「メタ・ナッシュ」の概念

ナッシュ均衡（きんこう）の上に「メタ層」：

「相手がゲーム理論的最適（GTO）だと思ってゲーム理論的最適（GTO）」
「相手がエクスプロイトしてくると読んで、エクスプロイト返し」
「相手が私のエクスプロイト返しを読んで、もう一度ゲーム理論的最適（GTO）」

→ 無限再帰、実用性は低い。

ナッシュ均衡（きんこう）の制限

マルチプレイヤー

ヘッズアップは厳密なナッシュ存在
3 人以上は「ナッシュが複数」「均衡（きんこう）到達難」

情報不完全

ポーカーは情報不完全ゲーム
純粋ナッシュよりミックス戦略がベース

「ナッシュ的思考」の習慣

毎ハンド「もし相手がゲーム理論的最適（GTO）だったら、自分の戦略は最適か？」を自問：

例

「この 3-bet レンジでバリュー / ブラフのバランスは？」
「この C-ベット率はゲーム理論的最適（GTO）的に正しい？」

→ レンジ全体の整合性を意識。

練習：ナッシュ理解

問 ①：じゃんけんで自分が「グー 50 %、チョキ 25 %、パー 25 %」を打つ。相手は最適に？

答え

相手はあなたのグーを破る 「パー 100 %」 で最大利益。
→ あなたは均衡（きんこう）から逸脱（いつだつ）した → 損する。

問 ②：ポーカーで「AA を 100 % リンプ」はゲーム理論的最適（GTO）か？

答え

ゲーム理論的最適（GTO）ではない。相手が「リンプ = AA」と読み、フロップで強気に打てない → AA の価値を取り損ね。
ゲーム理論的最適（GTO）は「AA をオープン中心、たまにリンプ」のミックス。

用語まとめ

ナッシュ均衡（きんこう）：全員が最善を尽くす状態
Nash チャート：ショートスタックのジャム / コール表
メタ・ナッシュ：ナッシュの上の心理戦
収束：ソルバーが均衡（きんこう）に近づくプロセス
ゲーム理論的最適（GTO）近似：完全ゲーム理論的最適（GTO）の近似値

このレッスンの要点

ナッシュ均衡（きんこう） = 全員最善、誰も逸脱（いつだつ）したくない状態

ポーカーで完全ゲーム理論的最適（GTO）は計算困難、近似で実用

ナッシュチャートはショートスタックに有用

中級者は 80 % ゲーム理論的最適（GTO） + 20 % エクスプロイトが現実解

おすすめ書籍・グッズ

GTO Wizard

ナッシュ均衡（きんこう）の解を実際に確認できる世界標準のゲーム理論的最適（GTO）プラットフォーム。特定のスポットでソルバーが何を推奨するか、自分の目で確かめよう。無料プランから試せる。

GTO Wizardを無料で試す