ナッシュ均衡の入り口
ノーベル経済学賞も受賞したナッシュ均衡。ポーカーで使われる「Nashチャート」など、数式抜きで概念を掴みます。
ナッシュ均衡とは
「全員が最善を尽くしているとき、誰も戦略を変えても得しない状態」。
ノーベル経済学賞の数学者 ジョン・ナッシュ が証明した、ゲーム理論の最重要概念。
ポーカーでは
- 「全プレイヤーの GTO 戦略の組み合わせ」
- それぞれが「逸脱しても損する」均衡点
ナッシュ均衡の例:じゃんけん
じゃんけんの均衡
- 各プレイヤーが「グー 1/3、チョキ 1/3、パー 1/3」
- 誰かが「グー 50 %」に偏ると、相手は「パー」を増やしてエクスプロイト
- → 全員 1/3 ずつが「逸脱しても損する」均衡
ポーカーの均衡
- 各ハンドに最適な「アクション頻度」がある
- AA をオープン 100 %、KK をオープン 100 %、A5s を 3-bet 70 % / コール 30 % など
- 全員が均衡戦略でプレイすれば、ナッシュ均衡
ポーカーでの「Nash 均衡」の応用
プッシュ・フォールド・ナッシュ
- ショートスタック(〜 15 BB)の「ジャム or フォールド」最適戦略
- ナッシュチャートとして広く公開されている
プリフロップ・ナッシュ
- オープンレンジ、3-bet レンジ、4-bet レンジの均衡
- ソルバーで計算可能
「Nash チャート」とは
ショートスタック戦略の代表的なツール:
ジャム表
- スタックサイズ × ハンド = ジャム / フォールド の判定
- 例:12 BB の UTG なら 55+ / A7s+ / AJo+
コール表
- 相手のジャムへのコール判定
- 例:自分 15 BB、相手 8 BB ジャム → 77+ / ATs+ コール
ナッシュ均衡の「美しさ」
数学的に証明された「最適」
- 1950 年代のナッシュの証明
- 全ての有限ゲームに均衡が存在
「戦略の安定性」
- 全員が均衡から逸脱したくない
- 一度均衡に達したら維持
ナッシュ均衡 vs エクスプロイト
| 戦略 | 特徴 |
|---|---|
| ナッシュ均衡 | 損しない、長期安定 |
| エクスプロイト | 相手の弱点突き、最大利益 |
両者を使い分けるのが上級者。
ナッシュ均衡の「逆エクスプロイト」耐性
GTO(=ナッシュ)戦略の最大の強み:
相手がエクスプロイトしようとすると
- 自分の戦略から偏らせる
- でも GTO 側は影響なし(=均衡)
「安全網」
- 相手のレベル不明
- GTO で最低限の損失保証
ポーカーの「完全 GTO」は存在しない
理論的にはナッシュ均衡があるが、実戦では:
計算量問題
- 169 ハンド × 全ノード = 兆単位の組み合わせ
- スーパーコンピュータでも完全計算不可能
近似 GTO
- ソルバーが「近似解」を計算
- 実用上「ほぼ GTO」で十分
ポーカー解の「収束」
ソルバーの動作原理:
- 初期戦略から開始
- 「もっと良い戦略」を反復計算
- 「もう良くならない」点 = 近似均衡
例:GTO Wizard
- 数十秒〜数時間でノード解を出す
- 「95 % 解」程度なら短時間
- 完全解は数日〜
ナッシュチャートの読み方
例:12 BB UTG オープンジャム表
A K Q J T 9 8 7 6 5 4 3 2
┌─────────────────────────
A │ ★ ★ ★ ★ ★ ★ ★ . . . . . .
K │ ★ ★ ★ ★ . . . . . . . . .
Q │ ★ ★ ★ ★ . . . . . . . . .
J │ ★ ★ . ★ . . . . . . . . .
T │ . . . . ★ . . . . . . . .
9 │ . . . . . ★ . . . . . . .
...
「★ = ジャム」「. = フォールド」。
実戦での Nash 利用
ショートスタック時
- 「ナッシュチャート通り」で十分
- 1 BB の差で判断変わる細かいライン
ディープスタック時
- 通常戦略
- Nash は参考程度、レンジで戦う
「ナッシュ均衡から逸脱」の損失
意図的に逸脱する場合:
バリュー偏重
- 強いハンドだけ打つ → 読まれる
- 損失:相手が降りすぎる
ブラフ偏重
- ブラフ多すぎ → コールされる
- 損失:相手がコールで取る
エクスプロイトとの最適ブレンド
中級者の現実解
- 80 % GTO + 20 % エクスプロイト
上級者の現実解
- 60 % GTO + 40 % エクスプロイト
完全プロ
- 状況依存、相手ごとに完全カスタマイズ
「メタ・ナッシュ」の概念
ナッシュ均衡の上に「メタ層」:
- 「相手が GTO だと思って GTO」
- 「相手がエクスプロイトしてくると読んで、エクスプロイト返し」
- 「相手が私のエクスプロイト返しを読んで、もう一度 GTO」
→ 無限再帰、実用性は低い。
ナッシュ均衡の制限
マルチプレイヤー
- ヘッズアップは厳密なナッシュ存在
- 3 人以上は「ナッシュが複数」「均衡到達難」
情報不完全
- ポーカーは情報不完全ゲーム
- 純粋ナッシュよりミックス戦略がベース
「ナッシュ的思考」の習慣
毎ハンド「もし相手が GTO だったら、自分の戦略は最適か?」を自問:
例
- 「この 3-bet レンジでバリュー / ブラフのバランスは?」
- 「この C-ベット率は GTO 的に正しい?」
→ レンジ全体の整合性を意識。
練習:ナッシュ理解
問 ①:じゃんけんで自分が「グー 50 %、チョキ 25 %、パー 25 %」を打つ。相手は最適に?
答え
相手はあなたのグーを破る 「パー 100 %」 で最大利益。
→ あなたは均衡から逸脱した → 損する。
問 ②:ポーカーで「AA を 100 % リンプ」は GTO か?
答え
GTO ではない。相手が「リンプ = AA」と読み、フロップで強気に打てない → AA の価値を取り損ね。
GTO は「AA をオープン中心、たまにリンプ」のミックス。
用語まとめ
- ナッシュ均衡:全員が最善を尽くす状態
- Nash チャート:ショートスタックのジャム / コール表
- メタ・ナッシュ:ナッシュの上の心理戦
- 収束:ソルバーが均衡に近づくプロセス
- GTO 近似:完全 GTO の近似値
このレッスンの要点
- ナッシュ均衡 = 全員最善、誰も逸脱したくない状態
- ポーカーで完全 GTO は計算困難、近似で実用
- ナッシュチャートはショートスタックに有用
- 中級者は 80 % GTO + 20 % エクスプロイトが現実解
おすすめ書籍・グッズ
世界のヨコサワの世界一やさしいポーカーの勝ち方
プリフロップからポストフロップまで、このサイトの基礎を体系的に復習できる一冊。中級者になっても手元に置きたいベストセラー。