9体のチャットボットが5日間のハイステークス・キャッシュゲームに挑戦
テクノロジーとポーカーが交差する前代未聞の実験が始まっている。9体のAIチャットボットが、PokerBattle.ai 上で $10/$20 ノーリミット・ホールデムのキャッシュゲームを 5日間・24時間体制 で戦っているのだ。各ボットには $100,000 のスタック が与えられ、最終的にどのAIが最も利益を上げるかを競う形式となっている。
このプロジェクトを立ち上げたのは、ポルトガル在住のロシア人開発者 マックス・パブロフ(Max Pavlov、33歳)。元プロダクトマネージャーであり、2010年代にプレイヤーとしても活動していたパブロフは、「言語モデルはポーカーを理解できない」という業界の通説を検証するためにこの実験を企画した。
「ポーカーコミュニティの多くは、大規模言語モデルはポーカーを考える上で信用できないと見ている」とパブロフは語る。「それが本当なのかどうか、自分で確かめてみたかったんだ。」
豪華なAIラインナップ
参加しているのは、AI業界を代表する9体のモデルだ。
| モデル名 | 開発者 |
| Gemini 2.5 Pro | |
| Grok 4 | xAI |
| Claude Sonnet 4.5 | Anthropic |
| DeepSeek R1 | DeepSeek |
| OpenAI o3 | OpenAI |
| Kimi K2 | Moonshot AI |
| Mistral Magistral | Mistral AI |
| Z.AI GLM 4.6 | Z.AI |
| Meta LLAMA 4 | MetaAI/Facebook |
これらのAIは、ポーカーブックやブログ記事など公開情報を教材に学習しており、さらに各ハンドの後に対戦相手の行動を分析・記録する仕組みを備えている。実際、Grok 4 のメモには「Meta LLAMA 4 はレイトポジションでスペキュレイティブハンドをコールし、ドロー系ボードで2回のインポジションベットにコール。その後リバーで小さくドンクベットし、コールされて負けた。ややパッシブな傾向」と記されていた。
Elon Muskの投稿で話題沸騰
このAIバトルが一気に注目を集めたきっかけは、Grok を所有する実業家 Elon Musk の投稿だった。Muskは自身のX(旧Twitter)アカウントで、Grok 4 が暫定トップに立ち、$23,749 のプラス を記録しているスクリーンショットを公開。「Know when to hold ’em」とコメントを添え、瞬く間に拡散した。
その結果、PokerBattle.ai はまとめサイト Hacker News のトップにも掲載され、テック界とポーカー界の両方で大きな話題となっている。
現時点では、Gemini 2.5 Pro が $48,658 の利益 でチップリーダー、Meta LLAMA 4 が $52,908 の損失 で最下位となっている。統計データによると、Meta LLAMA 4 は VPIP(自発的にポットへ参加した割合)が 62% と非常にルースで、OpenAI o3 は 26% とタイトなスタイルを維持している。
パブロフは「この結果だけで実力差を語るのは早い」と慎重だ。「このトーナメントデザインで本当にどのモデルが強いかを知るには、数十万ハンドが必要だろう。今回はせいぜい2〜5千ハンド程度にしかならない。」
フィル・ガルファンドがヘッズアップを提案
この実験が盛り上がる中、ポーカー界からもビッグネームが反応した。ヘッズアップのスペシャリストで、ポーカーレジェンドかつ BetRivers Poker のアンバサダー である フィル・ガルファンド(Phil Galfond) だ。
ガルファンドはX上でチャットボットとやり取りし、$100/$200 ポットリミット・オマハ のヘッズアップを 5万ハンド 行うことに同意。さらに、「盛り上げるために」として 100万ドルのサイドベット を提示した。
この対決が実現すれば、トッププロとAIチャットボットが、長期のPLOヘッズアップ戦を戦うという構図になる。
「人間はまだ安全」とパブロフ
AIポーカーへの関心が高まる一方で、パブロフは人間プレイヤーの未来を悲観していない。ボットが人間の仕事を奪うという不安について問われると、少なくともポーカーに関しては心配無用だと強調する。
「少なくともポーカーに関しては、人間はまだ安全だ。彼ら(ボット)は人間を打ち負かすほどポーカーが上手くない」とパブロフは言う。「だから、今のところ Poker GPT を恐れる必要はない。」
PokerBattle.ai は、現在の大規模言語モデルがどこまで「ポーカーを考えられるか」を示す実験だ。同時に、少なくとも今のところは、人間の方がまだ一枚上手であることも示している。







