♠️ MasterAI v2.0 | 一对一和一对多无限注德州扑克最强AI|poker bot / game theory AI

A decision intelligence AI engine for Texas Hold'em poker based on imperfect-information game theory.

♠️ MasterAI v2.0 | 一对一和一对多无限注德州扑克最强AI|poker bot / game theory AI

基于强化学习 + CFR + 深度神经网络 | 在非完美信息博弈中达到超人水平

🏆 项目定位 | Overview

MasterAI v2.0 是从 v1.0 迭代而来的德州扑克AI，在一对一和一对多无限注（No-Limit） 德州扑克中达到超人水平。它是非完美信息博弈中强化学习 + 搜索技术的重大突破。

核心能力	说明
🎯 博弈类型	一对一和一对多无限注德州扑克 (Heads-Up No-Limit)
🧠 核心算法	CFR（反事实遗憾最小化）+ 深度神经网络
📊 收敛性	在二人零和博弈中逼近纳什均衡
🔬 技术地位	MasterAI v1.0 曾战胜14位中国顶级职业选手

🧠 核心技术 | Technology

技术模块	说明
自我博弈强化学习	通过自我对弈持续进化策略
CFR算法	反事实遗憾最小化，保证收敛至纳什均衡
深度神经网络	评估博弈状态与行动价值
公共置信状态搜索	基于置信状态的单层前瞻搜索

架构组成

离线训练：使用CFR框架训练神经网络模型
在线决策：连续重解算法，动态选择最优行动

⚠️ 技术瓶颈 | Technical Bottlenecks

本项目已解决以下高难度技术问题：

瓶颈	挑战
计算量	训练状态空间达 2,560,000 × 1,750
推理延迟	3-5秒/步（已优化）
博弈树规模	Abstract CFR (400BB) 节点数超4亿

语言占比：C++ 58.4% | Python 37.6% | 其他 4%

🧠 AI Architecture

Counterfactual Regret Minimization (CFR)
Opponent Range Estimation
Action Policy Network
Game Tree Search

📊 Benchmark Results

Opponent	Winrate
Random Bot	85%
Rule-based AI	72%
CFR Baseline	58%

🎮 Demo

AI vs AI simulation
1v1 heads-up matches
Hand replay system

📸 技术架构图

训练流程	决策架构

📷 技术架构图请联系我获取

💰 获取源码 | Contact

✅ MasterAI v2.0 完整源代码 (Python + C++)
✅ 训练好的神经网络模型
✅ 部署脚本与文档

德州扑克的项目和源码链接：https://github.com/masterai-top/TexasHoldem-Poker-Complete-Solution

📱 Telegram：@xuzongbin001
📧 Email：[email protected]

👉 联系我获取演示 + 详细报价

⭐ Star 这个仓库，支持世界级德州AI的持续进化！

Introduction

MasterAI v2.0 is an iterative algorithm derived from MasterAI v1.0 It utilizes profound Reinforcement Learning + Search in imperfect-information games and achieves superhuman performance in heads-up no-limit Texas Hold’em. Furthermore, it is a major step toward developing technologies for multiagent interactions in real world. MasterAI v2.0是从MasterAI v1.0衍生出来的迭代算法，它在非完全信息游戏中利用了通用的强化学习+搜索，并在一对一无限押注的德州扑克中实现了超人的表现。此外，这是在现实世界中开发多智能体交互技术的重要一步。可以应用在线下和线上的poke游戏等各种场景；

Technology

1.MaterAI v2.0 algorithm generalizes the paradigm of self-play reinforcement learning and deep learning and search through gargantuan imperfect-information. It makes decisions by factoring in the probability distribution of different beliefs each player might have about the current state of the game and uses counterfactual Regret minimization (CFR) algorithm to search efficiently.

2.Our experiments confirmed that MasterAI does indeed converge to an approximate Nash equilibrium in two-player zero-zum game

Technical bottlenecks

Some technical bottlenecks are encountered when training the algorithm model with CFR framework. For instance, the large state space is leading to too much computation:

1.Algorithm training has a large amount of calculation (2560000 * 1750 in the paper)

2.Deployment speculation and search time is too much: 3 ~ 5 seconds

3.The number of nodes in Abstract CFR (400BB) Betting Tree is too large, more than 400 million

Contact us

The Master team is constantly exploring the innovation of AI algorithm, and hoping that like-minded technical experts from all over the world can communicate and exchange here, or join us to make MasterAI bigger and stronger together. Please feel free to contact us at Telegram：@alibaba401

Opponent modeling
Real-time decision making
Multi-agent simulation
Game theory strategy approximation
- Win rate vs baseline bots: XX%
Strategy convergence: stable
Real-time inference supported

                                                          MasterAI v2.0

一、简介

MasterAI v2.0是从MasterAI v1.0衍生出来的迭代算法，它在非完全信息游戏中利用了通用的强化学习+搜索，并在一对一无限押注的德州扑克中实现了超人的表现。此外，这是在现实世界中开发多智能体交互技术的重要一步。

二、运用技术 1）一种将自我博弈强化学习和搜索相结合推广到不完美信息游戏的算法； 2） MasterAIv2.0是源自MasterAI v1.0的迭代算法，在不完全信息游戏中实现通用的强化学习+搜索算法，该算法为一种通用的人工智能框架，基于公共置信状态，通过单层前瞻搜索，MasterAI通过考虑每个玩家对游戏当前状态可能拥有的不同置信的概率分布来做出决策,评估一对N的可能性; 3）MasterAIv2.0运用反事实遗憾最小化（CFR）,这是一种在双人零和博弈中收敛至纳什均衡的迭代算法,利用折扣原则（discounting）来显著加快收敛速度； 4）深度神经网络。

三、瓶颈使用CFR框架训练算法模型时会遇到一些技术瓶颈。例如，大的状态空间会导致过多的计算： 1）算法训练计算量大（论文中2560000 * 1750）； 2）部署推测和搜索时间过多：3 ~ 5 秒瓶颈； 3） Abstract CFR (400BB) Betting Tree的节点数量过大，超过4亿。

Name		Name	Last commit message	Last commit date
Latest commit History 15 Commits
iOS		iOS
BUILD.bazel		BUILD.bazel
Card.cpp		Card.cpp
Card.hpp		Card.hpp
CardUtil.cpp		CardUtil.cpp
CardUtil.hpp		CardUtil.hpp
Game.cpp		Game.cpp
License.md		License.md
README.md		README.md
RedisMgr.cpp		RedisMgr.cpp
RedisMgr.hpp		RedisMgr.hpp
RedisUtil.cpp		RedisUtil.cpp
RedisUtil.hpp		RedisUtil.hpp
gmock-actions_test.cc		gmock-actions_test.cc
gmock-all.cc		gmock-all.cc
gmock-cardinalities.cc		gmock-cardinalities.cc
gmock-cardinalities_test.cc		gmock-cardinalities_test.cc
gmock-function-mocker_test.cc		gmock-function-mocker_test.cc
gmock-internal-utils.cc		gmock-internal-utils.cc
gmock-internal-utils_test.cc		gmock-internal-utils_test.cc
gmock-matchers.cc		gmock-matchers.cc
gmock-spec-builders.cc		gmock-spec-builders.cc
gmock.cc		gmock.cc
gmock_all_test.cc		gmock_all_test.cc
gmock_ex_test.cc		gmock_ex_test.cc
gmock_leak_test.py		gmock_leak_test.py
gmock_leak_test_.cc		gmock_leak_test_.cc
gmock_link2_test.cc		gmock_link2_test.cc
gmock_link_test.cc		gmock_link_test.cc
gmock_link_test.h		gmock_link_test.h
gmock_main.cc		gmock_main.cc
gmock_output_test.py		gmock_output_test.py
gmock_output_test_.cc		gmock_output_test_.cc
gmock_output_test_golden.txt		gmock_output_test_golden.txt
gmock_stress_test.cc		gmock_stress_test.cc
gmock_test.cc		gmock_test.cc
gmock_test_utils.py		gmock_test_utils.py
linux-presubmit.sh		linux-presubmit.sh
macos-presubmit.sh		macos-presubmit.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

♠️ MasterAI v2.0 | 一对一和一对多无限注德州扑克最强AI|poker bot / game theory AI

🏆 项目定位 | Overview

🧠 核心技术 | Technology

架构组成

⚠️ 技术瓶颈 | Technical Bottlenecks

🧠 AI Architecture

📊 Benchmark Results

🎮 Demo

📸 技术架构图

💰 获取源码 | Contact

Introduction

Technology

Technical bottlenecks

Contact us

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

♠️ MasterAI v2.0 | 一对一和一对多无限注德州扑克最强AI|poker bot / game theory AI

🏆 项目定位 | Overview

🧠 核心技术 | Technology

架构组成

⚠️ 技术瓶颈 | Technical Bottlenecks

🧠 AI Architecture

📊 Benchmark Results

🎮 Demo

📸 技术架构图

💰 获取源码 | Contact

Introduction

Technology

Technical bottlenecks

Contact us

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages