DeepMind开源强化学习游戏框架,25款线上游戏等你来挑战
选自GitHub
强化学习算法没有游戏训练?DeepMind 开源 OpenSpiel 平台了。研究者可在线部署游戏环境,快速开始实验。

项目地址:https://github.com/deepmind/open_spiel
单人或多人博弈;
完美信息或不完美信息博弈;
带有随机性的博弈;
普通的多玩家「一步」或二人玩家的多步博弈;
交替行动(如下棋)或同时行动的游戏;
零和博弈和非零和博弈(如需要合作的博弈等)。
C++11
Python 3
以及一个支持 Swift 语言的缩减版


import random
import pyspiel
game = pyspiel.load_game("kuhn_poker")
state = game.new_initial_state()
while not state.is_terminal():
legal_actions = state.legal_actions()
if state.is_chance_node():
# Sample a chance event outcome.
outcomes_with_probs = state.chance_outcomes()
action_list, prob_list = zip(*outcomes_with_probs)
action = np.random.choice(action_list, p=prob_list)
state.apply_action(action)
else:
# The algorithm can pick an action based on an observation (fully observable
# games) or an information state (information available for that player)
# We arbitrarily select the first available action as an example.
action = legal_actions[0]
state.apply_action(action)
virtualenc -p python3 venv
source venv/bin/activate
pip3 install -r requirements.txt
mkdir build
cd build
CXX=g++ cmake -DPython_TARGET_VERSION=3.6 -DCMAKE_CXX_COMPILER=${CXX} ../open_spiel
make -j$(nproc)
ctest -j$(nproc)
./open_spiel/scripts/build_and_run_tests.sh
export PYTHONPATH=$PYTHONPATH:/
export PYTHONPATH=$PYTHONPATH://build/python
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
关注网络尖刀微信公众号随时掌握互联网精彩
赞助链接
排名
热点
搜索指数
- 1 中法元首相会都江堰 7904592
- 2 中方不接受日方所谓交涉 已当场驳回 7808017
- 3 大闸蟹为何会在欧美泛滥成灾 7714535
- 4 国际机构看中国经济 关键词亮了 7618878
- 5 家长称婴儿被褥印不雅英文单词 7522355
- 6 日方军机滋扰擅闯或被视为训练靶标 7427200
- 7 长沙一男子要取现20万 银行紧急报警 7327859
- 8 国乒8比1击败日本队 11战全胜夺冠 7234241
- 9 男子海洋馆内抽烟被白鲸喷水浇灭 7142792
- 10 千吨级“巨无霸”就位 7044122







机器之心
