AlphaLineupPuzzle

该项目是Lineup Puzzle游戏的AI。命名灵感来自于AlphaGo，其目的是学习并掌握AlphaGo论文中提到的相关技术。

当前进展

v0.1版本的性能

v0.1版本在单核心上运行了8天(11679分钟)，共完成248局游戏。以下是对这248局游戏存档的统计：

name	sum	mean	min	max
得分	-	155943	4500	922000
步数	133309	537	23	3142
候选	-	22.85	0	100

其中每消除一行得500分。

快速走子策略的性能

神经网络库用的是chainer。训练数据来自于v0.1的存档。

第一次尝试（v0.2）：

提取并旋转、镜面扩展了训练数据。其中前10%用于测试，后90%用于训练。其在测试集上的预测准确率为22.5%（纯蒙的话，准确率为4.38%），在训练集上的准确率为23.1%

第二次尝试（v0.3）：

python -m AlphaLineupPuzzle.preprocessing.game_converter v2 -e 1 -v -o data.h5f
python -m AlphaLineupPuzzle.training.training -i data.h5f -a 0.0005 -b 32 -n 5 -o v0.3 -v
python -m AlphaLineupPuzzle.ai -i v0.3 -c 248 | grep -E [0-9]+ | sum.sh

结论：

与随机走子对比，训练结果是有效果的。
更简单的输入输出结构能得到更好的效果。

以下是仅使用快速走子策略的得分。其中随机走子作为对照组，它仅等概率地挑选合法走子。

执行批次	策略网络v0.2	策略网络 v0.3	随机走子
第一次	5540	11260	1274
第二次	5512	13247	1304
第三次	5318	11491	1236

其中每个批次都包含248局游戏，分值为这248局的平均得分。

截图

游戏界面如下：

AI运行时如下：

Name		Name	Last commit message	Last commit date
Latest commit History 34 Commits
AlphaLineupPuzzle		AlphaLineupPuzzle
benchmarks		benchmarks
screenshots		screenshots
tests		tests
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

AlphaLineupPuzzle

当前进展

v0.1版本的性能

快速走子策略的性能

截图

About

Releases

Packages

Languages

License

zhaipro/AlphaLineupPuzzle

Folders and files

Latest commit

History

Repository files navigation

AlphaLineupPuzzle

当前进展

v0.1版本的性能

快速走子策略的性能

截图

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages