如何制作一款自我提升的 Tic Tac Toe Mega(10x10 棋盘)游戏

How to make a Self-Improving Tic Tac Toe Mega (10x10 board) game

我制作了一个井字游戏(10x10 棋盘大小)机器人。它比普通人玩得更好。

棋盘尺寸为 10x10 而不是 3x3。必须连续放置 5 个 O 或 X 才能获胜,而不是 3 个。

因此,我使用 Minimax + Board Evaluation Function + Limited Available Moves 制作了该机器人以提高性能。

让我解释一下我的代码。

首先,我单独使用了 Minimax 算法,但意识到了这一点。第一步有大约 100 种可能的状态,第二步有 100*99,第三步有 100*99*98。

并且可能不可能计算出所有可能的棋盘状态。

所以,我所做的是创建了一个董事会评估功能。

我对棋盘评价功能设置了一些规则,无论Bot玩多少局都是一样的。

但我想做一个董事会评估功能,它可以自我改进或给我一些数据,我可以用它来改进它。我想不出井字游戏的任何方法,你们可以吗?

谢谢

执行此操作的一种方法是生成有关棋盘状态的统计信息。创建一个具有有效棋盘状态 1:1 的棋盘哈希函数,并填充所采取动作的字典。记录每个棋盘状态下的每个动作 wins/losses,并根据给定选项的获胜百分比对动作选择应用权重。

这是内存密集型的,但您可以通过使用在板旋转和镜像上不变的散列来将其提高 8 倍(通常,您可以散列当前状态的所有 8 次旋转和翻转,并且始终 return 例如,最小值;可能有一个不那么暴力的选项。)

另一项改进是不记录您在展望 window 中保证 win/lose 的任何游戏的动作,尽管这是一个较小的百分比改进。