NetLogo:2048 机器人优化

NetLogo: 2048 bot optimisation

我正在尝试制作 2048 游戏的 Netlogo 模拟。我已经实现了三个由权重参数确定的启发式函数,并且想使用行为 space 到 运行 模拟并检查什么是赢得这场比赛的最佳策略。

过程搜索使用export/import-world原语搜索可能的着法并选择启发式函数具有最高值的着法。

问题是这个过程非常慢(由于导入世界功能每回合被调用四次)。您是否有任何想法如何在不经常导出和导入世界的情况下实现这一点?

这是我的 AI 简介项目 class。几天后到期,我似乎找不到任何解决方案。

代码的相关部分如下。程序 move-(direction) 都正常工作并且变量 moveable? 如果正方形可以在所述方向上移动则为真,否则为假。在 move-(direction).

调用的过程 moveable-check 中进行检查

非常感谢您的帮助。 :)

to search

  let x 0
  let direction "down"

  export-world "state.csv"
  move-up
  ifelse not any? squares with [moveable?]
     [set h-value -5000]
     [set x h-value
     set direction "up"
     import-world "state.csv"]


  export-world "state.csv"
  move-down
  ifelse not any? squares with [moveable?]
     [set h-value -5000]
     [if h-value > x
        [set x h-value
        set direction "down"]
     import-world "state.csv"]


    export-world "state.csv"
  move-left
  ifelse not any? squares with [moveable?]
     [set h-value -5000]
     [if h-value > x
        [set x h-value
        set direction "left"]
     import-world "state.csv"]

   export-world "state.csv"
  move-right
  ifelse not any? squares with [moveable?]
     [set h-value -5000]
     [if h-value > x
        [set x h-value
        set direction "right"]
     import-world "state.csv"]

  ifelse direction = "up"
    [move-up
      print "up"]
    [ifelse direction = "down"
      [move-down
        print "down"]
      [ifelse direction = "right"
        [move-right
          print "right"]
        [move-left
          print "left"]]]
   if not any? squares with [moveable?]
     [
       ask squares [set heading heading + 90]
       moveable-check
       if not any? squares with [moveable?]
          [ask squares [set heading heading + 90]
           moveable-check
           if not any? squares with [moveable?]
              [ask squares [set heading heading + 90]
               moveable-check
               if not any? squares with [moveable?]
                  [stop]]]
       ]
end

您需要能够保存和恢复的最重要也是最困难的信息是方块。如果没有 import-worldexport-world,这很容易做到(请注意以下使用 NetLogo 6 语法;如果您仍在使用 NetLogo 5,则需要在 foreach):

to-report serialize-state
  report [(list xcor ycor value)] of squares
end

to restore-state [ state ]
  clear-squares
  foreach state [ [sq] ->
    create-squares 1 [
      setxy (item 0 sq) (item 1 sq)
      set heading 0 ;; or whatever
      set value item 2 sq
    ]
  ]
end

value 上面只是展示了如何存储方块的任意变量。我不确定您与他们关联或需要恢复哪些数据。此代码背后的想法是,您将有关方块的信息存储在列表列表中,其中每个内部列表包含一个方块的数据。那么你使用它的方式是:

let state serialize-state
;; make changes to state that you want to investigate
restore-state state

您可能还需要存储一些全局变量等。这些可以存储在局部变量或 state 列表中(更通用,但更难实现)。

其他一些想法:

  • 现在看起来你只看到前方的一个状态,并且只有一个可能放置新方块的位置(通过知道新方块的确切位置确保你没有作弊将)。最终,您可能希望使用一种树搜索进行任意前瞻。这棵树长得非常快。如果这样做,您将需要使用修剪策略,例如: https://en.wikipedia.org/wiki/Alpha%E2%80%93beta_pruning 。此外,这使得状态恢复变得更加困难,但仍然可行。您将存储一堆状态而不是单个状态。
  • 您可以 right 90rt 90.
  • 而不是 set heading heading + 90