Bloxorz 一星搜索

Bloxorz a-Star Search

我正在努力在 Bloxorz 游戏上实施 a-Star 算法。目标是使用 1 x 1 x 2 块到达终点。我实现了算法,但它不一致。有时它不会给出最短的解决方案。例如:

maze = ['00011111110000',
        '00011111110000',
        '11110000011100',
        '11100000001100',
        '11100000001100',
        '1S100111111111',
        '11100111111111',
        '000001E1001111',
        '00000111001111']

对于这个迷宫,我的实现给出了这个结果:

U,L,U,R,R,U,R,R,R,R,R,R,D,R,D,D,D,L,L,L,D,R,D,L,U,R,U,L,D

其中有 29 步。但是有一个更短的解决方案,它有 28 步:

U,L,U,R,R,U,R,R,R,R,R,R,D,R,D,D,D,D,D,R,U,L,L,L,L,L,L,D

这是我的实现,完整代码是 here,我能为它做什么?

class Node:
    def __init__(self,parent:'Node', node_type:str, x1:int, y1:int, x2:int, y2:int, direction:str=''):
        self.parent = parent
        self.node_type = node_type
        self.g = 0
        self.h = 0
        self.f = 0
        self.x1 = x1
        self.y1 = y1
        self.x2 = x2
        self.y2 = y2
        self.visited = False
        self.direction = direction
    def get_positions(self) -> tuple:
        return (self.x1, self.y1, self.x2, self.y2)
    def __eq__(self, other):
        if type(other) is Node:
            return self.x1 == other.x1 and self.y1 == other.y1 and self.x2 == other.x2 and self.y2 == other.y2
        elif type(other) is tuple:
            return self.x1 == other[0] and self.y1 == other[1] and self.x2 == other[2] and self.y2 == other[3]
        else:
            return False
    def __lt__(self, other:'Node'):
        return self.f < other.f

def aStar(start:Node, end:Node, grid:List[List[str]]) -> List[tuple]:
    open_list = []
    closed_list = []
    heapq.heappush(open_list, start)
    while open_list:
        current:Node = heapq.heappop(open_list)
        if current == end:
            return reconstruct_path(current)
        closed_list.append(current)
        for neighbor in get_neighbors(current, grid):
            if neighbor not in closed_list:
                neighbor.g = current.g + 1
                neighbor.h = get_heuristic(neighbor, end)
                neighbor.f = neighbor.g + neighbor.h
                if neighbor not in open_list:
                    heapq.heappush(open_list, neighbor)
    return []

def reconstruct_path(current:Node) -> List[tuple]:
    path = []
    while current.parent is not None:
        path.append(current.direction)
        current = current.parent
    return ''.join(path[::-1])

def get_heuristic(current:Node, end:Node) -> int:
    return max(abs(current.x2 - end.x1), abs(current.y2 - end.y1))

假设您实施中的其他所有内容都是正确的,那只是因为您的启发式算法不可接受。

考虑迷宫:

B 1 1 X

您可以在 2 步内达到目标:

1 B B X : move1
1 1 1 B : move2

但是您的启发式建议至少需要 3 步

max(abs(current.x2 - end.x1), abs(current.y2 - end.y1))
= max(abs(0-3), abs(0-0)) = max(3, 0) = 3

启发式函数不能高估达到 A* 始终给出最佳路径的目标所需的移动次数,因为这样做可能会在达到目标时留下未探索的潜在最佳路径(最佳路径可能从未扩展过,因为它的成本被 h(n) 高估了)。

你会想要一个启发式算法,它考虑到给定坐标在任何给定移动中最多可以改变 2 的事实(当一个块从站立变为躺着,反之亦然)。为此,您可以将当前启发式函数的结果除以 2。

def get_heuristic(current:Node, end:Node) -> int:
    return 1/2 * max(abs(current.x2 - end.x1), abs(current.y2 - end.y1))

这给出了长度为 28 的路径 ULURRURRRRRRDRDDDDDRULLLLLLD

正如间接说明的那样,问题出在启发式函数上。 inordirection 的回答不能直接起作用,但给了我一些想法,我想出了一个可行的方法。

return 1/4 * max(max(abs(current.x1 - end.x1), abs(current.y1 - end.y1)), max(abs(current.x2 - end.x2), abs(current.y2 - end.y2)))

因为可能有两个点定位块我应该从端选择 x1 和 x2 的最大差,从端选择 y1 和 y2 而不是选择它们中的最大值并乘以 1/4 因为它是从 4 个点中选择的.