Bloxorz 一星搜索
Bloxorz a-Star Search
我正在努力在 Bloxorz 游戏上实施 a-Star 算法。目标是使用 1 x 1 x 2 块到达终点。我实现了算法,但它不一致。有时它不会给出最短的解决方案。例如:
maze = ['00011111110000',
'00011111110000',
'11110000011100',
'11100000001100',
'11100000001100',
'1S100111111111',
'11100111111111',
'000001E1001111',
'00000111001111']
对于这个迷宫,我的实现给出了这个结果:
U,L,U,R,R,U,R,R,R,R,R,R,D,R,D,D,D,L,L,L,D,R,D,L,U,R,U,L,D
其中有 29 步。但是有一个更短的解决方案,它有 28 步:
U,L,U,R,R,U,R,R,R,R,R,R,D,R,D,D,D,D,D,R,U,L,L,L,L,L,L,D
这是我的实现,完整代码是 here,我能为它做什么?
class Node:
def __init__(self,parent:'Node', node_type:str, x1:int, y1:int, x2:int, y2:int, direction:str=''):
self.parent = parent
self.node_type = node_type
self.g = 0
self.h = 0
self.f = 0
self.x1 = x1
self.y1 = y1
self.x2 = x2
self.y2 = y2
self.visited = False
self.direction = direction
def get_positions(self) -> tuple:
return (self.x1, self.y1, self.x2, self.y2)
def __eq__(self, other):
if type(other) is Node:
return self.x1 == other.x1 and self.y1 == other.y1 and self.x2 == other.x2 and self.y2 == other.y2
elif type(other) is tuple:
return self.x1 == other[0] and self.y1 == other[1] and self.x2 == other[2] and self.y2 == other[3]
else:
return False
def __lt__(self, other:'Node'):
return self.f < other.f
def aStar(start:Node, end:Node, grid:List[List[str]]) -> List[tuple]:
open_list = []
closed_list = []
heapq.heappush(open_list, start)
while open_list:
current:Node = heapq.heappop(open_list)
if current == end:
return reconstruct_path(current)
closed_list.append(current)
for neighbor in get_neighbors(current, grid):
if neighbor not in closed_list:
neighbor.g = current.g + 1
neighbor.h = get_heuristic(neighbor, end)
neighbor.f = neighbor.g + neighbor.h
if neighbor not in open_list:
heapq.heappush(open_list, neighbor)
return []
def reconstruct_path(current:Node) -> List[tuple]:
path = []
while current.parent is not None:
path.append(current.direction)
current = current.parent
return ''.join(path[::-1])
def get_heuristic(current:Node, end:Node) -> int:
return max(abs(current.x2 - end.x1), abs(current.y2 - end.y1))
假设您实施中的其他所有内容都是正确的,那只是因为您的启发式算法不可接受。
考虑迷宫:
B 1 1 X
您可以在 2 步内达到目标:
1 B B X : move1
1 1 1 B : move2
但是您的启发式建议至少需要 3 步
max(abs(current.x2 - end.x1), abs(current.y2 - end.y1))
= max(abs(0-3), abs(0-0)) = max(3, 0) = 3
启发式函数不能高估达到 A* 始终给出最佳路径的目标所需的移动次数,因为这样做可能会在达到目标时留下未探索的潜在最佳路径(最佳路径可能从未扩展过,因为它的成本被 h(n) 高估了)。
你会想要一个启发式算法,它考虑到给定坐标在任何给定移动中最多可以改变 2 的事实(当一个块从站立变为躺着,反之亦然)。为此,您可以将当前启发式函数的结果除以 2。
def get_heuristic(current:Node, end:Node) -> int:
return 1/2 * max(abs(current.x2 - end.x1), abs(current.y2 - end.y1))
这给出了长度为 28 的路径 ULURRURRRRRRDRDDDDDRULLLLLLD
。
正如间接说明的那样,问题出在启发式函数上。 inordirection 的回答不能直接起作用,但给了我一些想法,我想出了一个可行的方法。
return 1/4 * max(max(abs(current.x1 - end.x1), abs(current.y1 - end.y1)), max(abs(current.x2 - end.x2), abs(current.y2 - end.y2)))
因为可能有两个点定位块我应该从端选择 x1 和 x2 的最大差,从端选择 y1 和 y2 而不是选择它们中的最大值并乘以 1/4 因为它是从 4 个点中选择的.
我正在努力在 Bloxorz 游戏上实施 a-Star 算法。目标是使用 1 x 1 x 2 块到达终点。我实现了算法,但它不一致。有时它不会给出最短的解决方案。例如:
maze = ['00011111110000',
'00011111110000',
'11110000011100',
'11100000001100',
'11100000001100',
'1S100111111111',
'11100111111111',
'000001E1001111',
'00000111001111']
对于这个迷宫,我的实现给出了这个结果:
U,L,U,R,R,U,R,R,R,R,R,R,D,R,D,D,D,L,L,L,D,R,D,L,U,R,U,L,D
其中有 29 步。但是有一个更短的解决方案,它有 28 步:
U,L,U,R,R,U,R,R,R,R,R,R,D,R,D,D,D,D,D,R,U,L,L,L,L,L,L,D
这是我的实现,完整代码是 here,我能为它做什么?
class Node:
def __init__(self,parent:'Node', node_type:str, x1:int, y1:int, x2:int, y2:int, direction:str=''):
self.parent = parent
self.node_type = node_type
self.g = 0
self.h = 0
self.f = 0
self.x1 = x1
self.y1 = y1
self.x2 = x2
self.y2 = y2
self.visited = False
self.direction = direction
def get_positions(self) -> tuple:
return (self.x1, self.y1, self.x2, self.y2)
def __eq__(self, other):
if type(other) is Node:
return self.x1 == other.x1 and self.y1 == other.y1 and self.x2 == other.x2 and self.y2 == other.y2
elif type(other) is tuple:
return self.x1 == other[0] and self.y1 == other[1] and self.x2 == other[2] and self.y2 == other[3]
else:
return False
def __lt__(self, other:'Node'):
return self.f < other.f
def aStar(start:Node, end:Node, grid:List[List[str]]) -> List[tuple]:
open_list = []
closed_list = []
heapq.heappush(open_list, start)
while open_list:
current:Node = heapq.heappop(open_list)
if current == end:
return reconstruct_path(current)
closed_list.append(current)
for neighbor in get_neighbors(current, grid):
if neighbor not in closed_list:
neighbor.g = current.g + 1
neighbor.h = get_heuristic(neighbor, end)
neighbor.f = neighbor.g + neighbor.h
if neighbor not in open_list:
heapq.heappush(open_list, neighbor)
return []
def reconstruct_path(current:Node) -> List[tuple]:
path = []
while current.parent is not None:
path.append(current.direction)
current = current.parent
return ''.join(path[::-1])
def get_heuristic(current:Node, end:Node) -> int:
return max(abs(current.x2 - end.x1), abs(current.y2 - end.y1))
假设您实施中的其他所有内容都是正确的,那只是因为您的启发式算法不可接受。
考虑迷宫:
B 1 1 X
您可以在 2 步内达到目标:
1 B B X : move1
1 1 1 B : move2
但是您的启发式建议至少需要 3 步
max(abs(current.x2 - end.x1), abs(current.y2 - end.y1))
= max(abs(0-3), abs(0-0)) = max(3, 0) = 3
启发式函数不能高估达到 A* 始终给出最佳路径的目标所需的移动次数,因为这样做可能会在达到目标时留下未探索的潜在最佳路径(最佳路径可能从未扩展过,因为它的成本被 h(n) 高估了)。
你会想要一个启发式算法,它考虑到给定坐标在任何给定移动中最多可以改变 2 的事实(当一个块从站立变为躺着,反之亦然)。为此,您可以将当前启发式函数的结果除以 2。
def get_heuristic(current:Node, end:Node) -> int:
return 1/2 * max(abs(current.x2 - end.x1), abs(current.y2 - end.y1))
这给出了长度为 28 的路径 ULURRURRRRRRDRDDDDDRULLLLLLD
。
正如间接说明的那样,问题出在启发式函数上。 inordirection 的回答不能直接起作用,但给了我一些想法,我想出了一个可行的方法。
return 1/4 * max(max(abs(current.x1 - end.x1), abs(current.y1 - end.y1)), max(abs(current.x2 - end.x2), abs(current.y2 - end.y2)))
因为可能有两个点定位块我应该从端选择 x1 和 x2 的最大差,从端选择 y1 和 y2 而不是选择它们中的最大值并乘以 1/4 因为它是从 4 个点中选择的.