在 Python 中使用生成器进行广度优先树遍历

Breadth First Tree Traversal using Generators in Python

我正在研究如何在 David Beazly 的优秀 Python Cookbook 文本中使用 Python 中的生成器。以下代码配方非常优雅地使用生成器定义了深度优先树遍历:

# example.py
#
# Example of depth-first search using a generator

class Node:
    def __init__(self, value):
        self._value = value
        self._children = []

    def __repr__(self):
        return 'Node({!r})'.format(self._value)

    def add_child(self, node):
        self._children.append(node)

    def __iter__(self):
        return iter(self._children)

    def depth_first(self):
        yield self
        for c in self:
            yield from c.depth_first()

# Example
if __name__ == '__main__':
    root = Node(0)
    child1 = Node(1)
    child2 = Node(2)
    root.add_child(child1)
    root.add_child(child2)
    child1.add_child(Node(3))
    child1.add_child(Node(4))
    child2.add_child(Node(5))

    for ch in root.depth_first():
        print(ch)
    # Outputs: Node(0), Node(1), Node(3), Node(4), Node(2), Node(5)

我正在尝试想出一个同样优雅的方法

def breadth_first(self):
    pass

我故意不发布我一直在尝试的疯狂内容,因为我尝试过的所有内容都需要在其中维护 'state'。我不想使用传统的基于队列的解决方案。这个学术练习的重点是深入了解生成器的行为。因此,我想为上面的树创建一个使用生成器的并行 'breadth_first' 方法。

欢迎任何pointers/solutions。

如果没有一些严肃的技巧,你不能为 bfs 使用递归(堆栈),但是队列可以工作:

def breadth_first(self):
    q = [self]
    while q:
        n = q.pop(0)
        yield n
        for c in n._children:
            q.append(c)

您实施的深度优先解决方案本质上是“迭代然后递归”

def depth_first(self):
    yield self
    for c in self.children:
        yield from c.depth_first():

受到 this blog post the activestate post it references 的启发,您获得广度优先搜索作为“递归然后迭代”:

def breadth_first(self):
    yield self
    for c in self.breadth_first():
        if not c.children:
            return  # stop the recursion as soon as we hit a leaf
        yield from c.children

编辑:原来 linked 博客说 “不存在终止检查”,替换为活动状态 link,我'已经适应使用上面的 yield from

我发现它既有用又优雅,一次生成一个级别。 Python 下面 3 个生成器:

def get_level(t: Node) -> Iterable[List]:
    curr_level = [t] if t else []
    while len(curr_level) > 0:
        yield [node._value for node in curr_level]
        curr_level = [child for parent in curr_level
                            for child in parent._children
                            if child]

如果 itertools 有:

# zip_chain('ABCD', 'xy') --> A x B y C D

几乎是 itertools.chain(itertools.zip_longest()),但不完全是。

无论如何,zip_chain 允许:

def bf(self):
    yield self
    yield from zip_chain(*map(Node.bf, self.children))

我认为它也不会一次创建整行,