Kosaraju 的 scc 算法

Question

谁能给我解释一下 Kosaraju 寻找连通分量的算法背后的逻辑？

我读过description，虽然我不明白反向图上的DFS如何检测强连通分量的数量。

def dfs(visited, stack, adj, x):
    visited[x] = 1

    for neighbor in adj[x]:
        if (visited[neighbor]==0):
            dfs(visited, stack, adj, neighbor)

    stack.insert(0, x)
    return stack, visited

def reverse_dfs(visited, adj, x, cc):
    visited[x] = 1

    for neighbor in adj[x]:
        if (visited[neighbor]==0):
            cc += 1
            reverse_dfs(visited, adj, neighbor,cc)
    print(x)
    return cc


def reverse_graph(adj):
    vertex_num = len(adj)
    new_adj = [ [] for _ in range(vertex_num)]
    for i in range(vertex_num):
        for j in adj[i]:
            new_adj[j].append(i)
    return new_adj


def find_post_order(adj):
    vertex_num = len(adj)
    visited = [0] * vertex_num
    stack = []

    for vertex in range(vertex_num):
        if visited[vertex] == 0:
            stack, visited = dfs(visited, stack, adj, vertex)

    return stack


def number_of_strongly_connected_components(adj):
    vertex_num = len(adj)
    new_adj = reverse_graph(adj)
    stack = find_post_order(adj)

    visited = [0] * vertex_num
    cc_num = 0
    while (stack):
        vertex = stack.pop(0)
        print(vertex)
        print('------')
        if visited[vertex] == 0:
            cc_num = reverse_dfs(visited, new_adj, vertex, cc_num)
    return cc_num

if __name__ == '__main__':
    input = sys.stdin.read()
    data = list(map(int, input.split()))
    n, m = data[0:2]
    data = data[2:]
    edges = list(zip(data[0:(2 * m):2], data[1:(2 * m):2]))
    adj = [[] for _ in range(n)]
    for (a, b) in edges:
        adj[a - 1].append(b - 1)
    print(number_of_strongly_connected_components(adj))

上面你可以找到我的实现。我想初始 DFS 和反向操作都正确完成了，但我不知道如何正确执行第二个 DFS。提前致谢。

Answer 1

您应该注意的第一件事是，对于图及其逆向，强连通分量集是相同的。事实上，该算法实际上是在反转图中找到强连通分量的集合，而不是原始的（但没关系，因为两个图具有相同的 SCC）。

第一个 DFS 执行导致堆栈以特定顺序保存顶点，这样当第二个 DFS 按此顺序（在反转图上）在顶点上执行时，它就会正确计算 SCC。因此运行第一个 DFS 的全部目的是找到图顶点的排序，该排序服务于在反转图上执行 DFS 算法。现在我将解释堆栈中顶点顺序的属性是什么以及它如何在反转图上执行 DFS。

那么栈的属性是什么呢？假设 S1 和 S2 是图中的两个强连通分量，并且在反转图中，S2 可以从 S1 到达。显然，S1 也不能从 S2 访问，因为如果是这种情况，S1 和 S2 将合并为一个组件。令 x 为 S1 中顶点中的顶部顶点（即，S1 中的所有其他顶点在堆栈中都低于 x）。类似地，让 y 成为 S2 中顶点中的顶部顶点（同样，S2 中的所有其他顶点在堆栈中都低于 y）。属性是 y（属于 S2）在堆栈中位于 x（属于 S1）之上。

为什么这属性有帮助？我们在对反转图执行DFS的时候，是按照栈的顺序进行的。特别是，我们在探索 x 之前先探索 y。当探索 y 时，我们探索 S2 的每个顶点，并且由于 S1 的顶点无法从 S2 到达，因此我们在探索 S1 的任何顶点之前探索 S2 的所有顶点。但这适用于任何一对连接的组件，这样一个组件就可以从另一个组件到达。特别是，堆栈顶部的顶点属于一个汇组件，在我们完成对汇组件的探索后，顶部顶点再次属于一个汇，相对于由尚未探索的顶点导出的图。

因此，该算法正确计算了反转图的所有强连通分量，如前所述，与原始图中的相同。

Kosaraju 的 scc 算法

Kosaraju’s algorithm for scc

python

algorithm

graph

kosaraju-algorithm