Kosaraju 的 scc 算法

Kosaraju’s algorithm for scc

谁能给我解释一下 Kosaraju 寻找连通分量的算法背后的逻辑?

我读过description,虽然我不明白反向图上的DFS如何检测强连通分量的数量。

def dfs(visited, stack, adj, x):
    visited[x] = 1

    for neighbor in adj[x]:
        if (visited[neighbor]==0):
            dfs(visited, stack, adj, neighbor)

    stack.insert(0, x)
    return stack, visited

def reverse_dfs(visited, adj, x, cc):
    visited[x] = 1

    for neighbor in adj[x]:
        if (visited[neighbor]==0):
            cc += 1
            reverse_dfs(visited, adj, neighbor,cc)
    print(x)
    return cc


def reverse_graph(adj):
    vertex_num = len(adj)
    new_adj = [ [] for _ in range(vertex_num)]
    for i in range(vertex_num):
        for j in adj[i]:
            new_adj[j].append(i)
    return new_adj


def find_post_order(adj):
    vertex_num = len(adj)
    visited = [0] * vertex_num
    stack = []

    for vertex in range(vertex_num):
        if visited[vertex] == 0:
            stack, visited = dfs(visited, stack, adj, vertex)

    return stack


def number_of_strongly_connected_components(adj):
    vertex_num = len(adj)
    new_adj = reverse_graph(adj)
    stack = find_post_order(adj)

    visited = [0] * vertex_num
    cc_num = 0
    while (stack):
        vertex = stack.pop(0)
        print(vertex)
        print('------')
        if visited[vertex] == 0:
            cc_num = reverse_dfs(visited, new_adj, vertex, cc_num)
    return cc_num

if __name__ == '__main__':
    input = sys.stdin.read()
    data = list(map(int, input.split()))
    n, m = data[0:2]
    data = data[2:]
    edges = list(zip(data[0:(2 * m):2], data[1:(2 * m):2]))
    adj = [[] for _ in range(n)]
    for (a, b) in edges:
        adj[a - 1].append(b - 1)
    print(number_of_strongly_connected_components(adj))

上面你可以找到我的实现。我想初始 DFS 和反向操作都正确完成了,但我不知道如何正确执行第二个 DFS。 提前致谢。

您应该注意的第一件事是,对于图及其逆向,强连通分量集是相同的。事实上,该算法实际上是在反转图中找到强连通分量的集合,而不是原始的(但没关系,因为两个图具有相同的 SCC)。

第一个 DFS 执行导致堆栈以特定顺序保存顶点,这样当第二个 DFS 按此顺序(在反转图上)在顶点上执行时,它就会正确计算 SCC。因此 运行 第一个 DFS 的全部目的是找到图顶点的排序,该排序服务于在反转图上执行 DFS 算法。现在我将解释堆栈中顶点顺序的 属性 是什么以及它如何在反转图上执行 DFS。

那么栈的属性是什么呢?假设 S1 和 S2 是图中的两个强连通分量,并且在反转图中,S2 可以从 S1 到达。显然,S1 也不能从 S2 访问,因为如果是这种情况,S1 和 S2 将合并为一个组件。令 x 为 S1 中顶点中的顶部顶点(即,S1 中的所有其他顶点在堆栈中都低于 x)。类似地,让 y 成为 S2 中顶点中的顶部顶点(同样,S2 中的所有其他顶点在堆栈中都低于 y)。 属性 是 y(属于 S2)在堆栈中位于 x(属于 S1)之上。

为什么这 属性 有帮助?我们在对反转图执行DFS的时候,是按照栈的顺序进行的。特别是,我们在探索 x 之前先探索 y。当探索 y 时,我们探索 S2 的每个顶点,并且由于 S1 的顶点无法从 S2 到达,因此我们在探索 S1 的任何顶点之前探索 S2 的所有顶点。但这适用于任何一对连接的组件,这样一个组件就可以从另一个组件到达。特别是,堆栈顶部的顶点属于一个汇组件,在我们完成对汇组件的探索后,顶部顶点再次属于一个汇,相对于由尚未探索的顶点导出的图。

因此,该算法正确计算了反转图的所有强连通分量,如前所述,与原始图中的相同。