Kosaraju 的 scc 算法
Kosaraju’s algorithm for scc
谁能给我解释一下 Kosaraju 寻找连通分量的算法背后的逻辑?
我读过description,虽然我不明白反向图上的DFS如何检测强连通分量的数量。
def dfs(visited, stack, adj, x):
visited[x] = 1
for neighbor in adj[x]:
if (visited[neighbor]==0):
dfs(visited, stack, adj, neighbor)
stack.insert(0, x)
return stack, visited
def reverse_dfs(visited, adj, x, cc):
visited[x] = 1
for neighbor in adj[x]:
if (visited[neighbor]==0):
cc += 1
reverse_dfs(visited, adj, neighbor,cc)
print(x)
return cc
def reverse_graph(adj):
vertex_num = len(adj)
new_adj = [ [] for _ in range(vertex_num)]
for i in range(vertex_num):
for j in adj[i]:
new_adj[j].append(i)
return new_adj
def find_post_order(adj):
vertex_num = len(adj)
visited = [0] * vertex_num
stack = []
for vertex in range(vertex_num):
if visited[vertex] == 0:
stack, visited = dfs(visited, stack, adj, vertex)
return stack
def number_of_strongly_connected_components(adj):
vertex_num = len(adj)
new_adj = reverse_graph(adj)
stack = find_post_order(adj)
visited = [0] * vertex_num
cc_num = 0
while (stack):
vertex = stack.pop(0)
print(vertex)
print('------')
if visited[vertex] == 0:
cc_num = reverse_dfs(visited, new_adj, vertex, cc_num)
return cc_num
if __name__ == '__main__':
input = sys.stdin.read()
data = list(map(int, input.split()))
n, m = data[0:2]
data = data[2:]
edges = list(zip(data[0:(2 * m):2], data[1:(2 * m):2]))
adj = [[] for _ in range(n)]
for (a, b) in edges:
adj[a - 1].append(b - 1)
print(number_of_strongly_connected_components(adj))
上面你可以找到我的实现。我想初始 DFS 和反向操作都正确完成了,但我不知道如何正确执行第二个 DFS。
提前致谢。
您应该注意的第一件事是,对于图及其逆向,强连通分量集是相同的。事实上,该算法实际上是在反转图中找到强连通分量的集合,而不是原始的(但没关系,因为两个图具有相同的 SCC)。
第一个 DFS 执行导致堆栈以特定顺序保存顶点,这样当第二个 DFS 按此顺序(在反转图上)在顶点上执行时,它就会正确计算 SCC。因此 运行 第一个 DFS 的全部目的是找到图顶点的排序,该排序服务于在反转图上执行 DFS 算法。现在我将解释堆栈中顶点顺序的 属性 是什么以及它如何在反转图上执行 DFS。
那么栈的属性是什么呢?假设 S1 和 S2 是图中的两个强连通分量,并且在反转图中,S2 可以从 S1 到达。显然,S1 也不能从 S2 访问,因为如果是这种情况,S1 和 S2 将合并为一个组件。令 x 为 S1 中顶点中的顶部顶点(即,S1 中的所有其他顶点在堆栈中都低于 x)。类似地,让 y 成为 S2 中顶点中的顶部顶点(同样,S2 中的所有其他顶点在堆栈中都低于 y)。 属性 是 y(属于 S2)在堆栈中位于 x(属于 S1)之上。
为什么这 属性 有帮助?我们在对反转图执行DFS的时候,是按照栈的顺序进行的。特别是,我们在探索 x 之前先探索 y。当探索 y 时,我们探索 S2 的每个顶点,并且由于 S1 的顶点无法从 S2 到达,因此我们在探索 S1 的任何顶点之前探索 S2 的所有顶点。但这适用于任何一对连接的组件,这样一个组件就可以从另一个组件到达。特别是,堆栈顶部的顶点属于一个汇组件,在我们完成对汇组件的探索后,顶部顶点再次属于一个汇,相对于由尚未探索的顶点导出的图。
因此,该算法正确计算了反转图的所有强连通分量,如前所述,与原始图中的相同。
谁能给我解释一下 Kosaraju 寻找连通分量的算法背后的逻辑?
我读过description,虽然我不明白反向图上的DFS如何检测强连通分量的数量。
def dfs(visited, stack, adj, x):
visited[x] = 1
for neighbor in adj[x]:
if (visited[neighbor]==0):
dfs(visited, stack, adj, neighbor)
stack.insert(0, x)
return stack, visited
def reverse_dfs(visited, adj, x, cc):
visited[x] = 1
for neighbor in adj[x]:
if (visited[neighbor]==0):
cc += 1
reverse_dfs(visited, adj, neighbor,cc)
print(x)
return cc
def reverse_graph(adj):
vertex_num = len(adj)
new_adj = [ [] for _ in range(vertex_num)]
for i in range(vertex_num):
for j in adj[i]:
new_adj[j].append(i)
return new_adj
def find_post_order(adj):
vertex_num = len(adj)
visited = [0] * vertex_num
stack = []
for vertex in range(vertex_num):
if visited[vertex] == 0:
stack, visited = dfs(visited, stack, adj, vertex)
return stack
def number_of_strongly_connected_components(adj):
vertex_num = len(adj)
new_adj = reverse_graph(adj)
stack = find_post_order(adj)
visited = [0] * vertex_num
cc_num = 0
while (stack):
vertex = stack.pop(0)
print(vertex)
print('------')
if visited[vertex] == 0:
cc_num = reverse_dfs(visited, new_adj, vertex, cc_num)
return cc_num
if __name__ == '__main__':
input = sys.stdin.read()
data = list(map(int, input.split()))
n, m = data[0:2]
data = data[2:]
edges = list(zip(data[0:(2 * m):2], data[1:(2 * m):2]))
adj = [[] for _ in range(n)]
for (a, b) in edges:
adj[a - 1].append(b - 1)
print(number_of_strongly_connected_components(adj))
上面你可以找到我的实现。我想初始 DFS 和反向操作都正确完成了,但我不知道如何正确执行第二个 DFS。 提前致谢。
您应该注意的第一件事是,对于图及其逆向,强连通分量集是相同的。事实上,该算法实际上是在反转图中找到强连通分量的集合,而不是原始的(但没关系,因为两个图具有相同的 SCC)。
第一个 DFS 执行导致堆栈以特定顺序保存顶点,这样当第二个 DFS 按此顺序(在反转图上)在顶点上执行时,它就会正确计算 SCC。因此 运行 第一个 DFS 的全部目的是找到图顶点的排序,该排序服务于在反转图上执行 DFS 算法。现在我将解释堆栈中顶点顺序的 属性 是什么以及它如何在反转图上执行 DFS。
那么栈的属性是什么呢?假设 S1 和 S2 是图中的两个强连通分量,并且在反转图中,S2 可以从 S1 到达。显然,S1 也不能从 S2 访问,因为如果是这种情况,S1 和 S2 将合并为一个组件。令 x 为 S1 中顶点中的顶部顶点(即,S1 中的所有其他顶点在堆栈中都低于 x)。类似地,让 y 成为 S2 中顶点中的顶部顶点(同样,S2 中的所有其他顶点在堆栈中都低于 y)。 属性 是 y(属于 S2)在堆栈中位于 x(属于 S1)之上。
为什么这 属性 有帮助?我们在对反转图执行DFS的时候,是按照栈的顺序进行的。特别是,我们在探索 x 之前先探索 y。当探索 y 时,我们探索 S2 的每个顶点,并且由于 S1 的顶点无法从 S2 到达,因此我们在探索 S1 的任何顶点之前探索 S2 的所有顶点。但这适用于任何一对连接的组件,这样一个组件就可以从另一个组件到达。特别是,堆栈顶部的顶点属于一个汇组件,在我们完成对汇组件的探索后,顶部顶点再次属于一个汇,相对于由尚未探索的顶点导出的图。
因此,该算法正确计算了反转图的所有强连通分量,如前所述,与原始图中的相同。