如何在 Networkx 图中生成组件 ID?

How to generate the component id in the Networkx graph?

我有一个使用 Networkx 包生成的大型图形网络。

我在这里添加一个示例

import networkx as nx
import pandas as pd

G = nx.path_graph(4)
nx.add_path(G, [10, 11, 12])

我正在尝试创建一个 dataframe 节点、度数、组件 ID、组件。

使用

创建学位
degrees = list(nx.degree(G))

data = pd.DataFrame([list(d) for d in degrees], columns=['Node', 'degree']).sort_values('degree', ascending=False)

提取的组件使用

Gcc = sorted(nx.connected_components(G), key=len, reverse=True)

Gcc
[{0, 1, 2, 3}, {10, 11, 12}]

并且不确定如何在数据中创建 Component IDcomponents

所需输出:

  Node  degree  ComponentID  Components
1   1   2           1         {0, 1, 2, 3}
2   2   2           1         {0, 1, 2, 3}
5   11  2           2         {10, 11, 12}
0   0   1           1         {0, 1, 2, 3}
3   3   1           1         {0, 1, 2, 3}
4   10  1           2         {10, 11, 12}
6   12  1           2         {10, 11, 12}

如何生成组件id并将它们添加到节点和度数中?

通过枚举连接的组件列表创建 NodeComponentIdComponent 的三元组,然后从这些三元组创建一个新的数据框,并使用 merge Node

上的给定数据框
df = pd.DataFrame([(n, i, c) for i,c in enumerate(Gcc, 1) for n in c], 
                        columns=['Node', 'ComponentID', 'Components'])

data = data.merge(df, on='Node')

或者,您可以使用 map 而不是 merge 来单独创建 ComponentIDComponents

d = dict(enumerate(Gcc, 1))
data['ComponentID'] = data['Node'].map({n:i for i,c in d.items() for n in c})
data['Components']  = data['ComponentID'].map(d)

print(data)

   Node  degree  ComponentID    Components
1     1       2            1  {0, 1, 2, 3}
2     2       2            1  {0, 1, 2, 3}
5    11       2            2  {10, 11, 12}
0     0       1            1  {0, 1, 2, 3}
3     3       1            1  {0, 1, 2, 3}
4    10       1            2  {10, 11, 12}
6    12       1            2  {10, 11, 12}