如何重新缩放绘图以将集群(节点)推得更远一点并在 igraph 中命名集群?

How to rescale the plot to push the clusters (nodes) a bit further apart and name the clusters in igraph?

我有节点和边缘信息,并试图用它制作网络图。节点信息有 1552 行信息:

边缘信息有四列,共1203576条。

使用我在下面的代码中使用的节点和边缘数据来制作网络图。

library(igraph)
net <- graph_from_data_frame(d=edges, vertices=nodes, directed=F)

plot(net, edge.arrow.size=.4,vertex.label=NA, 
     vertex.color=as.numeric(factor(nodes$type)))

Grouped.net = net
E(Grouped.net)$weight = 1

colnames(nodes)[4] <- "Clusters"

## Add edges with high weight between all nodes in the same group
for(Clus in unique(nodes$Clusters)) {
  GroupV = which(nodes$Clusters == Clus)
  Grouped.net = add_edges(Grouped.net, combn(GroupV, 2), attr=list(weight=500))
} 


## Now create a layout based on G_Grouped
set.seed(567)
LO = layout_with_fr(Grouped.net)

# Generate colors based on media type:
colrs <- c("gray50", "yellow", "tomato")
V(net)$color <- colrs[V(net)$type_num]


plot(net, layout=LO, edge.arrow.size=0,vertex.label=NA, asp=0, vertex.size=4)
legend(x=-1.5, y=-1.1, c("typeA","typeB", "typeC"), pch=21,
       col="#777777", pt.bg=colrs, pt.cex=2, cex=.8, bty="n", ncol=1)

我得到的情节如下所示:

上图中有5个簇。

  1. 如何增加集群之间的space?如何将它们移远?以及如何调整边缘?他们看起来很奇怪。

  2. 如何命名图中的簇?

  3. 如何将节点typeC置顶?他们的数量很少。由于typeA数量庞大,typeC在下面。

你有几个问题。我会尽力回答所有问题,但顺序不同。

设置

library(igraph)
edges = read.csv("temp/edges_info_5Clusters.csv", stringsAsFactors=T)
nodes = read.csv("temp/nodes_info_5Clusters.csv", stringsAsFactors=T)

问题3.如何将节点typeC置顶?
节点按节点编号的顺序绘制。为了得到 要显示的不常见类型,我们需要这些节点获得最高 节点号。所以只需对类型进行排序以强制节点位于 顺序 TypeA, TypeB, TypeC.

nodes = nodes[order(nodes$type),]
net <- graph_from_data_frame(d=edges, vertices=nodes, directed=F)

我将直接转到您在 你的代码来显示结果。

Grouped.net = net
E(Grouped.net)$weight = 1
colnames(nodes)[4] <- "Clusters"

## Add edges with high weight between all nodes in the same group
for(Clus in unique(nodes$Clusters)) {
  GroupV = which(nodes$Clusters == Clus)
  Grouped.net = add_edges(Grouped.net, combn(GroupV, 2), attr=list(weight=500))
} 

## Now create a layout based on G_Grouped
set.seed(567)
LO = layout_with_fr(Grouped.net)

colrs <- c("gray50", "yellow", "tomato")
V(net)$color <- colrs[V(net)$type_num]

plot(net, layout=LO, edge.arrow.size=0,vertex.label=NA, vertex.size=4,
    edge.color="lightgray")
legend(x=-1.5, y=-1.1, c("typeA","typeB", "typeC"), pch=21,
       col="#777777", pt.bg=colrs, pt.cex=2, cex=.8, bty="n", ncol=1)

好的,现在TypeC和TypeB明显多了,但是五个集群布局不好。为了得到更像你的第二个(示例)图的东西,我们需要分层构建布局:首先布局集群并单独布置集群内的点。五个集群的布局很简单。

F5 = make_full_graph(5)
Stretch = 6
LO_F5 = Stretch*layout.circle(F5)
plot(F5, layout=LO_F5)
 

现在我们需要对每个簇中的点进行布局,然后 space 将它们输出 使用刚刚创建的集群布局。但这里需要权衡。 如果你让集群相距很远,所有的节点都会很小 很难看到。如果你想让节点更大,你需要做 更紧密地聚集在一起(以便它们都适合图)。你有 如此多的链接,无论你做什么,链接都会模糊在一起 作为灰色背景。我选择了一个吸引我的中间地带, 但我邀请您探索因子 Stretch 的不同值。 Stretch 的值越大,集群之间的距离就越远 较小的节点。较小的值将使集群靠得更近 有更大的节点。选择适合您的东西。

set.seed(1234)
HierLO = matrix(0, ncol=2, nrow=vcount(net))
for(i in 1:length(levels(nodes$Clusters))) {
    CLUST = which(nodes$Clusters == levels(nodes$Clusters)[i])
    SubNet = induced_subgraph(net, V(net)[CLUST])
    LO_SN = scale(layout_nicely(SubNet))
    HierLO[CLUST, ] = LO_SN + 
        matrix(LO_F5[i,], nrow=vcount(SubNet), ncol=2,byrow=TRUE)
}

plot(net, layout=HierLO, edge.arrow.size=0,vertex.label=NA, vertex.size=4,
    edge.color="lightgray")

您现在可以看到所有 TypeC 节点和大部分 TypeB(除了集群 1 中有很多 TypeB)。

最后,让我们添加集群标签。这些只需要相对于集群中心放置。这些中心是由布局 LO_F5 给出的 ,但 igraph 绘图重新缩放布局,以便绘图实际上具有范围 (-1,1)。 我们可以自己重新缩放LO_F5,然后稍微拉伸位置,使标签刚好在圆圈外。

LO_Text = LO_F5
LO_Text[,1] = 2*(LO_F5[,1] - min(LO_F5[,1]))/(max(LO_F5[,1]) - min(LO_F5[,1])) -1
LO_Text[,2] = 2*(LO_F5[,2] - min(LO_F5[,2]))/(max(LO_F5[,2]) - min(LO_F5[,2])) -1
text(1.2*LO_Text, labels=levels(nodes$Clusters))
legend(x=-1.5, y=-1.1, c("typeA","typeB", "typeC"), pch=21,
       col="#777777", pt.bg=colrs, pt.cex=2, cex=.8, bty="n", ncol=1)

链接仍然存在问题,但我认为这解决了您的其他问题。