如何重新缩放绘图以将集群(节点)推得更远一点并在 igraph 中命名集群?
How to rescale the plot to push the clusters (nodes) a bit further apart and name the clusters in igraph?
我有节点和边缘信息,并试图用它制作网络图。节点信息有 1552 行信息:
边缘信息有四列,共1203576条。
使用我在下面的代码中使用的节点和边缘数据来制作网络图。
library(igraph)
net <- graph_from_data_frame(d=edges, vertices=nodes, directed=F)
plot(net, edge.arrow.size=.4,vertex.label=NA,
vertex.color=as.numeric(factor(nodes$type)))
Grouped.net = net
E(Grouped.net)$weight = 1
colnames(nodes)[4] <- "Clusters"
## Add edges with high weight between all nodes in the same group
for(Clus in unique(nodes$Clusters)) {
GroupV = which(nodes$Clusters == Clus)
Grouped.net = add_edges(Grouped.net, combn(GroupV, 2), attr=list(weight=500))
}
## Now create a layout based on G_Grouped
set.seed(567)
LO = layout_with_fr(Grouped.net)
# Generate colors based on media type:
colrs <- c("gray50", "yellow", "tomato")
V(net)$color <- colrs[V(net)$type_num]
plot(net, layout=LO, edge.arrow.size=0,vertex.label=NA, asp=0, vertex.size=4)
legend(x=-1.5, y=-1.1, c("typeA","typeB", "typeC"), pch=21,
col="#777777", pt.bg=colrs, pt.cex=2, cex=.8, bty="n", ncol=1)
我得到的情节如下所示:
上图中有5个簇。
如何增加集群之间的space?如何将它们移远?以及如何调整边缘?他们看起来很奇怪。
如何命名图中的簇?
如何将节点typeC置顶?他们的数量很少。由于typeA数量庞大,typeC在下面。
你有几个问题。我会尽力回答所有问题,但顺序不同。
设置
library(igraph)
edges = read.csv("temp/edges_info_5Clusters.csv", stringsAsFactors=T)
nodes = read.csv("temp/nodes_info_5Clusters.csv", stringsAsFactors=T)
问题3.如何将节点typeC置顶?
节点按节点编号的顺序绘制。为了得到
要显示的不常见类型,我们需要这些节点获得最高
节点号。所以只需对类型进行排序以强制节点位于
顺序 TypeA, TypeB, TypeC.
nodes = nodes[order(nodes$type),]
net <- graph_from_data_frame(d=edges, vertices=nodes, directed=F)
我将直接转到您在
你的代码来显示结果。
Grouped.net = net
E(Grouped.net)$weight = 1
colnames(nodes)[4] <- "Clusters"
## Add edges with high weight between all nodes in the same group
for(Clus in unique(nodes$Clusters)) {
GroupV = which(nodes$Clusters == Clus)
Grouped.net = add_edges(Grouped.net, combn(GroupV, 2), attr=list(weight=500))
}
## Now create a layout based on G_Grouped
set.seed(567)
LO = layout_with_fr(Grouped.net)
colrs <- c("gray50", "yellow", "tomato")
V(net)$color <- colrs[V(net)$type_num]
plot(net, layout=LO, edge.arrow.size=0,vertex.label=NA, vertex.size=4,
edge.color="lightgray")
legend(x=-1.5, y=-1.1, c("typeA","typeB", "typeC"), pch=21,
col="#777777", pt.bg=colrs, pt.cex=2, cex=.8, bty="n", ncol=1)
好的,现在TypeC和TypeB明显多了,但是五个集群布局不好。为了得到更像你的第二个(示例)图的东西,我们需要分层构建布局:首先布局集群并单独布置集群内的点。五个集群的布局很简单。
F5 = make_full_graph(5)
Stretch = 6
LO_F5 = Stretch*layout.circle(F5)
plot(F5, layout=LO_F5)
现在我们需要对每个簇中的点进行布局,然后 space 将它们输出
使用刚刚创建的集群布局。但这里需要权衡。
如果你让集群相距很远,所有的节点都会很小
很难看到。如果你想让节点更大,你需要做
更紧密地聚集在一起(以便它们都适合图)。你有
如此多的链接,无论你做什么,链接都会模糊在一起
作为灰色背景。我选择了一个吸引我的中间地带,
但我邀请您探索因子 Stretch
的不同值。
Stretch
的值越大,集群之间的距离就越远
较小的节点。较小的值将使集群靠得更近
有更大的节点。选择适合您的东西。
set.seed(1234)
HierLO = matrix(0, ncol=2, nrow=vcount(net))
for(i in 1:length(levels(nodes$Clusters))) {
CLUST = which(nodes$Clusters == levels(nodes$Clusters)[i])
SubNet = induced_subgraph(net, V(net)[CLUST])
LO_SN = scale(layout_nicely(SubNet))
HierLO[CLUST, ] = LO_SN +
matrix(LO_F5[i,], nrow=vcount(SubNet), ncol=2,byrow=TRUE)
}
plot(net, layout=HierLO, edge.arrow.size=0,vertex.label=NA, vertex.size=4,
edge.color="lightgray")
您现在可以看到所有 TypeC 节点和大部分 TypeB(除了集群 1 中有很多 TypeB)。
最后,让我们添加集群标签。这些只需要相对于集群中心放置。这些中心是由布局 LO_F5 给出的 类 ,但 igraph 绘图重新缩放布局,以便绘图实际上具有范围 (-1,1)。
我们可以自己重新缩放LO_F5,然后稍微拉伸位置,使标签刚好在圆圈外。
LO_Text = LO_F5
LO_Text[,1] = 2*(LO_F5[,1] - min(LO_F5[,1]))/(max(LO_F5[,1]) - min(LO_F5[,1])) -1
LO_Text[,2] = 2*(LO_F5[,2] - min(LO_F5[,2]))/(max(LO_F5[,2]) - min(LO_F5[,2])) -1
text(1.2*LO_Text, labels=levels(nodes$Clusters))
legend(x=-1.5, y=-1.1, c("typeA","typeB", "typeC"), pch=21,
col="#777777", pt.bg=colrs, pt.cex=2, cex=.8, bty="n", ncol=1)
链接仍然存在问题,但我认为这解决了您的其他问题。
我有节点和边缘信息,并试图用它制作网络图。节点信息有 1552 行信息:
边缘信息有四列,共1203576条。
使用我在下面的代码中使用的节点和边缘数据来制作网络图。
library(igraph)
net <- graph_from_data_frame(d=edges, vertices=nodes, directed=F)
plot(net, edge.arrow.size=.4,vertex.label=NA,
vertex.color=as.numeric(factor(nodes$type)))
Grouped.net = net
E(Grouped.net)$weight = 1
colnames(nodes)[4] <- "Clusters"
## Add edges with high weight between all nodes in the same group
for(Clus in unique(nodes$Clusters)) {
GroupV = which(nodes$Clusters == Clus)
Grouped.net = add_edges(Grouped.net, combn(GroupV, 2), attr=list(weight=500))
}
## Now create a layout based on G_Grouped
set.seed(567)
LO = layout_with_fr(Grouped.net)
# Generate colors based on media type:
colrs <- c("gray50", "yellow", "tomato")
V(net)$color <- colrs[V(net)$type_num]
plot(net, layout=LO, edge.arrow.size=0,vertex.label=NA, asp=0, vertex.size=4)
legend(x=-1.5, y=-1.1, c("typeA","typeB", "typeC"), pch=21,
col="#777777", pt.bg=colrs, pt.cex=2, cex=.8, bty="n", ncol=1)
我得到的情节如下所示:
上图中有5个簇。
如何增加集群之间的space?如何将它们移远?以及如何调整边缘?他们看起来很奇怪。
如何命名图中的簇?
如何将节点typeC置顶?他们的数量很少。由于typeA数量庞大,typeC在下面。
你有几个问题。我会尽力回答所有问题,但顺序不同。
设置
library(igraph)
edges = read.csv("temp/edges_info_5Clusters.csv", stringsAsFactors=T)
nodes = read.csv("temp/nodes_info_5Clusters.csv", stringsAsFactors=T)
问题3.如何将节点typeC置顶?
节点按节点编号的顺序绘制。为了得到
要显示的不常见类型,我们需要这些节点获得最高
节点号。所以只需对类型进行排序以强制节点位于
顺序 TypeA, TypeB, TypeC.
nodes = nodes[order(nodes$type),]
net <- graph_from_data_frame(d=edges, vertices=nodes, directed=F)
我将直接转到您在 你的代码来显示结果。
Grouped.net = net
E(Grouped.net)$weight = 1
colnames(nodes)[4] <- "Clusters"
## Add edges with high weight between all nodes in the same group
for(Clus in unique(nodes$Clusters)) {
GroupV = which(nodes$Clusters == Clus)
Grouped.net = add_edges(Grouped.net, combn(GroupV, 2), attr=list(weight=500))
}
## Now create a layout based on G_Grouped
set.seed(567)
LO = layout_with_fr(Grouped.net)
colrs <- c("gray50", "yellow", "tomato")
V(net)$color <- colrs[V(net)$type_num]
plot(net, layout=LO, edge.arrow.size=0,vertex.label=NA, vertex.size=4,
edge.color="lightgray")
legend(x=-1.5, y=-1.1, c("typeA","typeB", "typeC"), pch=21,
col="#777777", pt.bg=colrs, pt.cex=2, cex=.8, bty="n", ncol=1)
好的,现在TypeC和TypeB明显多了,但是五个集群布局不好。为了得到更像你的第二个(示例)图的东西,我们需要分层构建布局:首先布局集群并单独布置集群内的点。五个集群的布局很简单。
F5 = make_full_graph(5)
Stretch = 6
LO_F5 = Stretch*layout.circle(F5)
plot(F5, layout=LO_F5)
现在我们需要对每个簇中的点进行布局,然后 space 将它们输出
使用刚刚创建的集群布局。但这里需要权衡。
如果你让集群相距很远,所有的节点都会很小
很难看到。如果你想让节点更大,你需要做
更紧密地聚集在一起(以便它们都适合图)。你有
如此多的链接,无论你做什么,链接都会模糊在一起
作为灰色背景。我选择了一个吸引我的中间地带,
但我邀请您探索因子 Stretch
的不同值。
Stretch
的值越大,集群之间的距离就越远
较小的节点。较小的值将使集群靠得更近
有更大的节点。选择适合您的东西。
set.seed(1234)
HierLO = matrix(0, ncol=2, nrow=vcount(net))
for(i in 1:length(levels(nodes$Clusters))) {
CLUST = which(nodes$Clusters == levels(nodes$Clusters)[i])
SubNet = induced_subgraph(net, V(net)[CLUST])
LO_SN = scale(layout_nicely(SubNet))
HierLO[CLUST, ] = LO_SN +
matrix(LO_F5[i,], nrow=vcount(SubNet), ncol=2,byrow=TRUE)
}
plot(net, layout=HierLO, edge.arrow.size=0,vertex.label=NA, vertex.size=4,
edge.color="lightgray")
您现在可以看到所有 TypeC 节点和大部分 TypeB(除了集群 1 中有很多 TypeB)。
最后,让我们添加集群标签。这些只需要相对于集群中心放置。这些中心是由布局 LO_F5 给出的 类 ,但 igraph 绘图重新缩放布局,以便绘图实际上具有范围 (-1,1)。 我们可以自己重新缩放LO_F5,然后稍微拉伸位置,使标签刚好在圆圈外。
LO_Text = LO_F5
LO_Text[,1] = 2*(LO_F5[,1] - min(LO_F5[,1]))/(max(LO_F5[,1]) - min(LO_F5[,1])) -1
LO_Text[,2] = 2*(LO_F5[,2] - min(LO_F5[,2]))/(max(LO_F5[,2]) - min(LO_F5[,2])) -1
text(1.2*LO_Text, labels=levels(nodes$Clusters))
legend(x=-1.5, y=-1.1, c("typeA","typeB", "typeC"), pch=21,
col="#777777", pt.bg=colrs, pt.cex=2, cex=.8, bty="n", ncol=1)
链接仍然存在问题,但我认为这解决了您的其他问题。