ggraph - 根据频率增加节点大小
ggraph - increase node size based on frequency
一直在阅读 Julia Silge 和 David Robinson 的 Tidytext Mining with R - https://www.tidytextmining.com/nasa.html - 并且对如何根据频率 (n) 调整节点大小感到困惑。尝试了以下代码...
library(widyr)
set.seed(1234)
title_word_pairs %>%
filter(n >= 250) %>%
graph_from_data_frame() %>%
ggraph(layout = "fr") +
geom_edge_link(aes(edge_alpha = n, edge_width = n), edge_colour =
"royalblue") +
geom_node_point(aes(size = n)) + scale_size(range = c(2,10)) +
geom_node_text(aes(label = name), repel = TRUE,
point.padding = unit(0.2, "lines")) +
theme_void()
...并收到此错误...
Error: Column `size` must be a 1d atomic vector or a list
Call `rlang::last_error()` to see a backtrace
如有任何想法或建议,我们将不胜感激。
问题是这个频率 n
是针对 边 ,而不是 顶点 。所以 geom_edge_link
找到 n
因为 n
是边属性,而 geom_node_point
找不到 n
因为它不在顶点属性中。
那么我们希望构建另一个实际上是顶点频率的变量。
subt <- title_word_pairs %>%
filter(n >= 250)
vert <- subt %>% gather(item, word, item1, item2) %>%
group_by(word) %>% summarise(n = sum(n))
subt %>%
graph_from_data_frame(vertices = vert) %>%
ggraph(layout = "fr") +
geom_edge_link(aes(edge_alpha = n, edge_width = n), edge_colour = "royalblue") +
geom_node_point(aes(size = n)) + scale_size(range = c(2,10)) +
geom_node_text(aes(label = name), repel = TRUE, point.padding = unit(0.2, "lines")) +
theme_void()
这里subt
和之前一样,那么vert
包含两列:顶点(词)和它们在subt
中的频率作为总和或相关的边缘频率。最后,我添加了 vertices = vert
来传递这个顶点属性。
一直在阅读 Julia Silge 和 David Robinson 的 Tidytext Mining with R - https://www.tidytextmining.com/nasa.html - 并且对如何根据频率 (n) 调整节点大小感到困惑。尝试了以下代码...
library(widyr)
set.seed(1234)
title_word_pairs %>%
filter(n >= 250) %>%
graph_from_data_frame() %>%
ggraph(layout = "fr") +
geom_edge_link(aes(edge_alpha = n, edge_width = n), edge_colour =
"royalblue") +
geom_node_point(aes(size = n)) + scale_size(range = c(2,10)) +
geom_node_text(aes(label = name), repel = TRUE,
point.padding = unit(0.2, "lines")) +
theme_void()
...并收到此错误...
Error: Column `size` must be a 1d atomic vector or a list
Call `rlang::last_error()` to see a backtrace
如有任何想法或建议,我们将不胜感激。
问题是这个频率 n
是针对 边 ,而不是 顶点 。所以 geom_edge_link
找到 n
因为 n
是边属性,而 geom_node_point
找不到 n
因为它不在顶点属性中。
那么我们希望构建另一个实际上是顶点频率的变量。
subt <- title_word_pairs %>%
filter(n >= 250)
vert <- subt %>% gather(item, word, item1, item2) %>%
group_by(word) %>% summarise(n = sum(n))
subt %>%
graph_from_data_frame(vertices = vert) %>%
ggraph(layout = "fr") +
geom_edge_link(aes(edge_alpha = n, edge_width = n), edge_colour = "royalblue") +
geom_node_point(aes(size = n)) + scale_size(range = c(2,10)) +
geom_node_text(aes(label = name), repel = TRUE, point.padding = unit(0.2, "lines")) +
theme_void()
这里subt
和之前一样,那么vert
包含两列:顶点(词)和它们在subt
中的频率作为总和或相关的边缘频率。最后,我添加了 vertices = vert
来传递这个顶点属性。