如何用R合并冗余信息?
How to use R to merge redundant information?
很难描述我的意思,我的意思是我有以下数据框
A 1013574 1014475
A 1014005 1014475
A 1014005 1014435
我想把这些数据合并到A 1013574 1014475
,有什么功能可以帮我实现这个目标吗?
我想要的输出是两个,每个 ID 有 1 行(在我的例子中是值“A”),第二列将包含每个 ID 的最小值,第三列包含每个 ID 的最大值。
这是一个更新的答案。我认为这就是你想要的。我添加了额外的行,因此您可以看到它如何处理多个数据。
library(dplyr)
df <- tibble(a = c("A", "A", "A","B", "B", "B" ),
v1 = as.numeric(c(1013574,1014005,1014005, 1014005, 1014305, 1044005)),
v2 = as.numeric(c(1014475, 1014475,1014435, 1014435, 1014435, 1314435)))
df_new <-df %>% group_by(a) %>% mutate(v1 = min(v1),
v2 = max(v2)) %>%
distinct()
很难描述我的意思,我的意思是我有以下数据框
A 1013574 1014475
A 1014005 1014475
A 1014005 1014435
我想把这些数据合并到A 1013574 1014475
,有什么功能可以帮我实现这个目标吗?
我想要的输出是两个,每个 ID 有 1 行(在我的例子中是值“A”),第二列将包含每个 ID 的最小值,第三列包含每个 ID 的最大值。
这是一个更新的答案。我认为这就是你想要的。我添加了额外的行,因此您可以看到它如何处理多个数据。
library(dplyr)
df <- tibble(a = c("A", "A", "A","B", "B", "B" ),
v1 = as.numeric(c(1013574,1014005,1014005, 1014005, 1014305, 1044005)),
v2 = as.numeric(c(1014475, 1014475,1014435, 1014435, 1014435, 1314435)))
df_new <-df %>% group_by(a) %>% mutate(v1 = min(v1),
v2 = max(v2)) %>%
distinct()