组合两个数据集以匹配每个 - R
Combining two datasets to match each - R
我有两个这样的数据集:
- 国家/地区人口
Country Population
America value
Argentina value
Australia value
Brazil value
Japan value
...
- 国家/地区的陆地面积
Country Landmass
Argentina value
Mexico value
Uruguay value
Maldives value
...
每个集合的行数和国家名称的数目不同,有没有办法合并这两个数据,(将Landmass列添加到人口集合中的各个国家)这无关紧要国家/地区不存在于人口集中,只能与那里的国家相结合。
我想你想要的是 left_join ,来自文档:
https://dplyr.tidyverse.org/reference/join.html
returns 来自 x 的所有行,以及来自 x 和 y 的所有列。即
pops <- data.frame(
"Country" = c("America", "Argentina", "Australia","Brazil", "Japan"),
"Population" = seq(100, 200, 25)
)
landmass <- data.frame(
"Country" = c("Argentina", "Mexico", "Uruguay","Maldives"),
"Landmass" = seq(1250, 2000, 250)
)
dplyr::left_join(pops, landmass, by = c("Country"= "Country"))
产量
我有两个这样的数据集:
- 国家/地区人口
Country Population
America value
Argentina value
Australia value
Brazil value
Japan value
...
- 国家/地区的陆地面积
Country Landmass
Argentina value
Mexico value
Uruguay value
Maldives value
...
每个集合的行数和国家名称的数目不同,有没有办法合并这两个数据,(将Landmass列添加到人口集合中的各个国家)这无关紧要国家/地区不存在于人口集中,只能与那里的国家相结合。
我想你想要的是 left_join ,来自文档:
https://dplyr.tidyverse.org/reference/join.html
returns 来自 x 的所有行,以及来自 x 和 y 的所有列。即
pops <- data.frame(
"Country" = c("America", "Argentina", "Australia","Brazil", "Japan"),
"Population" = seq(100, 200, 25)
)
landmass <- data.frame(
"Country" = c("Argentina", "Mexico", "Uruguay","Maldives"),
"Landmass" = seq(1250, 2000, 250)
)
dplyr::left_join(pops, landmass, by = c("Country"= "Country"))
产量