组合两个数据集以匹配每个 - R

Combining two datasets to match each - R

我有两个这样的数据集:

  1. 国家/地区人口
Country  Population

America      value
Argentina    value
Australia    value
Brazil       value
Japan        value
...
  1. 国家/地区的陆地面积
Country    Landmass

Argentina   value
Mexico      value
Uruguay     value
Maldives    value
...

每个集合的行数和国家名称的数目不同,有没有办法合并这两个数据,(将Landmass列添加到人口集合中的各个国家)这无关紧要国家/地区不存在于人口集中,只能与那里的国家相结合。

我想你想要的是 left_join ,来自文档:

https://dplyr.tidyverse.org/reference/join.html

returns 来自 x 的所有行,以及来自 x 和 y 的所有列。即

pops <- data.frame(
  "Country"  = c("America", "Argentina", "Australia","Brazil", "Japan"),
  "Population" = seq(100, 200, 25)
)

landmass <- data.frame(
  "Country"  = c("Argentina", "Mexico", "Uruguay","Maldives"),
  "Landmass" = seq(1250, 2000, 250)
)

dplyr::left_join(pops, landmass, by = c("Country"= "Country"))

产量