组合两个数据集以匹配每个 - R

Question

我有两个这样的数据集：

国家/地区人口

Country  Population

America      value
Argentina    value
Australia    value
Brazil       value
Japan        value
...

国家/地区的陆地面积

Country    Landmass

Argentina   value
Mexico      value
Uruguay     value
Maldives    value
...

每个集合的行数和国家名称的数目不同，有没有办法合并这两个数据，（将Landmass列添加到人口集合中的各个国家）这无关紧要国家/地区不存在于人口集中，只能与那里的国家相结合。

Answer 1

我想你想要的是 left_join ，来自文档：

https://dplyr.tidyverse.org/reference/join.html

returns 来自 x 的所有行，以及来自 x 和 y 的所有列。即

pops <- data.frame(
  "Country"  = c("America", "Argentina", "Australia","Brazil", "Japan"),
  "Population" = seq(100, 200, 25)
)

landmass <- data.frame(
  "Country"  = c("Argentina", "Mexico", "Uruguay","Maldives"),
  "Landmass" = seq(1250, 2000, 250)
)

dplyr::left_join(pops, landmass, by = c("Country"= "Country"))

产量

组合两个数据集以匹配每个 - R

Combining two datasets to match each - R

merge

join

r