用相同的符号合并 data.frame 中的列
Combine column in data.frame by the same symbols
我想用文本中的相同符号组合 data.frame 的列表。这是我的数据:
d1 <- data.frame(Name = c("aaa", "bbb", "ccc","ddd","ggg", "eee"), ID = c("123", "456", "789", "101112", "131415", "161718"), stringsAsFactors = FALSE)
d2 <- data.frame(Code = c("123.aR16", "456d245", "14asadf789", "123_dy6r", "202122-fsd", "101112gh"), CupCake = c("a1", "a2", "a3", "a4", "a5", "a6"), stringsAsFactors = FALSE)
如果 Code 包含来自 ID 的相同数字组合 -> 使用来自 Name[ 的数据添加新值=25=].
看起来像是从 Name.
复制粘贴的值
预期输出:
Name ID Code CupCake
1 aaa 123 123.aR16 a1
2 bbb 456 456d245 a2
3 ccc 789 14asadf789 a3
4 aaa 123 123_dy6r a4
5 NA NA 202122-fsd a5
6 ddd 101112 101112gh a6
使用 tidyverse
个软件包:
library(dplyr)
library(stringr)
# Create ID in d2
d2 <- mutate(d2, ID = str_extract(Code, "([0-9]+)"))
# Merge d1 and d2 based on ID
df <- full_join(d1, d2, by= "ID")
# Edit: if you only want one row per ID
df1 <- inner_join(d1, d2, by= "ID")
# Or
df2 <- inner_join(d2, d1, by= "ID")
另一个解决方案。
d2$ID=NA
for(id in d1$ID)
d2$ID[grep(id, d2[,1])]=id
# if you want to see all data
dplyr::full_join(d1,d2,by="ID")
# if only interested in matched
dplyr::inner_join(d1,d2,by="ID")
我想用文本中的相同符号组合 data.frame 的列表。这是我的数据:
d1 <- data.frame(Name = c("aaa", "bbb", "ccc","ddd","ggg", "eee"), ID = c("123", "456", "789", "101112", "131415", "161718"), stringsAsFactors = FALSE)
d2 <- data.frame(Code = c("123.aR16", "456d245", "14asadf789", "123_dy6r", "202122-fsd", "101112gh"), CupCake = c("a1", "a2", "a3", "a4", "a5", "a6"), stringsAsFactors = FALSE)
如果 Code 包含来自 ID 的相同数字组合 -> 使用来自 Name[ 的数据添加新值=25=].
看起来像是从 Name.
复制粘贴的值预期输出:
Name ID Code CupCake
1 aaa 123 123.aR16 a1
2 bbb 456 456d245 a2
3 ccc 789 14asadf789 a3
4 aaa 123 123_dy6r a4
5 NA NA 202122-fsd a5
6 ddd 101112 101112gh a6
使用 tidyverse
个软件包:
library(dplyr)
library(stringr)
# Create ID in d2
d2 <- mutate(d2, ID = str_extract(Code, "([0-9]+)"))
# Merge d1 and d2 based on ID
df <- full_join(d1, d2, by= "ID")
# Edit: if you only want one row per ID
df1 <- inner_join(d1, d2, by= "ID")
# Or
df2 <- inner_join(d2, d1, by= "ID")
另一个解决方案。
d2$ID=NA
for(id in d1$ID)
d2$ID[grep(id, d2[,1])]=id
# if you want to see all data
dplyr::full_join(d1,d2,by="ID")
# if only interested in matched
dplyr::inner_join(d1,d2,by="ID")