如何根据 R 中的唯一值组合行?
How to combine rows based on unique values in R?
我是 R 的初学者。我有一个 CSV 文件,其中数据如下,例如:
ID Values
820 D1,D2,FE
730 D1,D2,D3,PC,Io,He,Bt,Te,AR,PG
730 DV,GTH,LYT
567 EDR,TYU,EOP,OMN
567 FGH,KIH,IOP
我想删除 ID
中的重复项并将它们的数据附加到其 Values
列中,如下所示:
ID Values
820 D1,D2,FE
730 D1,D2,D3,PC,Io,He,Bt,Te,AR,PG,DV,GTH,LYT
567 EDR,TYU,EOP,OMN,FGH,KIH,IOP
如何在 R 中实现这一点?
你可以试试
library(data.table)
setDT(df1)[, list(Values=paste(Values, collapse=",")) ,ID]
或使用base R
aggregate(.~ID, df1, paste, collapse=",")
dat <- read.table(text="ID Values
820 D1,D2,FE
730 D1,D2,D3,PC,Io,He,Bt,Te,AR,PG
730 DV,GTH,LYT
567 EDR,TYU,EOP,OMN
567 FGH,KIH,IOP", header=TRUE)
dat2 <- dat %>% group_by(ID) %>% summarise(val=paste(Values, collapse=","))
我是 R 的初学者。我有一个 CSV 文件,其中数据如下,例如:
ID Values
820 D1,D2,FE
730 D1,D2,D3,PC,Io,He,Bt,Te,AR,PG
730 DV,GTH,LYT
567 EDR,TYU,EOP,OMN
567 FGH,KIH,IOP
我想删除 ID
中的重复项并将它们的数据附加到其 Values
列中,如下所示:
ID Values
820 D1,D2,FE
730 D1,D2,D3,PC,Io,He,Bt,Te,AR,PG,DV,GTH,LYT
567 EDR,TYU,EOP,OMN,FGH,KIH,IOP
如何在 R 中实现这一点?
你可以试试
library(data.table)
setDT(df1)[, list(Values=paste(Values, collapse=",")) ,ID]
或使用base R
aggregate(.~ID, df1, paste, collapse=",")
dat <- read.table(text="ID Values
820 D1,D2,FE
730 D1,D2,D3,PC,Io,He,Bt,Te,AR,PG
730 DV,GTH,LYT
567 EDR,TYU,EOP,OMN
567 FGH,KIH,IOP", header=TRUE)
dat2 <- dat %>% group_by(ID) %>% summarise(val=paste(Values, collapse=","))