data.table R ||对数据表列表中的特定列求和
data.table R || sum specific column from list of data tables
library(data.table)
dt_store<-list()
A <- data.table(a = paste0("gid",1:4), b = paste0("IID",12:15),value=seq(from=1, to=4))
B <- data.table(a = paste0("gid",1:4), b = paste0("IID",12:15),value=seq(from=11, to=14))
C <- data.table(a = paste0("gid",1:4), b = paste0("IID",12:15),value=seq(from=21, to=24))
dt_store[[1]]<-A
dt_store[[2]]<-B
dt_store[[3]]<-C
我想要 sum/add 列 value
。列表中的每个 data.table 具有相同的行数和相同的列名。 b
列是唯一的。 a
列中可以有重复项
我希望最终输出为:
a b final_sum
gid1 IID12 33
gid2 IID13 36
gid3 IID14 39
gid4 IID15 42
Reduce("+",lapply(dt_store,value))
#这个错误。
如何使用Reduce
或lapply
、mapply
?我可以使用 for 循环,但那太天真了。抱歉,这些关键功能对我来说很难掌握。
我们可以使用 rbindlist
来绑定 list
元素,然后按 sum
进行分组
library(data.table)
rbindlist(dt_store)[, .(final_sum = sum(value)), .(a, b)]
-输出
# a b final_sum
#1: gid1 IID12 33
#2: gid2 IID13 36
#3: gid3 IID14 39
#4: gid4 IID15 42
library(data.table)
dt_store<-list()
A <- data.table(a = paste0("gid",1:4), b = paste0("IID",12:15),value=seq(from=1, to=4))
B <- data.table(a = paste0("gid",1:4), b = paste0("IID",12:15),value=seq(from=11, to=14))
C <- data.table(a = paste0("gid",1:4), b = paste0("IID",12:15),value=seq(from=21, to=24))
dt_store[[1]]<-A
dt_store[[2]]<-B
dt_store[[3]]<-C
我想要 sum/add 列 value
。列表中的每个 data.table 具有相同的行数和相同的列名。 b
列是唯一的。 a
我希望最终输出为:
a b final_sum
gid1 IID12 33
gid2 IID13 36
gid3 IID14 39
gid4 IID15 42
Reduce("+",lapply(dt_store,value))
#这个错误。
如何使用Reduce
或lapply
、mapply
?我可以使用 for 循环,但那太天真了。抱歉,这些关键功能对我来说很难掌握。
我们可以使用 rbindlist
来绑定 list
元素,然后按 sum
library(data.table)
rbindlist(dt_store)[, .(final_sum = sum(value)), .(a, b)]
-输出
# a b final_sum
#1: gid1 IID12 33
#2: gid2 IID13 36
#3: gid3 IID14 39
#4: gid4 IID15 42