Reduce/do.调用 data.frames 列表列表中的 bind_rows
Reduce/do.call to bind_rows in list of lists of data.frames
我很难用通俗易懂的英语表达这一点,所以如果有人可以编辑语言,那将不胜感激。
我有一个 list
对象,其中每个元素都是 list
个 data.frame
结构。
顶级列表中的某些元素可能为空,而其他元素的 data.frames 数量不同(不过总是偶数)。
我的问题(这看起来很像 this 的 相反 ,是这样的:
如何绑定这些列表中 data.frames 的行,以便顶级列表的每个元素都包含两个数据框?这些 data.frames 每次都遵循相同的结构(我想绑定 data.frame 数字 1,3,5,7... 和 data.frames 数字 2,4,6 的行,8...
MRE如下:
set.seed(1234)
listy <- list(`1` = list(),
`2` = list(a = data.frame(a1 = runif(1:3), a2 = runif(1:3)),
b = data.frame(a3 = runif(1:3), a4 = runif(1:3)),
c = data.frame(a1 = runif(1:3), a2 = runif(1:3)),
d = data.frame(a3 = runif(1:3), a4 = runif(1:3))))
listy
是一个包含 2 个元素的列表 (1
,2
)。其中 1
为空。 2
是 data.frames
的列表(每个都有偶数个 data.frames)。我想绑定 2
的行,因此顶级列表的每个元素都有 2 data.frames(如果它们首先有 data.frames)。
我的预期输出如下:
listb <- list(`1` = list(),
`2` = list(structure(list(a1 = c(0.113703411305323, 0.622299404814839, 0.609274732880294, 0.282733583590016, 0.923433484276757, 0.292315840255469), a2 = c(0.623379441676661, 0.860915383556858, 0.640310605289415, 0.837295628152788, 0.286223284667358, 0.266820780001581)), .Names = c("a1", "a2"), row.names = c(NA, -6L), class = c("tbl_df", "tbl", "data.frame")), structure(list(a3 = c(0.0094957563560456, 0.232550506014377, 0.666083758231252, 0.186722789658234, 0.232225910527632, 0.316612454829738), a3.1 = c(0.514251141343266, 0.693591291783378, 0.544974835589528, 0.302693370729685, 0.159046002896503, 0.0399959180504084)), .Names = c("a3", "a3.1"), row.names = c(NA, -6L), class = c("tbl_df", "tbl", "data.frame"))))
理想情况下,我想保留 listy
及其结构(第一个元素为空),第二个仅包含绑定行。这就是为什么我尝试了以下但无济于事的原因:
library(dplyr)
lapply(length(listy), function(i) {
#skip empty lists
if(length(listy[[i]]) < 1) {
next
} else {
#make two lists
#pairs list. even numbers
listy[[i]][[1]] <- do.call(bind_rows, listy[[i]][seq(1,length(listy[[i]]), by = 1) %% 2 == 0])
#pairs list. odd numbers
listy[[i]][[2]] <- do.call(bind_rows, listy[[i]][seq(1,length(listy[[i]]), by = 1) %% 2 == 1])
}
})
#another try, no positive result
lapply(length(listy), function(i) {
#skip empty lists
if(length(listy[[i]]) < 1) {
next
} else {
#make two lists
#pairs list. even numbers
listy[[i]][[1]] <- Reduce(bind_rows, listy[[i]][seq(1,length(listy[[i]]), by = 1) %% 2 == 0])
#pairs list. odd numbers
listy[[i]][[2]] <- Reduce(bind_rows, listy[[i]][seq(1,length(listy[[i]]), by = 1) %% 2 == 1])
}
})
[假设列名匹配]。 lapply 在列表本身上通常更容易,因为它比索引更容易操作。给你:
listy2 <- lapply(listy, function(x){
#get length
current_length=length(x)
if(current_length==0){
res = x
} else{
res <- list(even=do.call(rbind,x[seq(2,current_length,by=2)]),
odd=do.call(rbind,x[seq(1,current_length,by=2)])
)
return(res)
}
}
)
> listy2
$`1`
list()
$`2`
$`2`$even
a3 a4
b.1 0.009495756 0.51425114
b.2 0.232550506 0.69359129
b.3 0.666083758 0.54497484
d.1 0.186722790 0.30269337
d.2 0.232225911 0.15904600
d.3 0.316612455 0.03999592
$`2`$odd
a1 a2
a.1 0.1137034 0.6233794
a.2 0.6222994 0.8609154
a.3 0.6092747 0.6403106
c.1 0.2827336 0.8372956
c.2 0.9234335 0.2862233
c.3 0.2923158 0.2668208
Edit with very much the same structure, but bind_rows to deal with more types inside the dataframe.
listy3 <- lapply(listy, function(x){
#get length
current_length=length(x)
if(current_length==0){
res = x
} else{
res <- list(even=bind_rows(x[seq(2,current_length,by=2)]),
odd=bind_rows(x[seq(1,current_length,by=2)])
# odd=do.call(bind_rows,x[seq(1,current_length,by=2)])
)
return(res)
}
}
)
我很难用通俗易懂的英语表达这一点,所以如果有人可以编辑语言,那将不胜感激。
我有一个 list
对象,其中每个元素都是 list
个 data.frame
结构。
顶级列表中的某些元素可能为空,而其他元素的 data.frames 数量不同(不过总是偶数)。
我的问题(这看起来很像 this 的 相反 ,是这样的:
如何绑定这些列表中 data.frames 的行,以便顶级列表的每个元素都包含两个数据框?这些 data.frames 每次都遵循相同的结构(我想绑定 data.frame 数字 1,3,5,7... 和 data.frames 数字 2,4,6 的行,8...
MRE如下:
set.seed(1234)
listy <- list(`1` = list(),
`2` = list(a = data.frame(a1 = runif(1:3), a2 = runif(1:3)),
b = data.frame(a3 = runif(1:3), a4 = runif(1:3)),
c = data.frame(a1 = runif(1:3), a2 = runif(1:3)),
d = data.frame(a3 = runif(1:3), a4 = runif(1:3))))
listy
是一个包含 2 个元素的列表 (1
,2
)。其中 1
为空。 2
是 data.frames
的列表(每个都有偶数个 data.frames)。我想绑定 2
的行,因此顶级列表的每个元素都有 2 data.frames(如果它们首先有 data.frames)。
我的预期输出如下:
listb <- list(`1` = list(),
`2` = list(structure(list(a1 = c(0.113703411305323, 0.622299404814839, 0.609274732880294, 0.282733583590016, 0.923433484276757, 0.292315840255469), a2 = c(0.623379441676661, 0.860915383556858, 0.640310605289415, 0.837295628152788, 0.286223284667358, 0.266820780001581)), .Names = c("a1", "a2"), row.names = c(NA, -6L), class = c("tbl_df", "tbl", "data.frame")), structure(list(a3 = c(0.0094957563560456, 0.232550506014377, 0.666083758231252, 0.186722789658234, 0.232225910527632, 0.316612454829738), a3.1 = c(0.514251141343266, 0.693591291783378, 0.544974835589528, 0.302693370729685, 0.159046002896503, 0.0399959180504084)), .Names = c("a3", "a3.1"), row.names = c(NA, -6L), class = c("tbl_df", "tbl", "data.frame"))))
理想情况下,我想保留 listy
及其结构(第一个元素为空),第二个仅包含绑定行。这就是为什么我尝试了以下但无济于事的原因:
library(dplyr)
lapply(length(listy), function(i) {
#skip empty lists
if(length(listy[[i]]) < 1) {
next
} else {
#make two lists
#pairs list. even numbers
listy[[i]][[1]] <- do.call(bind_rows, listy[[i]][seq(1,length(listy[[i]]), by = 1) %% 2 == 0])
#pairs list. odd numbers
listy[[i]][[2]] <- do.call(bind_rows, listy[[i]][seq(1,length(listy[[i]]), by = 1) %% 2 == 1])
}
})
#another try, no positive result
lapply(length(listy), function(i) {
#skip empty lists
if(length(listy[[i]]) < 1) {
next
} else {
#make two lists
#pairs list. even numbers
listy[[i]][[1]] <- Reduce(bind_rows, listy[[i]][seq(1,length(listy[[i]]), by = 1) %% 2 == 0])
#pairs list. odd numbers
listy[[i]][[2]] <- Reduce(bind_rows, listy[[i]][seq(1,length(listy[[i]]), by = 1) %% 2 == 1])
}
})
[假设列名匹配]。 lapply 在列表本身上通常更容易,因为它比索引更容易操作。给你:
listy2 <- lapply(listy, function(x){
#get length
current_length=length(x)
if(current_length==0){
res = x
} else{
res <- list(even=do.call(rbind,x[seq(2,current_length,by=2)]),
odd=do.call(rbind,x[seq(1,current_length,by=2)])
)
return(res)
}
}
)
> listy2
$`1`
list()
$`2`
$`2`$even
a3 a4
b.1 0.009495756 0.51425114
b.2 0.232550506 0.69359129
b.3 0.666083758 0.54497484
d.1 0.186722790 0.30269337
d.2 0.232225911 0.15904600
d.3 0.316612455 0.03999592
$`2`$odd
a1 a2
a.1 0.1137034 0.6233794
a.2 0.6222994 0.8609154
a.3 0.6092747 0.6403106
c.1 0.2827336 0.8372956
c.2 0.9234335 0.2862233
c.3 0.2923158 0.2668208
Edit with very much the same structure, but bind_rows to deal with more types inside the dataframe.
listy3 <- lapply(listy, function(x){
#get length
current_length=length(x)
if(current_length==0){
res = x
} else{
res <- list(even=bind_rows(x[seq(2,current_length,by=2)]),
odd=bind_rows(x[seq(1,current_length,by=2)])
# odd=do.call(bind_rows,x[seq(1,current_length,by=2)])
)
return(res)
}
}
)