将不同长度的列表组合成数据框

Question

我有像下面的 SampleData 这样的数据，它有不同长度的列表，我想将它们组合成一个数据框，比如下面的 Desired Result。我试过使用 qpcR 包中的 lapply 和 cbind.na ，如下例所示，但出于某种原因，它不允许我将结果转换为数据框。如果我只使用了两个列表和 cbind.na 它将组合它们并像我想要的那样将 NA 添加到末尾，但是当我尝试在 lapply 中使用它时它只是将它们保留为不同的列表长度列表。非常感谢任何提示。

SampleData<-list(list(1,2,3),list(1,2),list(3,4,6,7))

Desired Result:
structure(list(V1 = c(1, 2, 3, NA), V2 = c(1, 2, NA, NA), V3 = c(3, 
4, 6, 7)), .Names = c("V1", "V2", "V3"), row.names = c(NA, -4L
), class = "data.frame")


Example Code:

lapply(SampleData,qpcR:::cbind.na)

Answer 1

我查看您的数据的第一直觉是，通过使用 data.frame，您是在隐含地声明一行中的项目是 成对的 。也就是说，在您的示例中，$V1 的“3”和 $V3 的“6”旨在相互关联。（如果您查看 mtcars，第一行的每一列直接和单独与 "Mazda RX4" 关联。 ) 如果这不是真的，那么将它们扭曲成这样的 data.frame 是在错误地表示您的数据，并鼓励不正确的 analysis/assumptions.

假设它们实际上是 "paired"，我的下一个直觉是尝试 do.call(cbind, SampleData) 之类的东西，但这有助于回收数据，而不是你想要的。因此，阻止回收的技巧是强制它们的长度相同。

maxlen <- max(lengths(SampleData))
SampleData2 <- lapply(SampleData, function(lst) c(lst, rep(NA, maxlen - length(lst))))

我们可以先重命名：

names(SampleData2) <- paste("V", seq_along(SampleData2), sep = "")

由于数据看起来是同质的（并且应该是，如果您打算将每个元素作为 data.frame 的列），取消列出它是有用的：

SampleData3 <- lapply(SampleData2, unlist)

那么直接就是：

as.data.frame(SampleData3)
#   V1 V2 V3
# 1  1  1  3
# 2  2  2  4
# 3  3 NA  6
# 4 NA NA  7

Answer 2

这是修改后的版本，其中包含 length<- 赋值

setNames(do.call(cbind.data.frame, lapply(lapply(SampleData, unlist), 
        `length<-`, max(lengths(SampleData)))), paste0("V", 1:3))
#  V1 V2 V3
#1  1  1  3
#2  2  2  4
#3  3 NA  6
#4 NA NA  7

将不同长度的列表组合成数据框

Combining lists of different lengths into data frame

r

lapply

cbind