R:如何在一个LOOP中填充一个不同维度的列矩阵?

R: How to fill one column matrices of different dimensions in a LOOP?

我已经问过一个类似的 ,但是输入数据的维度不同,我没有得到用较小的矩阵或数组填充较大的数组。这里有一些显示我的结构的基本示例数据:

dfList <- list(data.frame(CNTRY = c("B", "C", "D"), Value=c(3,1,4)),
               data.frame(CNTRY = c("A", "B", "E"),Value=c(3,5,15)))
names(dfList) <- c("111.2000", "112.2000")

输入数据是>1000个dfs的列表。我把它变成了一个矩阵列表,第一列是行名。这里:

dfMATRIX <- lapply(dfList, function(x) {
  m <- as.matrix(x[,-1])
  rownames(m) <- x[,1]
  colnames(m) <- "Value"
  m
})

这个矩阵列表我试图填充到一个数组中,如我以前的问题中所示。这里:

loadandinstall("abind")
CNTRY <- c("A", "B", "C", "D", "E")
full_dflist <- array(dim=c(length(CNTRY),1,length(dfMATRIX)))
dimnames(full_dflist) <- list(CNTRY, "Value", names(dfMATRIX))

for(i in seq_along(dfMATRIX)){
  afill(full_dflist[, , i], local= TRUE ) <- dfMATRIX[[i]]   
}

给出了错误信息:

Error in `afill<-.default`(`*tmp*`, local = TRUE, value = c(3, 1, 4)) : 
  does not make sense to have more dims in value than x

有什么想法吗? 我也试过在我以前的问题中使用 acastarray() 而不是 dfMATRIX <- lapply... 命令。我会假设我的 full_dflist-array 的第二个维度(抱歉命名:))是错误的,但我不知道如何编写输入。非常感谢你的想法。

Edit2: 对不起,我输入了错误的输出:) 这是我新的预期输出:

$`111.2000`
  Value
A    NA
B     3
C     1
D     4
E    NA

$`112.2000`
  Value
A     3
B     5
C    NA
D    NA
E    15

这可能是一种使用 data.table 的解决方案:

library(data.table)
#create a big data.table with all the elements
biglist <- rbindlist(dfList)
#use lapply to operate on individual dfs
lapply(dfList, function(x) {
  #use the big data table to merge to each one of the element dfs
  temp <- merge(biglist[, list(CNTRY)], x, by='CNTRY', all.x=TRUE)
  #remove the duplicate values
  temp <- temp[!duplicated(temp), ] 
  #convert CNTRY to character and set the order on it
  temp[, CNTRY := as.character(CNTRY)]
  setorder(temp, 'CNTRY')
  temp
  })

输出:

$`111.2000`
   CNTRY Value
1:     A    NA
2:     B     3
3:     C     1
4:     D     4
5:     E    NA

$`112.2000`
   CNTRY Value
1:     A     3
2:     B     5
3:     C    NA
4:     D    NA
5:     E    15

编辑

对于更新后的输出,您可以这样做:

lapply(dfList, function(x) {
  temp <- merge(biglist[, list(CNTRY)], x, by='CNTRY', all.x=TRUE)
  temp <- temp[!duplicated(temp), ] 
  temp[, CNTRY := as.character(CNTRY)]
  setorder(temp, 'CNTRY')
  data.frame(Value=temp$Value, row.names=temp$CNTRY)
  })

$`111.2000`
  Value
A    NA
B     3
C     1
D     4
E    NA

$`112.2000`
  Value
A     3
B     5
C    NA
D    NA
E    15

但我真的建议保留包含 data.table 个元素的列表,而不是转换为 data.frames,这样您就可以拥有 row.names.