应用数据框列分配

Sapply dataframe column assignment

我想重写 this question 的一些第一行,但我不明白为什么我的 sapply 行不起作用。

我要转这些行:

cols <- sample(c(1:5), 1)
label <- rep(paste0("label ", seq(from=1, to=10)))
mydata <- data.frame(label)
for (i in 1:cols) {mydata[,i+1] <- sample(c(1:10), 10)}

进入:

cols <- sample(c(1:5), 1) 
mydata <- data.frame(rep(paste0("label ", seq(1,10))))
sapply(1:cols, function(x) { mydata[,(x+1)] <- sample(c(1:10), 10) } )

但由于某些原因,sapply 行给我一个 new columns would leave holes after existing columns 错误,我不知道为什么。

我也试过了

sapply(1:cols, function(x) { mydata[,(x+1)] <- sample(c(1:10), 10); mydata } )
Map(function(x, mydata1) {mydata1[,(x+1)] <- sample(c(1:10), 10)}, x = 1:cols, mydata1 = mydata)

编辑:

当您在 mydata 数据框中分配新列时,它会在函数本地执行。 mydata 数据框的任何更改都不适用于此函数的父环境。

要查看此效果,请在函数内使用 print 语句。

mydata <- data.frame( label = rep(paste0("label ", seq(1,10))))
sapply( 1:cols, function(x) { 
  mydata[[(x+1)]] <- sample(c(1:10), 10)
  print(mydata)
  } )
mydata

为防止此范围界定问题,您可以使用 <<- 而不是 <-

sapply(1:cols, function(x) { mydata[,(x+1)] <<- sample(c(1:10), 10) } )

注意:强烈建议不要使用 <<- 方法,因为当您的代码库增长并且您的计算涉及多个包时,它会在以后造成混乱。

可能的解决方案:

您已获取 sapply 命令的输出并使用 mydata 绑定列。

试试这个:

set.seed(1L)
cols <- sample(c(1:5), 1) 
print(cols) # [1] 2
mydata <- data.frame( label = rep(paste0("label ", seq(1,10))))
do.call("cbind",
        list( mydata,
              sapply( seq_len(cols), function(x) sample(c(1:10), 10) )
        ))

输出:

#     label    1  2
# 1   label 1  4  2
# 2   label 2  6  7
# 3   label 3  8  4
# 4   label 4  2  6
# 5   label 5  9  3
# 6   label 6  5  8
# 7   label 7  3  5
# 8   label 8  7 10
# 9   label 9  1  9
# 10 label 10 10  1

我无法确定您的代码为何无法运行,但这与您 运行 sapply 之前未定义的列有关。因此,如果您事先定义 data.frame,它就可以工作

cols <- sample(c(1:5), 1) 
mydata <- data.frame(matrix(rep(0, 10*(cols+1)), ncol = cols+1))
mydata[, 1] <- rep(paste0("label ", seq(1,10)))
sapply(1:cols, function(x) {
  mydata[, x+1] <- sample(c(1:10), 10) } )

编辑:

您可以改用下面的代码

cols <- sample(c(1:5), 1) 
mydata <- data.frame(rep(paste0("label ", seq(1,10))),
                     sapply(1:cols, function(x) {sample(c(1:10), 10) } ))