应用数据框列分配
Sapply dataframe column assignment
我想重写 this question 的一些第一行,但我不明白为什么我的 sapply
行不起作用。
我要转这些行:
cols <- sample(c(1:5), 1)
label <- rep(paste0("label ", seq(from=1, to=10)))
mydata <- data.frame(label)
for (i in 1:cols) {mydata[,i+1] <- sample(c(1:10), 10)}
进入:
cols <- sample(c(1:5), 1)
mydata <- data.frame(rep(paste0("label ", seq(1,10))))
sapply(1:cols, function(x) { mydata[,(x+1)] <- sample(c(1:10), 10) } )
但由于某些原因,sapply
行给我一个 new columns would leave holes after existing columns
错误,我不知道为什么。
我也试过了
sapply(1:cols, function(x) { mydata[,(x+1)] <- sample(c(1:10), 10); mydata } )
Map(function(x, mydata1) {mydata1[,(x+1)] <- sample(c(1:10), 10)}, x = 1:cols, mydata1 = mydata)
编辑:
当您在 mydata
数据框中分配新列时,它会在函数本地执行。 mydata
数据框的任何更改都不适用于此函数的父环境。
要查看此效果,请在函数内使用 print
语句。
mydata <- data.frame( label = rep(paste0("label ", seq(1,10))))
sapply( 1:cols, function(x) {
mydata[[(x+1)]] <- sample(c(1:10), 10)
print(mydata)
} )
mydata
为防止此范围界定问题,您可以使用 <<-
而不是 <-
。
sapply(1:cols, function(x) { mydata[,(x+1)] <<- sample(c(1:10), 10) } )
注意:强烈建议不要使用 <<-
方法,因为当您的代码库增长并且您的计算涉及多个包时,它会在以后造成混乱。
可能的解决方案:
您已获取 sapply
命令的输出并使用 mydata
绑定列。
试试这个:
set.seed(1L)
cols <- sample(c(1:5), 1)
print(cols) # [1] 2
mydata <- data.frame( label = rep(paste0("label ", seq(1,10))))
do.call("cbind",
list( mydata,
sapply( seq_len(cols), function(x) sample(c(1:10), 10) )
))
输出:
# label 1 2
# 1 label 1 4 2
# 2 label 2 6 7
# 3 label 3 8 4
# 4 label 4 2 6
# 5 label 5 9 3
# 6 label 6 5 8
# 7 label 7 3 5
# 8 label 8 7 10
# 9 label 9 1 9
# 10 label 10 10 1
我无法确定您的代码为何无法运行,但这与您 运行 sapply
之前未定义的列有关。因此,如果您事先定义 data.frame
,它就可以工作
cols <- sample(c(1:5), 1)
mydata <- data.frame(matrix(rep(0, 10*(cols+1)), ncol = cols+1))
mydata[, 1] <- rep(paste0("label ", seq(1,10)))
sapply(1:cols, function(x) {
mydata[, x+1] <- sample(c(1:10), 10) } )
编辑:
您可以改用下面的代码
cols <- sample(c(1:5), 1)
mydata <- data.frame(rep(paste0("label ", seq(1,10))),
sapply(1:cols, function(x) {sample(c(1:10), 10) } ))
我想重写 this question 的一些第一行,但我不明白为什么我的 sapply
行不起作用。
我要转这些行:
cols <- sample(c(1:5), 1)
label <- rep(paste0("label ", seq(from=1, to=10)))
mydata <- data.frame(label)
for (i in 1:cols) {mydata[,i+1] <- sample(c(1:10), 10)}
进入:
cols <- sample(c(1:5), 1)
mydata <- data.frame(rep(paste0("label ", seq(1,10))))
sapply(1:cols, function(x) { mydata[,(x+1)] <- sample(c(1:10), 10) } )
但由于某些原因,sapply
行给我一个 new columns would leave holes after existing columns
错误,我不知道为什么。
我也试过了
sapply(1:cols, function(x) { mydata[,(x+1)] <- sample(c(1:10), 10); mydata } )
Map(function(x, mydata1) {mydata1[,(x+1)] <- sample(c(1:10), 10)}, x = 1:cols, mydata1 = mydata)
编辑:
当您在 mydata
数据框中分配新列时,它会在函数本地执行。 mydata
数据框的任何更改都不适用于此函数的父环境。
要查看此效果,请在函数内使用 print
语句。
mydata <- data.frame( label = rep(paste0("label ", seq(1,10))))
sapply( 1:cols, function(x) {
mydata[[(x+1)]] <- sample(c(1:10), 10)
print(mydata)
} )
mydata
为防止此范围界定问题,您可以使用 <<-
而不是 <-
。
sapply(1:cols, function(x) { mydata[,(x+1)] <<- sample(c(1:10), 10) } )
注意:强烈建议不要使用 <<-
方法,因为当您的代码库增长并且您的计算涉及多个包时,它会在以后造成混乱。
可能的解决方案:
您已获取 sapply
命令的输出并使用 mydata
绑定列。
试试这个:
set.seed(1L)
cols <- sample(c(1:5), 1)
print(cols) # [1] 2
mydata <- data.frame( label = rep(paste0("label ", seq(1,10))))
do.call("cbind",
list( mydata,
sapply( seq_len(cols), function(x) sample(c(1:10), 10) )
))
输出:
# label 1 2
# 1 label 1 4 2
# 2 label 2 6 7
# 3 label 3 8 4
# 4 label 4 2 6
# 5 label 5 9 3
# 6 label 6 5 8
# 7 label 7 3 5
# 8 label 8 7 10
# 9 label 9 1 9
# 10 label 10 10 1
我无法确定您的代码为何无法运行,但这与您 运行 sapply
之前未定义的列有关。因此,如果您事先定义 data.frame
,它就可以工作
cols <- sample(c(1:5), 1)
mydata <- data.frame(matrix(rep(0, 10*(cols+1)), ncol = cols+1))
mydata[, 1] <- rep(paste0("label ", seq(1,10)))
sapply(1:cols, function(x) {
mydata[, x+1] <- sample(c(1:10), 10) } )
编辑:
您可以改用下面的代码
cols <- sample(c(1:5), 1)
mydata <- data.frame(rep(paste0("label ", seq(1,10))),
sapply(1:cols, function(x) {sample(c(1:10), 10) } ))