r 映射 vs "bad lapply"
r mapply vs "bad lapply"
我想我在这里漏掉了一些简单的东西:
我有一个 data.frames 的列表和一个 select 的行号列表。
像这样:
a <- data.frame(q = c(1,0,0,0),
w = c(1,1,0,0),
e = c(1,1,1,0),
r = c(1,1,1,1))
b <- a + 1
c <- a + 2
d <- a + 3
data <- list(a = a, b = b, c = c, d = d)
ind_a <- c(1, 2)
ind_b <- c(1, 3)
ind_c <- c(1, 4)
ind_d <- c(2, 4)
train <- list(ind_a, ind_b, ind_c, ind_d)
现在,我想 select 行,我认为正确的形式可以是
test1 <- mapply(function(x,y) x[y, ], data, train)
但我唯一能让它工作的方法是
test2 <- lapply(1:4, function(x) data[[x]][train[[x]], ])
我觉得这像是一个假的 for 循环...
我哪里错了???
与mapply
,默认选项是SIMPLIFY = TRUE
,当维度相同时,它将其简化为数组。如果我们将其更改为 FALSE
,输出将是 list
mapply(function(x,y) x[y, ], data, train, SIMPLIFY = FALSE)
或者使用 Map
包装器
Map(function(x, y) x[y, ], data, train)
我想我在这里漏掉了一些简单的东西: 我有一个 data.frames 的列表和一个 select 的行号列表。 像这样:
a <- data.frame(q = c(1,0,0,0),
w = c(1,1,0,0),
e = c(1,1,1,0),
r = c(1,1,1,1))
b <- a + 1
c <- a + 2
d <- a + 3
data <- list(a = a, b = b, c = c, d = d)
ind_a <- c(1, 2)
ind_b <- c(1, 3)
ind_c <- c(1, 4)
ind_d <- c(2, 4)
train <- list(ind_a, ind_b, ind_c, ind_d)
现在,我想 select 行,我认为正确的形式可以是
test1 <- mapply(function(x,y) x[y, ], data, train)
但我唯一能让它工作的方法是
test2 <- lapply(1:4, function(x) data[[x]][train[[x]], ])
我觉得这像是一个假的 for 循环...
我哪里错了???
与mapply
,默认选项是SIMPLIFY = TRUE
,当维度相同时,它将其简化为数组。如果我们将其更改为 FALSE
,输出将是 list
mapply(function(x,y) x[y, ], data, train, SIMPLIFY = FALSE)
或者使用 Map
包装器
Map(function(x, y) x[y, ], data, train)