创建一个 data.frame 个相互依赖的变量

Question

我想用相互依赖的变量创建一个数据框。我可以通过使用 dplyr 样式的代码来完成此操作：

p.1 <- .1
p.2 <- .3
p.3 <- .6
l <- 1e2

df <- data.frame(
  var.1 =
    sample(0:1, l, prob = c(1 - p.1, p.1), replace = TRUE))

df <- df %>%
    mutate(
  var.2 = ifelse(
    var.1 == 1, 0,
    sample(0:1, l, prob = c(1 - p.2, p.2), replace = TRUE)),
  var.3 = ifelse(
    var.1 == 1 | var.2 == 1, 0,
    sample(0:1, l, prob = c(1 - p.3, p.3), replace = TRUE))
)

一步创建 df 会更好，但这不起作用，因为找不到 var.1:

df <- data.frame(
  var.1 =
    sample(0:1, l, prob = c(1 - p.1, p.1), replace = TRUE),
  var.2 = ifelse(
    var.1 == 1, 0,
    sample(0:1, l, prob = c(1 - p.2, p.2), replace = TRUE)
    ),
  var.3 = ifelse(
    var.1 == 1 | var.2 == 1, 0,
    sample(0:1, l, prob = c(1 - p.3, p.3), replace = TRUE)
    )
  )

首先创建一个空 df 的另一个尝试也不起作用，这会引发错误 Error in mutate_impl(.data, dots) : Column var.1 must be length 0（行数）或一，不是 100:

df <- data.frame()
df <- df %>%
  mutate(
    var.1 =
      sample(0:1, l, prob = c(1 - p.1, p.1), replace = TRUE),
    var.2 = ifelse(
      var.1 == 1, 0,
      sample(0:1, l, prob = c(1 - p.2, p.2), replace = TRUE)
      ),
    var.3 = ifelse(
      var.1 == 1 | var.2 == 1, 0,
      sample(0:1, l, prob = c(1 - p.3, p.3), replace = TRUE)
      )
  )

实际上我有更多的变量，我想要一个更经济的解决方案来完成这项任务。

Answer 1

你很接近

df <- data.frame(
  var.1 =
    sample(0:1, l, prob = c(1 - p.1, p.1), replace = TRUE)) %>%  # create data frame with var.1 first, then mutate
    mutate(
  var.2 = ifelse(
    var.1 == 1, 0,
    sample(0:1, l, prob = c(1 - p.2, p.2), replace = TRUE)),
  var.3 = ifelse(
    var.1 == 1 | var.2 == 1, 0,
    sample(0:1, l, prob = c(1 - p.3, p.3), replace = TRUE))
)

创建一个 data.frame 个相互依赖的变量

Create a data.frame of variables depending on each other

simulation

if-statement

r

dataframe

dplyr