在 R 中生成分层 bootstrap 重采样

generate stratified bootstrap resamples in R

假设我有一个包含 3 个变量和 7 行的数据框

df <- data.frame(V1=c(0,1,0,0,0,1,0), V2=rnorm(7), V3=rnorm(7))

我如何创建一个包含 20 行的自举数据框,其中 V1 中 0 和 1 的分布大致相同,即它应该包含相同数量的 0 和 1?谢谢。

我查看了一些包,例如boot,但我不想计算自举统计,我只想要数据集。

您可以使用 dplyr 包中的 sample_n

library(dplyr)
df %>% 
  group_by(V1) %>% 
  sample_n(10, replace=T)