在 R 中生成分层 bootstrap 重采样
generate stratified bootstrap resamples in R
假设我有一个包含 3 个变量和 7 行的数据框
df <- data.frame(V1=c(0,1,0,0,0,1,0), V2=rnorm(7), V3=rnorm(7))
我如何创建一个包含 20 行的自举数据框,其中 V1 中 0 和 1 的分布大致相同,即它应该包含相同数量的 0 和 1?谢谢。
我查看了一些包,例如boot
,但我不想计算自举统计,我只想要数据集。
您可以使用 dplyr
包中的 sample_n
。
library(dplyr)
df %>%
group_by(V1) %>%
sample_n(10, replace=T)
假设我有一个包含 3 个变量和 7 行的数据框
df <- data.frame(V1=c(0,1,0,0,0,1,0), V2=rnorm(7), V3=rnorm(7))
我如何创建一个包含 20 行的自举数据框,其中 V1 中 0 和 1 的分布大致相同,即它应该包含相同数量的 0 和 1?谢谢。
我查看了一些包,例如boot
,但我不想计算自举统计,我只想要数据集。
您可以使用 dplyr
包中的 sample_n
。
library(dplyr)
df %>%
group_by(V1) %>%
sample_n(10, replace=T)