在 dplyr, R 中取一个没有组的样本
Take a sample without group in dplyr, R
我知道如何使用 dplyr 中的 sample_n 或 sample_frac 从数据帧中的每个组中随机抽样,可以这样进行,
dataset %>%
group_by(user_id) %>%
sample_n(10)
但是,我有一个稍微不同的问题。我想从整个数据集中随机抽样。应该就这么简单,
sample_n(dataset,10)
但是,因为我在之前的案例中对数据集使用了group_by命令,看来group_by在这里仍然有效。第二个命令相当于这里的第一个。
我想知道如何去除 group_by 的影响并从整个数据集中获取随机样本?
我们可以使用 ungroup()
删除任何组变量,然后应用 sample_n
dataset %>%
group_by(user_id) %>%
ungroup() %>%
sample_n(10)
我知道如何使用 dplyr 中的 sample_n 或 sample_frac 从数据帧中的每个组中随机抽样,可以这样进行,
dataset %>%
group_by(user_id) %>%
sample_n(10)
但是,我有一个稍微不同的问题。我想从整个数据集中随机抽样。应该就这么简单,
sample_n(dataset,10)
但是,因为我在之前的案例中对数据集使用了group_by命令,看来group_by在这里仍然有效。第二个命令相当于这里的第一个。
我想知道如何去除 group_by 的影响并从整个数据集中获取随机样本?
我们可以使用 ungroup()
删除任何组变量,然后应用 sample_n
dataset %>%
group_by(user_id) %>%
ungroup() %>%
sample_n(10)