在 dplyr, R 中取一个没有组的样本

Question

我知道如何使用 dplyr 中的 sample_n 或 sample_frac 从数据帧中的每个组中随机抽样，可以这样进行，

dataset %>%
  group_by(user_id) %>%
  sample_n(10)

但是，我有一个稍微不同的问题。我想从整个数据集中随机抽样。应该就这么简单，

sample_n(dataset,10)

但是，因为我在之前的案例中对数据集使用了group_by命令，看来group_by在这里仍然有效。第二个命令相当于这里的第一个。

我想知道如何去除 group_by 的影响并从整个数据集中获取随机样本？

Answer 1

我们可以使用 ungroup() 删除任何组变量，然后应用 sample_n

dataset %>%
    group_by(user_id)  %>%
    ungroup() %>%
    sample_n(10)

Take a sample without group in dplyr, R