如何从ff对象中随机抽样

How to do random sample from ff object

我想从 R 中的大型 ff 对象中提取 1000 个值的数量。

我尝试了 dplyr 包中的 sample_frac,但这会导致如下错误;

Error: tbl must be a data frame, not a ffdf object

我该如何解决这个问题?

您可以使用 ffbase2 包。它将 dplyr 接口添加到 ff 对象

install.packages("devtools")
devtools::install_github("edwindj/ffbase2")

并使用 tbl_ffdf 函数将 ff 对象读取为 tbl

iris_f <- tbl_ffdf(iris)

species <- 
   iris_f %>%
   group_by(Species) %>%
   summarise(petal_width = sum(Petal.Width))