R 中的 tidyverse VS dplyr - 处理能力/性能

tidyverse VS dplyr in R - Processing Power / Performance

我对 R 编程比较陌生,一直在研究,但我找不到这个主题的答案。

在代码开头加载完整的 tidyverse 是否比仅加载 dplyr 包需要更多的处理能力。例如,我可能只需要可以在 dplyr 中找到的函数。我是否通过加载完整的 tidyverse 来减少代码的 speed/performance,考虑到它包含其他几个包,它必须是一个更大的包?或者无论我选择加载哪个包,处理速度都是一样的。从易于编码的角度来看,我宁愿使用 tidyverse,因为它更全面,但如果我使用更多的处理能力,那么加载不太全面的包可能更有效率。

正如 NelsonGon 评论的那样,加载包不会降低您的处理速度。尽管包本身需要时间来加载,但它可能可以忽略不计,尤其是如果您已经想要加载 dplyr、tidyr 和 purrr 等。

在搜索路径上加载更多库(例如使用 library(dplyr))可能不会影响您的速度,但可能会导致命名空间错误。

现在,有一些基准比较 dpylr,data.table,基础 R 和 dpylr 往往更慢,但是 YMMV。这是我找到的一个:https://www.r-bloggers.com/2018/01/tidyverse-and-data-table-sitting-side-by-side-and-then-base-r-walks-in/。因此,如果您正在执行需要很长时间的操作,那么使用 data.table 可能是值得的。