R 中的 tidyverse VS dplyr - 处理能力/性能

tidyverse VS dplyr in R - Processing Power / Performance

我对 R 编程比较陌生，一直在研究，但我找不到这个主题的答案。

在代码开头加载完整的 tidyverse 是否比仅加载 dplyr 包需要更多的处理能力。例如，我可能只需要可以在 dplyr 中找到的函数。我是否通过加载完整的 tidyverse 来减少代码的 speed/performance，考虑到它包含其他几个包，它必须是一个更大的包？或者无论我选择加载哪个包，处理速度都是一样的。从易于编码的角度来看，我宁愿使用 tidyverse，因为它更全面，但如果我使用更多的处理能力，那么加载不太全面的包可能更有效率。

正如 NelsonGon 评论的那样，加载包不会降低您的处理速度。尽管包本身需要时间来加载，但它可能可以忽略不计，尤其是如果您已经想要加载 dplyr、tidyr 和 purrr 等。

在搜索路径上加载更多库（例如使用 library(dplyr)）可能不会影响您的速度，但可能会导致命名空间错误。

现在，有一些基准比较 dpylr，data.table，基础 R 和 dpylr 往往更慢，但是 YMMV。这是我找到的一个：https://www.r-bloggers.com/2018/01/tidyverse-and-data-table-sitting-side-by-side-and-then-base-r-walks-in/。因此，如果您正在执行需要很长时间的操作，那么使用 data.table 可能是值得的。

R 中的 tidyverse VS dplyr - 处理能力/性能

tidyverse VS dplyr in R - Processing Power / Performance

r

memory-efficient

dplyr

tidyverse