R数据框中的元素良好实践

element in R dataframe good practice

在 R 中访问数据框 foo 中列 bar 中的第 i 个元素可以通过两种不同的方式完成:

foo[i,"bar"]

foo$bar[i].

它们之间有什么区别吗?如果可以,从效率、可读性等方面考虑应该使用哪一个?

如果有人问过这个问题,我们深表歉意,但是 []$ 字符非常难以捉摸。

我倾向于认为这是一个基于意见的问题,因此不适合 SO。但由于您要求考虑速度,我不会这样标记它。注意:您描述的索引方法不止两种...

data(mtcars)
library(microbenchmark)
microbenchmark(opt_a= mtcars$disp[12],
           opt_b= mtcars[12, "disp"],
           opt_c= mtcars[["disp"]][12])

Unit: microseconds
  expr   min      lq     mean  median     uq     max neval cld
 opt_a 5.322  6.4620  8.34029  6.8425  7.603  56.640   100  a 
 opt_b 9.503 10.0735 15.41463 10.6435 11.024 354.285   100   b
 opt_c 4.181  4.942  7.77386  5.322  6.082 84.009   100     a 

使用 foo$bar[i] 似乎比 foo[i, "bar"] 快得多,但不是最快的替代方法