R数据框中的元素良好实践
element in R dataframe good practice
在 R 中访问数据框 foo
中列 bar
中的第 i
个元素可以通过两种不同的方式完成:
foo[i,"bar"]
和
foo$bar[i]
.
它们之间有什么区别吗?如果可以,从效率、可读性等方面考虑应该使用哪一个?
如果有人问过这个问题,我们深表歉意,但是 []
和 $
字符非常难以捉摸。
我倾向于认为这是一个基于意见的问题,因此不适合 SO。但由于您要求考虑速度,我不会这样标记它。注意:您描述的索引方法不止两种...
data(mtcars)
library(microbenchmark)
microbenchmark(opt_a= mtcars$disp[12],
opt_b= mtcars[12, "disp"],
opt_c= mtcars[["disp"]][12])
Unit: microseconds
expr min lq mean median uq max neval cld
opt_a 5.322 6.4620 8.34029 6.8425 7.603 56.640 100 a
opt_b 9.503 10.0735 15.41463 10.6435 11.024 354.285 100 b
opt_c 4.181 4.942 7.77386 5.322 6.082 84.009 100 a
使用 foo$bar[i]
似乎比 foo[i, "bar"]
快得多,但不是最快的替代方法
在 R 中访问数据框 foo
中列 bar
中的第 i
个元素可以通过两种不同的方式完成:
foo[i,"bar"]
和
foo$bar[i]
.
它们之间有什么区别吗?如果可以,从效率、可读性等方面考虑应该使用哪一个?
如果有人问过这个问题,我们深表歉意,但是 []
和 $
字符非常难以捉摸。
我倾向于认为这是一个基于意见的问题,因此不适合 SO。但由于您要求考虑速度,我不会这样标记它。注意:您描述的索引方法不止两种...
data(mtcars)
library(microbenchmark)
microbenchmark(opt_a= mtcars$disp[12],
opt_b= mtcars[12, "disp"],
opt_c= mtcars[["disp"]][12])
Unit: microseconds
expr min lq mean median uq max neval cld
opt_a 5.322 6.4620 8.34029 6.8425 7.603 56.640 100 a
opt_b 9.503 10.0735 15.41463 10.6435 11.024 354.285 100 b
opt_c 4.181 4.942 7.77386 5.322 6.082 84.009 100 a
使用 foo$bar[i]
似乎比 foo[i, "bar"]
快得多,但不是最快的替代方法