计算数据框中某些列的标准偏差
Calculate standard deviation of certain columns in data frame
我有一个包含 120 行和 265 列的数据框。第 5 列到第 265 列的单元格包含一个数值。
对于每一行,我想计算从第 5 列到第 265 列(第 5 列、第 7 列、第 9 列等)的每个奇数列的值的标准差,并将其写入第 266 列相应的行。
我现在用 apply 函数和 for 循环处理了两个小时,但我得到的只是我无法理解的错误消息。
你可以试试
df$newCol <- apply(df[seq(5, ncol(df), by=2)], 1, sd)
或使用 matrixStats
中的 rowSds
library(matrixStats)
df$newCol <- rowSds(as.matrix(df[seq(5, ncol(df), by=2)]))
或者正如@DavidArenburg 所评论的那样,您可以检查矢量化 RowSD
数据
set.seed(253)
df <- cbind(as.data.frame(matrix(sample(letters, 120*4, replace=TRUE),
ncol=4), stringsAsFactors=FALSE), matrix(sample(1:50, 120*261,
replace=TRUE), ncol=261))
我有一个包含 120 行和 265 列的数据框。第 5 列到第 265 列的单元格包含一个数值。
对于每一行,我想计算从第 5 列到第 265 列(第 5 列、第 7 列、第 9 列等)的每个奇数列的值的标准差,并将其写入第 266 列相应的行。
我现在用 apply 函数和 for 循环处理了两个小时,但我得到的只是我无法理解的错误消息。
你可以试试
df$newCol <- apply(df[seq(5, ncol(df), by=2)], 1, sd)
或使用 matrixStats
rowSds
library(matrixStats)
df$newCol <- rowSds(as.matrix(df[seq(5, ncol(df), by=2)]))
或者正如@DavidArenburg 所评论的那样,您可以检查矢量化 RowSD
数据
set.seed(253)
df <- cbind(as.data.frame(matrix(sample(letters, 120*4, replace=TRUE),
ncol=4), stringsAsFactors=FALSE), matrix(sample(1:50, 120*261,
replace=TRUE), ncol=261))