按组划分数据列
Divide column of data by mean of the group
如果我有一个数据框,比如:
group=rep(1:4,each=10)
data=c(seq(1,10,1),seq(5,50,5),seq(20,11,-1),seq(0.3,3,0.3))
DF=data.frame(group,data)
现在,我想将每个 data
元素除以其组的平均值。例如:
group=rep(1:4,each=10)
data=c(seq(1,10,1),seq(5,50,5),seq(20,11,-1),seq(0.3,3,0.3))
DF=data.frame(group,data)
aggregate(DF,by=list(DF$group),FUN=mean)
#Group.1 group data
#1 1 1 5.50
#2 2 2 27.50
#3 3 3 15.50
#4 4 4 1.65
data1=c(seq(1,10,1)/5.5,seq(5,50,5)/27.5,seq(20,11,-1)/15.5,seq(0.3,3,0.3)/1.65)
DF1=data.frame(group, data1)
然而,这有点复杂,并且在大型数据集中工作起来并不容易。我觉得有一个 apply
应用程序可以在这里使用,但我找不到好的方法。
这是常用的一组选项(感谢@G.Grothendieck 对 ave
的简化):
# base R
DF$newdata = ave(DF$data, DF$group, FUN = function(x) x/mean(x))
# or...
DF$newdata = DF$data / ave(DF$data, DF$group)
# dplyr
library(dplyr)
DF %>% group_by(group) %>% mutate(newdata = data/mean(data))
# data.table
library(data.table)
setDT(DF)[, newdata := data/mean(data), by=group]
如果我有一个数据框,比如:
group=rep(1:4,each=10)
data=c(seq(1,10,1),seq(5,50,5),seq(20,11,-1),seq(0.3,3,0.3))
DF=data.frame(group,data)
现在,我想将每个 data
元素除以其组的平均值。例如:
group=rep(1:4,each=10)
data=c(seq(1,10,1),seq(5,50,5),seq(20,11,-1),seq(0.3,3,0.3))
DF=data.frame(group,data)
aggregate(DF,by=list(DF$group),FUN=mean)
#Group.1 group data
#1 1 1 5.50
#2 2 2 27.50
#3 3 3 15.50
#4 4 4 1.65
data1=c(seq(1,10,1)/5.5,seq(5,50,5)/27.5,seq(20,11,-1)/15.5,seq(0.3,3,0.3)/1.65)
DF1=data.frame(group, data1)
然而,这有点复杂,并且在大型数据集中工作起来并不容易。我觉得有一个 apply
应用程序可以在这里使用,但我找不到好的方法。
这是常用的一组选项(感谢@G.Grothendieck 对 ave
的简化):
# base R
DF$newdata = ave(DF$data, DF$group, FUN = function(x) x/mean(x))
# or...
DF$newdata = DF$data / ave(DF$data, DF$group)
# dplyr
library(dplyr)
DF %>% group_by(group) %>% mutate(newdata = data/mean(data))
# data.table
library(data.table)
setDT(DF)[, newdata := data/mean(data), by=group]