R中的组中位数
Median by group in R
我有以下数据框,如果某个值高于组的中位数,我想引入一个虚拟变量。
df<-data.frame(group=rep(c("A","B","c"),3), value1=c(1:9))
m<-aggregate(. ~ group, data=df, FUN=median)
names(m)[2]<-"median"
df<-merge(df,m, by="group", all.x = T)
df$median_0_1<-ifelse(df$median<df$value1,1,0)
有没有更优雅的方法来做到这一点?
而且,我可以调整它以将虚拟对象设置为高于或低于第三个四分位数吗?
而且,这是一种可靠的方法吗?
非常感谢。
当你想保持数据框中的行数相同时使用ave
df$median_0_1 <- with(df, as.integer(value1 > ave(value1, group, FUN = median)))
这也可以用dplyr
来完成
library(dplyr)
df %>% group_by(group) %>% mutate(median_0_1 = as.integer(value1 > median(value1)))
或data.table
library(data.table)
setDT(df)[, median_0_1 := as.integer(value1 > median(value1)), group]
仁者见仁,者见仁智者见智,你看如何
df <- within(df, {
median <- ave(value1, group, FUN=median)
median_0_1 <- ifelse(median < value1, 1, 0)
quantile3 <- ave(value1, group, FUN=function(x) quantile(x, probs=.3))
quantile_0_1 <- ifelse(quantile3 < value1, 1, 0)
})
df
# group value1 quantile_0_1 quantile3 median_0_1 median
# 1 A 1 0 2.8 0 4
# 2 B 2 0 3.8 0 5
# 3 c 3 0 4.8 0 6
# 4 A 4 1 2.8 0 4
# 5 B 5 1 3.8 0 5
# 6 c 6 1 4.8 0 6
# 7 A 7 1 2.8 1 4
# 8 B 8 1 3.8 1 5
# 9 c 9 1 4.8 1 6
我有以下数据框,如果某个值高于组的中位数,我想引入一个虚拟变量。
df<-data.frame(group=rep(c("A","B","c"),3), value1=c(1:9))
m<-aggregate(. ~ group, data=df, FUN=median)
names(m)[2]<-"median"
df<-merge(df,m, by="group", all.x = T)
df$median_0_1<-ifelse(df$median<df$value1,1,0)
有没有更优雅的方法来做到这一点?
而且,我可以调整它以将虚拟对象设置为高于或低于第三个四分位数吗?
而且,这是一种可靠的方法吗?
非常感谢。
当你想保持数据框中的行数相同时使用ave
df$median_0_1 <- with(df, as.integer(value1 > ave(value1, group, FUN = median)))
这也可以用dplyr
library(dplyr)
df %>% group_by(group) %>% mutate(median_0_1 = as.integer(value1 > median(value1)))
或data.table
library(data.table)
setDT(df)[, median_0_1 := as.integer(value1 > median(value1)), group]
仁者见仁,者见仁智者见智,你看如何
df <- within(df, {
median <- ave(value1, group, FUN=median)
median_0_1 <- ifelse(median < value1, 1, 0)
quantile3 <- ave(value1, group, FUN=function(x) quantile(x, probs=.3))
quantile_0_1 <- ifelse(quantile3 < value1, 1, 0)
})
df
# group value1 quantile_0_1 quantile3 median_0_1 median
# 1 A 1 0 2.8 0 4
# 2 B 2 0 3.8 0 5
# 3 c 3 0 4.8 0 6
# 4 A 4 1 2.8 0 4
# 5 B 5 1 3.8 0 5
# 6 c 6 1 4.8 0 6
# 7 A 7 1 2.8 1 4
# 8 B 8 1 3.8 1 5
# 9 c 9 1 4.8 1 6