根据R代码中特定值运行的长度计算一个变量
Calculate a variable based on length of run of specific value in R code
我有这样的数据集,
dat <- data.frame(d1=c(0,1,0,1,0),
d2=c(0,1,1,1,0),d3=c(1,0,1,1,0),
d4=c(1,0,0,0,0),d5=c(1,1,1,0,0))
dat
d1 d2 d3 d4 d5
1 0 0 1 1 1
2 1 1 0 0 1
3 0 1 1 0 1
4 1 1 1 0 0
5 0 0 0 0 0
如果我认为每一行都是 运行 个人的集合。我想根据 运行 计算一个名为 "indicator" 的指标变量。例如,个人 1 运行 是 (0,0,1,1,1),因为 运行 的后向长度值为第一个 1 的值为 3。另一方面,对于个人 3 运行是(0,1,1,0,1),运行的后向长度取值first 1,s是1。需要的数据集是这样的。
d1 d2 d3 d4 d5 indicator
0 0 1 1 1 3
1 1 0 0 1 1
0 1 1 0 1 1
1 1 1 0 0 3
0 0 0 0 0 0
我试过这种方法,
indicator <- NULL
for(i in 1:5){
indicator[i] <- rev(sequence(rle(dat[i,])$lengths))[1]
}
indicator[1:5]
cbind(dat, indicator=indicator[1:5])
但这给出了这样的数据,
d1 d2 d3 d4 d5 indicator
1 0 0 1 1 1 3
2 1 1 0 0 1 1
3 0 1 1 0 1 1
4 1 1 1 0 0 2
5 0 0 0 0 0 5
谁能帮我解决这个问题?
尝试
val <- apply(dat, 1, function(x) with(rle(rev(x)==1), lengths[values])[1])
dat$indicator <- replace(val, is.na(val),0)
dat
# d1 d2 d3 d4 d5 indicator
#1 0 0 1 1 1 3
#2 1 1 0 0 1 1
#3 0 1 1 0 1 1
#4 1 1 1 0 0 3
#5 0 0 0 0 0 0
另一种方法:
x = apply(rev(dat),1, function(u) ifelse(u[1]==1, match(0,u)-1, match(1,u)))
transform(dat, indicator = ifelse(is.na(x), 0,x))
# d1 d2 d3 d4 d5 indicator
#1 0 0 1 1 1 3
#2 1 1 0 0 1 1
#3 0 1 1 0 1 1
#4 1 1 1 0 0 3
#5 0 0 0 0 0 0
我有这样的数据集,
dat <- data.frame(d1=c(0,1,0,1,0),
d2=c(0,1,1,1,0),d3=c(1,0,1,1,0),
d4=c(1,0,0,0,0),d5=c(1,1,1,0,0))
dat
d1 d2 d3 d4 d5
1 0 0 1 1 1
2 1 1 0 0 1
3 0 1 1 0 1
4 1 1 1 0 0
5 0 0 0 0 0
如果我认为每一行都是 运行 个人的集合。我想根据 运行 计算一个名为 "indicator" 的指标变量。例如,个人 1 运行 是 (0,0,1,1,1),因为 运行 的后向长度值为第一个 1 的值为 3。另一方面,对于个人 3 运行是(0,1,1,0,1),运行的后向长度取值first 1,s是1。需要的数据集是这样的。
d1 d2 d3 d4 d5 indicator
0 0 1 1 1 3
1 1 0 0 1 1
0 1 1 0 1 1
1 1 1 0 0 3
0 0 0 0 0 0
我试过这种方法,
indicator <- NULL
for(i in 1:5){
indicator[i] <- rev(sequence(rle(dat[i,])$lengths))[1]
}
indicator[1:5]
cbind(dat, indicator=indicator[1:5])
但这给出了这样的数据,
d1 d2 d3 d4 d5 indicator
1 0 0 1 1 1 3
2 1 1 0 0 1 1
3 0 1 1 0 1 1
4 1 1 1 0 0 2
5 0 0 0 0 0 5
谁能帮我解决这个问题?
尝试
val <- apply(dat, 1, function(x) with(rle(rev(x)==1), lengths[values])[1])
dat$indicator <- replace(val, is.na(val),0)
dat
# d1 d2 d3 d4 d5 indicator
#1 0 0 1 1 1 3
#2 1 1 0 0 1 1
#3 0 1 1 0 1 1
#4 1 1 1 0 0 3
#5 0 0 0 0 0 0
另一种方法:
x = apply(rev(dat),1, function(u) ifelse(u[1]==1, match(0,u)-1, match(1,u)))
transform(dat, indicator = ifelse(is.na(x), 0,x))
# d1 d2 d3 d4 d5 indicator
#1 0 0 1 1 1 3
#2 1 1 0 0 1 1
#3 0 1 1 0 1 1
#4 1 1 1 0 0 3
#5 0 0 0 0 0 0