用条件替换数据框中的行

Replace the rows in dataframe with condition

你好,关于这里的问题: [

我有一个 data.frame 例如:

d <- read.table(text='   V1 V2  V3  V4  V5  V6  V7
1 1 a 2 3 4 9 6
2 1 b 2 2 4 5 NA
3 1 c 1 3 4 5 8
4 1 d 1 2 3 6 9
5 2 a 1 2 3 4 5
6 2 b 1 4 5 6 7
7 2 c 1 2 3 5 8
8 2 d 2 3 6 7 9', header=TRUE)

现在我想取一行,例如第一行 (1a) 和:

获取该行的最小值和最大值。在这种情况下,min=2 和 max=9(注意中间有缺失值,例如该行中没有 5、7 或 8)。

现在我想用所有缺失值替换该行并扩展它(该行将比其他所有行都长,因为它将从 2 到 9 (2,3,4,5,6,7,8 ,9). 然后整个 data.frame 应该由 NA 列自动扩展到其他行,这些行不像我替换的那样长。

现在下面的代码确实实现了这一点:

row.to.change <- 1
(new.row <- seq(min(d[row.to.change,c(-1, -2)], na.rm=TRUE), max(d[row.to.change,c(-1,-2)], na.rm=TRUE)))
(num.add <- length(new.row) - ncol(d) + 2)
# [1] 3
if (num.add > 0) {
  d <- cbind(d, replicate(num.add, rep(NA, nrow(d))))
} else if (num.add <= 0) {
  new.row <- c(new.row, rep(NA, -num.add))
}

最后将扩展的 data.frame headers 重命名为默认的:

d[row.to.change,c(-1, -2)] <- new.row
colnames(d) <- paste0("V", seq_len(ncol(d)))

现在:这确实适用于我在 row.to.replace 中指定的行,但这是如何工作的,例如,如果我希望它适用于在 'b' 中的所有行第二栏?类似于:"do this where d$V2 == 'b'"?如果 data.frame 是 5000 行长。

你已经解决了。只需创建一个函数,然后将其应用于数据的每一行。

rtc=function(row.to.change){# <- 1
(new.row <- seq(min(d[row.to.change,c(-1, -2)], na.rm=TRUE), max(d[row.to.change,c(-1,-2)], na.rm=TRUE)))
(num.add <- length(new.row) - ncol(d) + 2)
# [1] 3
if (num.add <= 0) {
  new.row <- c(new.row, rep(NA, -num.add))
}
new.row
}

#d2=d

newr=lapply(1:nrow(d),rtc) # for the hole data
# for specific condition, like lines with "b" in V2 change to:
# newr=lapply(1:nrow(d),function(z)if(d$V2[z]=="b")rtc(z) else as.numeric(d[z,c(-1, -2)])) 
mxl=max(sapply(newr,length))
newr=lapply(newr,function(z)if(length(z)<mxl)c(z,rep(NA,mxl-length(z))) else z)
if (ncol(d)-2 < mxl) {
  d <- cbind(d, replicate(mxl-ncol(d)+2, rep(NA, nrow(d))))
}
d[,c(-1, -2)] <- do.call(rbind,newr)
colnames(d) <- paste0("V", seq_len(ncol(d)))

d

  V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 V11
1  1  a  2  3  4  5  6  7  8   9  NA
2  1  b  2  3  4  5 NA NA NA  NA  NA
3  1  c  1  2  3  4  5  6  7   8  NA
4  1  d  1  2  3  4  5  6  7   8   9
5  2  a  1  2  3  4  5 NA NA  NA  NA
6  2  b  1  2  3  4  5  6  7  NA  NA
7  2  c  1  2  3  4  5  6  7   8  NA
8  2  d  2  3  4  5  6  7  8   9  NA