如何在将多个列值粘贴在一起时省略 NA 值?
How to omit NA values while pasting numerous column values together?
我有一个包含数百列的数据框 dd2
,我需要做的是将所有这些列值粘贴在一起并省略任何 NA
值。如果我这样做
apply(dd2, 1, paste, collapse=",")
它实际上包括 NA
s 作为 "NA"
字符串。我想避免这种情况。我也可以如下所示进行操作,但这需要我一次处理每个单独的列以获得结果。
result <- cbind(
dd2,
combination = paste(dd2[,2], replace(dd2[,3], is.na(dd2[,3]), ""), sep = ",")
)
有什么有效的方法吗?这是示例数据:
dd2 <- structure(c("A", "B", "C", "D", "E", "AK2", "HFM1", NA, "TRR",
"RTT", NA, "PPT", "TRR", "RTT", NA, "PPT", NA, NA, "GGT", NA), .Dim = c(5L,
4L), .Dimnames = list(NULL, c("sample_id", "plant", "animal",
"more")))
您可以尝试 na.omit()
省略值,然后粘贴。此外,您可以使用 toString()
,因为它相当于 paste(..., collapse = ", ")
.
apply(dd2, 1, function(x) toString(na.omit(x)))
# [1] "A, AK2, PPT" "B, HFM1, PPT" "C, TRR"
# [4] "D, TRR, RTT, GGT" "E, RTT"
如果您有正在使用的特定列,那么
apply(dd2[, cols], 1, function(x) toString(na.omit(x)))
dd2
是一个矩阵,在这种情况下,使用 @Rich Scriven 建议的 apply
更合适。如果它是一个数据框,你可以使用 tidyr::unite
dd2 <- data.frame(dd2)
tidyr::unite(dd2, result, plant, animal, more, na.rm = TRUE, sep = ',')
# sample_id result
#1 A AK2,PPT
#2 B HFM1,PPT
#3 C TRR
#4 D TRR,RTT,GGT
#5 E RTT
要合并所有列,您可以使用 everything()
。
tidyr::unite(dd2, result, dplyr::everything(), na.rm = TRUE, sep = ',')
# result
#1 A,AK2,PPT
#2 B,HFM1,PPT
#3 C,TRR
#4 D,TRR,RTT,GGT
#5 E,RTT
我有一个包含数百列的数据框 dd2
,我需要做的是将所有这些列值粘贴在一起并省略任何 NA
值。如果我这样做
apply(dd2, 1, paste, collapse=",")
它实际上包括 NA
s 作为 "NA"
字符串。我想避免这种情况。我也可以如下所示进行操作,但这需要我一次处理每个单独的列以获得结果。
result <- cbind(
dd2,
combination = paste(dd2[,2], replace(dd2[,3], is.na(dd2[,3]), ""), sep = ",")
)
有什么有效的方法吗?这是示例数据:
dd2 <- structure(c("A", "B", "C", "D", "E", "AK2", "HFM1", NA, "TRR",
"RTT", NA, "PPT", "TRR", "RTT", NA, "PPT", NA, NA, "GGT", NA), .Dim = c(5L,
4L), .Dimnames = list(NULL, c("sample_id", "plant", "animal",
"more")))
您可以尝试 na.omit()
省略值,然后粘贴。此外,您可以使用 toString()
,因为它相当于 paste(..., collapse = ", ")
.
apply(dd2, 1, function(x) toString(na.omit(x)))
# [1] "A, AK2, PPT" "B, HFM1, PPT" "C, TRR"
# [4] "D, TRR, RTT, GGT" "E, RTT"
如果您有正在使用的特定列,那么
apply(dd2[, cols], 1, function(x) toString(na.omit(x)))
dd2
是一个矩阵,在这种情况下,使用 @Rich Scriven 建议的 apply
更合适。如果它是一个数据框,你可以使用 tidyr::unite
dd2 <- data.frame(dd2)
tidyr::unite(dd2, result, plant, animal, more, na.rm = TRUE, sep = ',')
# sample_id result
#1 A AK2,PPT
#2 B HFM1,PPT
#3 C TRR
#4 D TRR,RTT,GGT
#5 E RTT
要合并所有列,您可以使用 everything()
。
tidyr::unite(dd2, result, dplyr::everything(), na.rm = TRUE, sep = ',')
# result
#1 A,AK2,PPT
#2 B,HFM1,PPT
#3 C,TRR
#4 D,TRR,RTT,GGT
#5 E,RTT