如果超过 5% 的变量是 NA,我将删除我的行 58000+ rows.And 删除行

I will delete my rows for 58000+ rows.And delete rows if more than 5% of variables are NA

我的数据框有 58000 多行和 26 列。如果超过 5% 的变量是 NA,我将删除我的行 58000+ rows.And 删除行。

我们可以在用 is.na

创建的逻辑矩阵上使用 rowMeans
df1[rowMeans(is.na(df1)) <= 0.5, , drop = FALSE]

在上面的代码中,is.na(df1) returns 一个 TRUE(对于 NA)和 FALSE(对于非 NA)的逻辑矩阵,用 rowMeans,我们计算百分比行中的 TRUE 值,检查它是否小于或等于 0.5 以创建逻辑向量并通过将其用作行索引来子集行