R Tidyverse - 确定符合条件的 select 列的比例

Question

我有这样的数据：

x1 = seq(0, 2, length=5)
x2 = seq(1, 2, length=5)
x3 = seq(0, 1, length=5)
df = data.frame(rbind(x1,x2,x3))

我想获取值小于1的特定列（基于名称）的比例。下面选择名称中包含"x"的变量并对中的值求和列。

df <- df %>% 
  mutate(sumVar = rowSums(select(., contains("x")), na.rm = TRUE))

有没有办法在此设置中包含 ifelse 逻辑以确定值 < 1 的列的比例（与我在此处计算总和相反）？我正在使用 contains 功能，因为我想跨大量不一定按顺序排列但名称中具有相同模式的列进行计算。

Answer 1

您可以在条件下使用rowMeans()：

library(dplyr)

df %>% 
  mutate(propVar = rowMeans(select(., contains("x")) < 1))

   x1   x2   x3   propVar
1 0.0 1.00 0.00 0.6666667
2 0.5 1.25 0.25 0.6666667
3 1.0 1.50 0.50 0.3333333
4 1.5 1.75 0.75 0.3333333
5 2.0 2.00 1.00 0.0000000

Answer 2

我们可以在base R

中使用rowMeans

df$propVar <- rowMeans(df[startsWith(names(df), "x")]<1)

R Tidyverse - 确定符合条件的 select 列的比例

R Tidyverse - Identify proportion of select columns meeting criteria

r

contains

rowsum

dplyr

tidyverse