使用标准评估、Forcats 和 Stringr 重新编码多个满意度量表变量的函数

Question

library(tidyverse)
library(stringr)
library(lazyeval)

下面是一个简单数据框示例的数据...

Respondent<-c("Respondent1","Respondent2","Respondent3","Respondent4","Respondent5")
Sat1<-c("1 Extremely dissatisfied","2 Moderately dissatisfied","2 Moderately Dissatisfied","4 Neutral","7 Extrmely satified")
Sat2<-c("7 Extremely Satisfied","2. Moderately dissatisfied","4 Neutral","3  Slightly dissatisfied","3 Slightly Dissatisfied")
Sat3<-c("1 Extremely dissatisfied","7 Extremely satisfied","6 Moderately satisfied","4. Neutral","3 Slightly dissatisfied")
Pet<-c("Cat","Cat","Dog","Hamster","Rabbit")

df <- data_frame(Respondent,Sat1,Sat2,Sat3,Pet)

下面的代码是将满意度得分列重新编码为满意、不满意和中立三类。

df %>% 
mutate_at(vars(starts_with("Sat")), 
     funs(fct_collapse(factor(str_sub(., 1, 1), levels = as.character(1:7)),
                          Satisfied = c("7","6","5"),
                          Dissatisfied =c ("3", "2","1"),
                          Neutral = "4")))

但是，我的真实示例涉及重新编码相同的满意度等级多个文件，每个文件都有不同数量的满意度量表列。所以我想把它包装成一个函数，允许我输入数据框名称，以及任意数量的要重新编码的列。下面是我尝试使用的代码的一种变体，但我无法让它工作。我一直在玩弄 .dots 和“...”，但找不到任何有用的东西。

 REC<-function(data,...){
data %>% 
 mutate_at(vars(...), 
     funs(fct_collapse(factor(str_sub(., 1, 1), levels = as.character(1:7)),
                   Satisfied = c("7","6","5"),
                   Dissatisfied =c ("3", "2","1"),
                   Neutral = "4")))
                   }

我应该对 mutate_at 使用标准评估吗？另外，我是否必须将 .dots 与 ... 一起使用？如果标准评估不适用于 mutate_at，我愿意使用其他 functions/techniques 来实现相同的最终目标，最好是在 tidyverse 内。

Answer 1

starts_with("Sat") 是否适用于您的所有文件？如果是这样，无论有多少列以 "Sat" 开头，该函数都将起作用。

REC <- function(data){
  data %>% 
    mutate_at(vars(starts_with("Sat")),
                   funs(fct_collapse(factor(str_sub(., 1, 1), levels = as.character(1:7)),
                                     Satisfied=c("7","6","5"),
                                     Dissatisfied=c("3", "2","1"),
                                     Neutral="4")))
}

如果您想传递要更改的列的索引，您可以尝试：

REC <- function(data, variable){
  data %>% 
    mutate_at(vars(variable),
              funs(fct_collapse(factor(str_sub(., 1, 1), levels = as.character(1:7)),
                                    Satisfied=c("7","6","5"),
                                    Dissatisfied=c("3", "2","1"),
                                    Neutral="4")))
}

然后REC(df, 2:4)会给你这个输出

# A tibble: 5 × 5
   Respondent         Sat1         Sat2         Sat3     Pet
        <chr>       <fctr>       <fctr>       <fctr>   <chr>
1 Respondent1 Dissatisfied    Satisfied Dissatisfied     Cat
2 Respondent2 Dissatisfied Dissatisfied    Satisfied     Cat
3 Respondent3 Dissatisfied      Neutral    Satisfied     Dog
4 Respondent4      Neutral Dissatisfied      Neutral Hamster
5 Respondent5    Satisfied Dissatisfied Dissatisfied  Rabbit

使用标准评估、Forcats 和 Stringr 重新编码多个满意度量表变量的函数

Function to Recode Multiple Satisfaction Scale Variables with Standard Evaluation, Forcats, and Stringr

r

stringr

lazyeval

tidyverse