R:如何遍历变量列表并创建具有动态名称的新变量?

R: How do I loop through a list of variables and create new ones with dynamic names?

我已经搜索了几个小时,但找不到一个很好的例子来说明我想做什么。我知道如何在 SAS 中轻松执行此操作,但我是 R 的新手。我有下面的代码创建两个变量。我必须重复这个来创建更多类似的东西。模式是一样的。所有新变量都将以“EPL_”开头,并将使用具有相同后缀的名为“EP_”的变量创建。示例:

backtowide$EPL_VARTREE <-  percent_rank(backtowide$EP_VARTREE)
backtowide$EPL_VARSKY <-  percent_rank(backtowide$EP_VARSKY)

如何在循环中执行此操作而不必将这行代码重复 20 次以上?

类似于:

for i in VARLIST {
backwide$EPL_i <-  percent_rank(backtowide$EP_i)
}

您可以使用 acrosspercent_rank 函数应用于以 'EP_' 开头的每一列,并使用 .names 分配名称。

library(dplyr)

backtowide <- backtowide %>%
                 mutate(across(starts_with('EP'), 
                        percent_rank, .names = '{sub("EP", "EPL", .col)}'))
backtowide

#   EP_VARTREE  EP_VARSKY EPL_VARTREE EPL_VARSKY
#1 -0.56047565  1.7150650        0.00       1.00
#2 -0.23017749  0.4609162        0.25       0.75
#3  1.55870831 -1.2650612        1.00       0.00
#4  0.07050839 -0.6868529        0.50       0.25
#5  0.12928774 -0.4456620        0.75       0.50

或者用 lapply -

cols <- grep('^EP_', names(backtowide), value = TRUE)
backtowide[sub("EP", "EPL", cols)] <- lapply(backtowide[cols], percent_rank)

数据

set.seed(123)
backtowide <- data.frame(EP_VARTREE = rnorm(5), EP_VARSKY = rnorm(5))