R:如何遍历变量列表并创建具有动态名称的新变量?
R: How do I loop through a list of variables and create new ones with dynamic names?
我已经搜索了几个小时,但找不到一个很好的例子来说明我想做什么。我知道如何在 SAS 中轻松执行此操作,但我是 R 的新手。我有下面的代码创建两个变量。我必须重复这个来创建更多类似的东西。模式是一样的。所有新变量都将以“EPL_”开头,并将使用具有相同后缀的名为“EP_”的变量创建。示例:
backtowide$EPL_VARTREE <- percent_rank(backtowide$EP_VARTREE)
backtowide$EPL_VARSKY <- percent_rank(backtowide$EP_VARSKY)
如何在循环中执行此操作而不必将这行代码重复 20 次以上?
类似于:
for i in VARLIST {
backwide$EPL_i <- percent_rank(backtowide$EP_i)
}
您可以使用 across
将 percent_rank
函数应用于以 'EP_'
开头的每一列,并使用 .names
分配名称。
library(dplyr)
backtowide <- backtowide %>%
mutate(across(starts_with('EP'),
percent_rank, .names = '{sub("EP", "EPL", .col)}'))
backtowide
# EP_VARTREE EP_VARSKY EPL_VARTREE EPL_VARSKY
#1 -0.56047565 1.7150650 0.00 1.00
#2 -0.23017749 0.4609162 0.25 0.75
#3 1.55870831 -1.2650612 1.00 0.00
#4 0.07050839 -0.6868529 0.50 0.25
#5 0.12928774 -0.4456620 0.75 0.50
或者用 lapply
-
cols <- grep('^EP_', names(backtowide), value = TRUE)
backtowide[sub("EP", "EPL", cols)] <- lapply(backtowide[cols], percent_rank)
数据
set.seed(123)
backtowide <- data.frame(EP_VARTREE = rnorm(5), EP_VARSKY = rnorm(5))
我已经搜索了几个小时,但找不到一个很好的例子来说明我想做什么。我知道如何在 SAS 中轻松执行此操作,但我是 R 的新手。我有下面的代码创建两个变量。我必须重复这个来创建更多类似的东西。模式是一样的。所有新变量都将以“EPL_”开头,并将使用具有相同后缀的名为“EP_”的变量创建。示例:
backtowide$EPL_VARTREE <- percent_rank(backtowide$EP_VARTREE)
backtowide$EPL_VARSKY <- percent_rank(backtowide$EP_VARSKY)
如何在循环中执行此操作而不必将这行代码重复 20 次以上?
类似于:
for i in VARLIST {
backwide$EPL_i <- percent_rank(backtowide$EP_i)
}
您可以使用 across
将 percent_rank
函数应用于以 'EP_'
开头的每一列,并使用 .names
分配名称。
library(dplyr)
backtowide <- backtowide %>%
mutate(across(starts_with('EP'),
percent_rank, .names = '{sub("EP", "EPL", .col)}'))
backtowide
# EP_VARTREE EP_VARSKY EPL_VARTREE EPL_VARSKY
#1 -0.56047565 1.7150650 0.00 1.00
#2 -0.23017749 0.4609162 0.25 0.75
#3 1.55870831 -1.2650612 1.00 0.00
#4 0.07050839 -0.6868529 0.50 0.25
#5 0.12928774 -0.4456620 0.75 0.50
或者用 lapply
-
cols <- grep('^EP_', names(backtowide), value = TRUE)
backtowide[sub("EP", "EPL", cols)] <- lapply(backtowide[cols], percent_rank)
数据
set.seed(123)
backtowide <- data.frame(EP_VARTREE = rnorm(5), EP_VARSKY = rnorm(5))