使用 gsubfn 替换字符串中的多个实例

Using gsubfn to replace many instances within a string

我编写了一个函数来转换表示数字的字符串(magrittr 在我的系统中加载):

adjust_perc_format <- function(x, n=3){
  gsub(",", ".", x, perl = T) %>% as.numeric() %>% format(nsmall=n, decimal.mark = ",")
}

这样:

adjust_perc_format("2,5", 3) 
[1] "2,500"

目标是转换字符串中由正则表达式定义的出现(参见 here)。为此,我尝试了 gsubfn:

str <- "20MG/ML (2,5%)+0,5%"
gsubfn("[\d,]+(?=%)", function(x) adjust_perc_format(x, n=3),str)

预期结果是"20MG/ML (2,500%)+0,500%"。相反,我得到了相同的输入字符串 ("20MG/ML (2,5%)+0,5%").

我也试过如下设置引擎,没有成功:

options(gsubfn.engine = "R")

我在这里错过了什么?谢谢。

您需要通过传递 backref=0 参数告诉 gsubfn 使用整个匹配:

gsubfn("[\d,]+(?=%)", function(x) adjust_perc_format(x, n=3),str, backref=0)

R 测试:

> library(gsubfn)
> str <- "20MG/ML (2,5%)+0,5%"
> gsubfn("[\d,]+(?=%)", function(x) adjust_perc_format(x, n=3),str, backref=0)
[1] "20MG/ML (2,500%)+0,500%"

如果你想让你的模式更可靠,你可以使用

gsubfn("\d+(?:,\d+)*(?=%)", function(x) adjust_perc_format(x, n=3),str, backref=0)

将匹配一位或多位数字,后跟零次或多次出现的逗号和一位或多位数字(后跟 %,因为它处于正先行状态,所以不会被消耗)。