最后一个 / 和第一个下划线之后的正则表达式匹配

Question

假设我有以下字符串：

string = "path/stack/over_flow/Pedro_account"

我有兴趣匹配最后一个 / 之后和第一个 _ 之前的前 2 个字符。所以在这种情况下，所需的输出是：

Pe

到目前为止我所拥有的是 substr 和 str_extract:

的混合

substr(str_extract(string, "[^/]*$"),1,2)

这当然会给出答案，但我相信也有一个很好的正则表达式，这就是我正在寻找的。

Answer 1

你可以使用

library(stringr)
str_extract(string, "(?<=/)[^/]{2}(?=[^/]*$)")
## => [1] "Pe"

参见R demo and the regex demo。详情:

Answer 2

使用basename获取最后一个文件夹名，然后substring:

substr(basename("path/stack/over_flow/Pedro_account"), 1, 2)
# [1] "Pe"

Answer 3

删除所有内容直到最后 / 并提取前 2 个字符。

基础 R -

string = "path/stack/over_flow/Pedro_account"
substr(sub('.*/', '', string), 1, 2)
#[1] "Pe"

stringr

substr(stringr::str_remove(string, '.*/'), 1, 2)

Answer 4

您可以将 str_match 与捕获组一起使用：

/

_

看到一个regex demo and a R demo.

例子

library(stringr)
string = "path/stack/over_flow/Pedro_account"
str_match(string, "/([^/_]{2})[^/]*$")[,2]

输出

[1] "Pe"

Regex match after last / and first underscore