捕获正则表达式中的重复组
capture repeated groups in regular expressions
与this question类似,我想捕捉一个重复不止一次的组。但是,我不想使用 findall,因为我使用的是正则表达式的求值顺序。
我的问题 -
我想解析看起来像这样的参数 -
"(a, {b, c, d}, e)" # arguments are 1: "a", 2: "b, c, d", 3: "e"
"({a, b}, c, {d, e}, f)" # arguments are 1: "a, b", 2: c, 3: "d, e"
分机。
参数以逗号分隔,但一对大括号的上下文是单个参数。
这是我尝试编写的正则表达式 -
_SingleArg = "(?:(\{.+?\})|(.+?))"
ArgsParse = re.compile(f"(?:{_SingleArg}, )*{_SingleArg}?$")
_SingleArg 变量尝试匹配括号内的完整参数,如果失败,它会尝试匹配常规参数。
我想不出用 findall 做这个的方法。我可以通过 运行 多个正则表达式来做到这一点——首先找到大括号内的参数,然后用空字符串替换它们,最后用逗号分隔。但这是一个非常不优雅的解决方案,尤其是因为我也想知道参数的顺序。
有没有更好的方法用正则表达式来做到这一点?
谢谢,
您可以使用此模式和方法来保留参数的顺序:
模式:\w+|\{([\w, ]+)\}
代码:
pattern = r"\w+|\{([\w, ]+)\}"
test_string = "({a, b}, c, {d, e}, f)"
result = [(x, y.group().strip('{}')) for x, y in enumerate(re.finditer(pattern, test_string), start=1)]
print(result)
输出:
[(1, 'a, b'), (2, 'c'), (3, 'd, e'), (4, 'f')]
与this question类似,我想捕捉一个重复不止一次的组。但是,我不想使用 findall,因为我使用的是正则表达式的求值顺序。
我的问题 - 我想解析看起来像这样的参数 -
"(a, {b, c, d}, e)" # arguments are 1: "a", 2: "b, c, d", 3: "e"
"({a, b}, c, {d, e}, f)" # arguments are 1: "a, b", 2: c, 3: "d, e"
分机。
参数以逗号分隔,但一对大括号的上下文是单个参数。
这是我尝试编写的正则表达式 -
_SingleArg = "(?:(\{.+?\})|(.+?))"
ArgsParse = re.compile(f"(?:{_SingleArg}, )*{_SingleArg}?$")
_SingleArg 变量尝试匹配括号内的完整参数,如果失败,它会尝试匹配常规参数。
我想不出用 findall 做这个的方法。我可以通过 运行 多个正则表达式来做到这一点——首先找到大括号内的参数,然后用空字符串替换它们,最后用逗号分隔。但这是一个非常不优雅的解决方案,尤其是因为我也想知道参数的顺序。
有没有更好的方法用正则表达式来做到这一点?
谢谢,
您可以使用此模式和方法来保留参数的顺序:
模式:\w+|\{([\w, ]+)\}
代码:
pattern = r"\w+|\{([\w, ]+)\}"
test_string = "({a, b}, c, {d, e}, f)"
result = [(x, y.group().strip('{}')) for x, y in enumerate(re.finditer(pattern, test_string), start=1)]
print(result)
输出:
[(1, 'a, b'), (2, 'c'), (3, 'd, e'), (4, 'f')]