正则表达式获取类似 xpath 的字符串中的每个项目，每个下标作为一个组

Question

我想采用类似 xpath 的字符串，例如：

a.b.c[2].d[123].e1[4].f88[5]

并将每个路径部分作为一个匹配项，将每个下标（“数组索引”）作为一个组，如下所示：

match 1: a
match 2: b
match 3: c, group 1: 123
match 4: e1, group 1: 4,
match 5: f88, group 1: 5

我尝试了以下方法（无效）：

[^.]+(?:\[)*([0-9]+)*(?:\])*

根据我的理解，这个正则表达式的意思是：

但是没用。

我怎样才能让它发挥作用？

Answer 1

[^.]+(?:\[)*([0-9]+)*(?:\])*

“但它不起作用” 因为 + 是 greedy 并且 consumes 点之前的所有字符。此外，每个下标是整体可选的，而不是逐个部分。

应用这些标准，这个表达式确实有效：

([^.\[]+)(?:\[(\d+)\])?

Answer 2

您试过的模式：

如果 \G 锚点 is supported，并且您只想从字符串的开头匹配示例字符串，您可以为您想要的数据使用 2 个捕获组，并匹配中间的点和方括号。

\G([^\][.\s]+)(?:\[(\d+)\])?\.?

模式匹配：

如果字符串末尾不能有点，并且必须至少有 1 个点，您可以先从字符串的开头断言整个格式：

(?:^(?=[^.]+(?:\.[^.]+)+$)|\G(?!^))\.?([^\][.]+)(?:\[(\d+)\])?

Regex to get each item in an xpath-like string, with each subscript as a group