Oniguruma 正则表达式引擎中的命名子程序?

Named subroutines in Oniguruma regex engine?

在 Perl 中,您可以这样做:

(?x)
(?(DEFINE)
  (?<animal>dog|cat)
)
(?&animal)

在Ruby(Oniguruma 引擎)中,似乎不支持(?(DEFINE... 语法。此外,(?&... 变为 \g。所以,你可以这样做:

(?x)
(?<animal>dog|cat)
\g<animal>

当然,这并不等同于我上面给出的 Perl 示例,因为第一个 (?<animal>dog|cat) 没有被忽略,因为没有像 (?(DEFINE....[=20= 这样的东西]

如果我想用一堆命名子程序定义一个大型正则表达式,我以前可以用 Perl 做的事情就不能用这种方法来完成。

看起来我确实可以通过做这样的事情来拼凑一个非常尴尬的解决方案:

(?x)
(?:^$DEFINE
  (?<animal>dog|cat)
){0}
\g<animal>

但是,那太老套了。有一个更好的方法吗? Oniguruma 是否支持定义命名子例程的方法,而不必先尝试 "match" 它们?

或者,如果有办法让真正的 PCRE 在 Ruby 和 ?(DEFINE...(?&... 中工作,我也会接受。

谢谢!

您不需要这么复杂的技巧。写作:

(?x)
(?<animal>dog|cat){0}
(?<color>red|green|blue){0}
...
your main pattern here

完全一样。

将所有组定义放在 (?:^$DEFINE ... ){0} 中只是为了装饰。

请注意,根本没有尝试使用量词 {0} 的组(首先考虑量词),如果以这种方式定义了命名组,人们可以推断出它不是真正的 hack,而是使用 oniguruma 的方法。