匹配任何字符(包括空格)直到最后一堆空格

Match any character (including whitespace) until the LAST bunch of whitespaces

我有这样的文字:

0000       10   [STUFF]  Text ("TOTAL,SOME RANDOM  TEXT")     (558b6a68)

前两列非常静态。第三个是可选的。最后一个是可选的,如果存在,则始终覆盖在括号之间。

我的问题是第四列,它可以有 space 或里面的任何字符(当然除了换行符)。

我当前的正则表达式如下所示:

^([a-fA-F0-9]{4,})\s+[a-fA-F0-9]+\s+(?:\[[^\]]*\]\s+)?

匹配到第四列开头的所有内容。

请注意 space 可能存在于任何地方,我无法定义确切的位置,例如 "always before parenthesis" 或 "may be between quotation marks"。

我确定这是最后一栏。所以我想像这样捕捉它们:

 0000       10   [STUFF]  Text("TOTAL,SOME RANDOM  TEXT")      (558b6a68)
 ^  ^                     ^                             ^      ^        ^
CAPTURE                   C    A    P    T    U    R    E     C A P T U R E

我想截取前面代码块中提到的^^字符之间标记的文本。

所以,我想抓住任何角色,直到最后一堆白色space,但我也不想将它们包含在最终匹配组中。

我希望我描述得很好 :) 是否可以使用正则表达式?

这里还有一些要测试的示例文本:

0000       10        Text("TOTAL,SOME RANDOM  TEXT")  (1122aabb)
0010        5        D==1122aabb     (1122aabb)
0015       17        Text("AND,SOME,MORE")  (00000001)
002c        5        D==1            (1)
0031        1        !D              (ccdd3344)
0032        5        D==ccdd3344     (ccdd3344)
0037        2        !1              (1)
0039        0 [AAAA] Fff
0039        1 [BBBB] Aaa
003a        6        N(05, eeff5566)  (eeff5566)
0040        1        Qq
0041        2        $ab             ([String]:"Unknown")
0043        f        Call A/SomeFunc-X
0052        1        cd

我也会像你的模式一样开始 ^(\w+) +\w+ +(?:\[[^\]]+\] *)?

从这里(第 4 列开始)捕获第一个 \S 非白色 space,然后是 .*? lazily可以捕获任何数量的任何字符,直到可以捕获 $ 末尾的可选括号部分。如果不是,则整行由第二组消耗。

^(\w+) +\w+ +(?:\[[^\]]+\] *)?(\S.*?)(?: +(\([^)]+\)))?$

See this demo at regex101

如果需要,请随意调整第三组的括号to only capture what's inside