匹配任何字符(包括空格)直到最后一堆空格
Match any character (including whitespace) until the LAST bunch of whitespaces
我有这样的文字:
0000 10 [STUFF] Text ("TOTAL,SOME RANDOM TEXT") (558b6a68)
前两列非常静态。第三个是可选的。最后一个是可选的,如果存在,则始终覆盖在括号之间。
我的问题是第四列,它可以有 space 或里面的任何字符(当然除了换行符)。
我当前的正则表达式如下所示:
^([a-fA-F0-9]{4,})\s+[a-fA-F0-9]+\s+(?:\[[^\]]*\]\s+)?
匹配到第四列开头的所有内容。
请注意 space 可能存在于任何地方,我无法定义确切的位置,例如 "always before parenthesis" 或 "may be between quotation marks"。
我确定这是最后一栏。所以我想像这样捕捉它们:
0000 10 [STUFF] Text("TOTAL,SOME RANDOM TEXT") (558b6a68)
^ ^ ^ ^ ^ ^
CAPTURE C A P T U R E C A P T U R E
我想截取前面代码块中提到的^^字符之间标记的文本。
所以,我想抓住任何角色,直到最后一堆白色space,但我也不想将它们包含在最终匹配组中。
我希望我描述得很好 :) 是否可以使用正则表达式?
这里还有一些要测试的示例文本:
0000 10 Text("TOTAL,SOME RANDOM TEXT") (1122aabb)
0010 5 D==1122aabb (1122aabb)
0015 17 Text("AND,SOME,MORE") (00000001)
002c 5 D==1 (1)
0031 1 !D (ccdd3344)
0032 5 D==ccdd3344 (ccdd3344)
0037 2 !1 (1)
0039 0 [AAAA] Fff
0039 1 [BBBB] Aaa
003a 6 N(05, eeff5566) (eeff5566)
0040 1 Qq
0041 2 $ab ([String]:"Unknown")
0043 f Call A/SomeFunc-X
0052 1 cd
我也会像你的模式一样开始 ^(\w+) +\w+ +(?:\[[^\]]+\] *)?
从这里(第 4 列开始)捕获第一个 \S
非白色 space,然后是 .*?
lazily可以捕获任何数量的任何字符,直到可以捕获 $
末尾的可选括号部分。如果不是,则整行由第二组消耗。
^(\w+) +\w+ +(?:\[[^\]]+\] *)?(\S.*?)(?: +(\([^)]+\)))?$
如果需要,请随意调整第三组的括号to only capture what's inside。
我有这样的文字:
0000 10 [STUFF] Text ("TOTAL,SOME RANDOM TEXT") (558b6a68)
前两列非常静态。第三个是可选的。最后一个是可选的,如果存在,则始终覆盖在括号之间。
我的问题是第四列,它可以有 space 或里面的任何字符(当然除了换行符)。
我当前的正则表达式如下所示:
^([a-fA-F0-9]{4,})\s+[a-fA-F0-9]+\s+(?:\[[^\]]*\]\s+)?
匹配到第四列开头的所有内容。
请注意 space 可能存在于任何地方,我无法定义确切的位置,例如 "always before parenthesis" 或 "may be between quotation marks"。
我确定这是最后一栏。所以我想像这样捕捉它们:
0000 10 [STUFF] Text("TOTAL,SOME RANDOM TEXT") (558b6a68)
^ ^ ^ ^ ^ ^
CAPTURE C A P T U R E C A P T U R E
我想截取前面代码块中提到的^^字符之间标记的文本。
所以,我想抓住任何角色,直到最后一堆白色space,但我也不想将它们包含在最终匹配组中。
我希望我描述得很好 :) 是否可以使用正则表达式?
这里还有一些要测试的示例文本:
0000 10 Text("TOTAL,SOME RANDOM TEXT") (1122aabb)
0010 5 D==1122aabb (1122aabb)
0015 17 Text("AND,SOME,MORE") (00000001)
002c 5 D==1 (1)
0031 1 !D (ccdd3344)
0032 5 D==ccdd3344 (ccdd3344)
0037 2 !1 (1)
0039 0 [AAAA] Fff
0039 1 [BBBB] Aaa
003a 6 N(05, eeff5566) (eeff5566)
0040 1 Qq
0041 2 $ab ([String]:"Unknown")
0043 f Call A/SomeFunc-X
0052 1 cd
我也会像你的模式一样开始 ^(\w+) +\w+ +(?:\[[^\]]+\] *)?
从这里(第 4 列开始)捕获第一个 \S
非白色 space,然后是 .*?
lazily可以捕获任何数量的任何字符,直到可以捕获 $
末尾的可选括号部分。如果不是,则整行由第二组消耗。
^(\w+) +\w+ +(?:\[[^\]]+\] *)?(\S.*?)(?: +(\([^)]+\)))?$
如果需要,请随意调整第三组的括号to only capture what's inside。