Lua 模式——我怎样才能让它发挥作用?

Lua pattern -- how can I get this to work?

我有一个文本文件要处理,示例内容如下:

[FCT-FCTVALUEXXXX-IA]
Name=value
Label = value
Zero or more lines of text
Abbr=
Zero or more lines of text
Field A=1
Field B=0
Zero or more lines of text
Hidden=N
[Text-FCT-FCTVALUEXXXX-IA-Note]
One or more note lines
[FCT-FCT-FCTVALUEZ-IE-DETAIL]
Zero or more lines of text
[FCT-FCT-FCTVALUEQ-IA-DETAIL]
Zero or more lines of text
[FCT-_FCTVALUEY-IA]
Name=value
Zero or more lines of text
Label=value
Zero or more lines of text
Field A=1
Abbr=value
Field A=1
Zero or more lines of text
Hidden=N

我需要找到这样的部分:

[FCT-FCTVALUEXXXX-IA]
Name=value
Label = value
Zero or more lines of text
Abbr=
Zero or more lines of text
Field A=1
Field B=0
Zero or more lines of text
Hidden=N

并提取FCT-FCTVALUEXXXX-AA、Name、Label、Abbr、Field A and B和Hidden,然后找到对应的section(如果存在):

[Text-FCT-FCTVALUEXXXX-IA-Note]
One or more note lines

结束将注释行提取为单个字符串。

我不关心版块

[FCT-FCT-FCTVALUEZ-IE-DETAIL]
Zero or more lines of text

所有这三种部分都可以出现在文件中的任何位置,包括最后,并且部分之间的位置没有可预测的关系。

不能保证缩写和字段 A 和 B 的顺序,但它们总是出现在名称和标签之后和隐藏之前。

我目前拥有的:

strParse = "(%[FCT%-.-%-)([IF])([EA])%]%c+Name=(.-)%c.-Label=(.-)%c(.-)Hidden=(%a)%c" --cant pull everything out at once because the order of some fields is not predictable
for id, rt, ft, name, label, detail, hidden in strFacts:gmatch(strParse) do
    --extract details
    abbr=detail:match("Abbr=(.-)%c") --may be blank
    if abbr == nil then abbr = "" end
    FieldA = detail:match("Field A=(%d)")
    FieldB = detail:match("Field B=(%d)")               
    --need to sanitise id which could have a bunch of extraneous material tacked on the front and use it to get the Note
    ident=id:match(".*(%[FCT%-.-%-$)")..rt..ft
    Note = ParseAutonote(ident)  --this is a function to parse the note which I've yet to test so a dummy function returns ""                      
    tblResults[name]={ident, rt, ft, name, label, abbr, FieldA, FieldB, hidden, note}               
end

大部分工作正常(经过数小时的工作),但不工作的部分是:

(".*(%[FCT%-.-%-$)")

这应该会拉出最后出现的 FCT-sometext- 在字符串 id

我的逻辑:将搜索定位到字符串的末尾,并捕获字符串末尾以“[FCT-”开头并以“-”结尾的最短字符串。

给定值“[FCT-_ABCD-PDQR-”或 “[FCT-XYZ-DETAIL] 行文本 [FCT-_ABCD-PDQR-” 当我想要 return "FCT-_ABCD-PDQR-" 时它 return 为零。 (注意 ABCD、PDQR 等可以是包含 Alpha、- 和 _ 的任意长度的文本)。

当你发现自己 (".*(%[FCT%-.-%-)$") 以你想要的方式工作时, 其中 (".*(%[FCT%-.-%-$)") 没有。 $^ 是锚点,必须出现在模式的末尾或开头,它们不能出现在捕获闭包内。

当锚字符出现在模式中的其他任何地方时,它们将成为您要查找的字符串的一部分,不包括 ^ 在集合中用于排除字符的情况,即:排除大写字符[^A-Z]

以下是使用示例字符串和问题中的模式进行模式匹配的示例。

print(string.match("[FCT-_ABCD-PDQR-", (".*(%[FCT%-.-%-$)")))  -- initial pattern
> nil
print(string.match("[FCT-_ABCD-PDQR-$", (".*(%[FCT%-.-%-$)"))) -- $ added to end of string
> [FCT-_ABCD-PDQR-$
print(string.match("[FCT-_ABCD-PDQR-", (".*(%[FCT%-.-%-)$")))  -- $ moved to end of pattern
> [FCT-_ABCD-PDQR-