Pyparsing 解析操作并列出类型错误

Pyparsing parseaction and lists typerror

对于一种小型语言,我想解析 "X [Y,Z,V]" 形式的表达式,其中 XYZV 是自然数。

下面是我的尝试。

from pyparsing import *

class Y():
    def __init__(self, ls):
        self.ls = ls

def MakeCombinedList(tokens):
    print(len(tokens)) # prints 4
    print(tokens)      # [5, 1, 2, 3]
    clist = tokens[1]
    clist.append(tokens[0]) # 'int' attribute object has no attribute 'append'
    return clist

def MakeIntList(tokens):
    nlist = tokens[0].split(",")
    ilist = []
    for n in nlist:
        ilist.append(int(n))
    return ilist

def MakeY(tokens):
    Yobj = Y(tokens[0])
    return Yobj

LEFT_BRACK = Suppress(Literal("["))
RIGHT_BRACK = Suppress(Literal("]"))

NATURAL = Word(nums).addParseAction(lambda n: int(n[0]))
NATURAL_LIST = delimitedList(NATURAL, combine = True)
NATURAL_VEC = LEFT_BRACK + NATURAL_LIST +  RIGHT_BRACK
NATURAL_VEC.addParseAction(MakeIntList)

X = NATURAL + NATURAL_VEC
X.addParseAction(MakeCombinedList)

Y = X
Y.addParseAction(MakeY)


print(Y.parseString("5 [1,2,3]").ls)

MakeIntList 应该将 "1,2,3" 之类的字符串转换为列表 [1,2,3].

MakeCombinedList 然后应该将一个整数附加到此列表,但 MakeCombinedList 收到的 tokens 不是单个整数,而是从 [=16= 创建的整数列表],而是所有整数的列表,如我的评论所示。

如何使 MakeCombinedList 中的 tokens[1] 成为调用 MakeIntList 的结果?

这两行相互矛盾,因为您使用第一行将单独的数字字符串解析为整数,然后第二行将它们组合回逗号分隔的字符串。

NATURAL = Word(nums).addParseAction(lambda n: int(n[0]))
NATURAL_LIST = delimitedList(NATURAL, combine=True)

您要找的功能是Group:

NATURAL = Word(nums).addParseAction(lambda n: int(n[0]))
NATURAL_LIST = Group(delimitedList(NATURAL))
NATURAL_VEC = LEFT_BRACK + NATURAL_LIST +  RIGHT_BRACK
# no MakeIntList parse action required

现在不用创建新字符串然后在解析操作中重新解析它,而是使用 Group 告诉 pyparsing 生成结果标记的子结构。

这里还有一点混乱:

Y = X
Y.addParseAction(MakeY)

这会将 Y 从顶部定义的 class 重新定义为 pyparsing 表达式,并且在尝试访问其 ls 属性时会得到一些奇怪的回溯。

Y_expr = X
Y_expr.addParseAction(MakeY)

我写了runTests方法是为了更容易做简单的表达式测试和打印,而不必处理Py2/Py3打印差异:

Y_expr.runTests("""\
    5 [1,2,3]
    """)

显示:

5 [1,2,3]
[<__main__.Y object at 0x00000241C57B7630>]

由于您的 Y class 仅使用默认的 __repr__ 行为,如果您定义自己的行为,则可以更好地查看内容:

class Y():
    def __init__(self, ls):
        self.ls = ls
    def __repr__(self):
        return "{}: {}".format(type(self).__name__, vars(self))

现在运行测试显示:

5 [1,2,3]
[Y: {'ls': 5}]

如果 Y class 的目的只是为您的解析字段提供属性名称,请考虑改用结果名称:

X = NATURAL('ls') + NATURAL_VEC

Y_expr = X
#~ Y_expr.addParseAction(MakeY)

# what you had written originally    
print(Y_expr.parseString("5 [1,2,3]").ls)

将只打印:

5