使用 Lark 语法优先

Question

我的语法有一个优先级问题，我没有更多的想法来解决它。

我正在使用 Lark

事情是这样的（我已经尽可能地简化了问题）：

from lark import Lark

parser = Lark(r"""
    start: set | set_mul

    set_mul: [nb] set
    set: [nb] "foo"
    nb: INT "x"

   %import common.INT
   %import common.WS
   %ignore WS

   """, start='start')

input = "3xfoo"
p = parser.parse(input)
print(p.pretty())

输出为：

  start
  set_mul
    set
      nb    3

但我想要的是：

start
  set_mul
     nb 3
     set

我试图在我的规则中设置优先级，但它不起作用。

您知道我需要更改什么才能使其正常工作吗？

谢谢

Answer 1

这不是一个完整的答案，但我希望能让你有所了解。你的问题是你的语法有歧义，你使用的例子有歧义 head-on。 Lark 为你选择消歧，你得到你的结果。见。

让Lark不消歧，像这样添加ambiguity='explicit':

import lark

parser = lark.Lark(r"""
    start: set | set_mul

    set_mul: [nb] set
    set: [nb] "foo"
    nb: INT "x"

   %import common.INT
   %import common.WS
   %ignore WS

   """, start='start',ambiguity='explicit')

input = "3xfoo"
p = parser.parse(input)
print(p.pretty())

你会得到这个输出，其中包括你想要的：

_ambig
  start
    set
      nb        3
  start
    set_mul
      set
        nb      3
  start
    set_mul
      nb        3
      set

你如何鼓励 Lark 消除你喜欢的歧义？好问题。

Answer 2

一个简单的解决方案可能是re-write您的语法以消除歧义。

parser = Lark(r"""
    start: set | set_mul

    set_mul: nb | nb set | nb nb_set
    set: "foo"
    nb_set: nb set
    nb: INT "x"

   %import common.INT
   %import common.WS
   %ignore WS

   """, start='start')

这样，以下每个输入都只有一种可能的解释：

input = "3xfoo"
p = parser.parse(input)
print(p.pretty())

input = "3x4xfoo"
p = parser.parse(input)
print(p.pretty())

结果：

start
  set_mul
    nb  3
    set

start
  set_mul
    nb  3
    nb_set
      nb    4
      set

使用 Lark 语法优先

Priority in grammar using Lark

python

grammar

lark-parser