在 tree-sitter 语法中,运算符 precedence/associativity 冲突是否可能导致运行时解析失败?
In a tree-sitter grammar, is it possible for operator precedence/associativity conflict to cause a runtime parse failure?
考虑像子集 (⊂) 这样的中缀运算符。子集运算符不是关联的,因为它的结果(布尔值)本身不是一个集合,因此不能被送入子集运算符的一侧或另一侧。考虑:
S ⊂ T ⊂ M
理想情况下,这将是解析失败,但 tree-sitter 似乎不允许基于运算符冲突的解析失败;相反,它要求您通过指定关联性或优先级在解析器生成时明确解决冲突。有什么方法可以向树保姆表明这应该是解析冲突?不仅适用于同类的非关联运算符,而且适用于具有同等优先级且非关联的不同运算符之间,例如:
S ⊂ T ⊆ M
或者指定明确的解析然后在语义级别处理它的唯一解决方案?
你是对的,这应该在语义层面上处理。所以 ⊂ 应该在语法中被标记为左结合的,以便于分析,即使它不是。对于字符串 S ⊂ T ⊂ M
,它将被解析为:
(op ⊂
(op ⊂
(id S)
(id T)
)
(id M)
)
然后,在语义级别,您可以添加一个规则,检查 ⊂
是否有任何子节点也是 ⊂
(或任何其他具有同等优先级的运算符),您可以将其显示为associativity/precedence 冲突错误。
考虑像子集 (⊂) 这样的中缀运算符。子集运算符不是关联的,因为它的结果(布尔值)本身不是一个集合,因此不能被送入子集运算符的一侧或另一侧。考虑:
S ⊂ T ⊂ M
理想情况下,这将是解析失败,但 tree-sitter 似乎不允许基于运算符冲突的解析失败;相反,它要求您通过指定关联性或优先级在解析器生成时明确解决冲突。有什么方法可以向树保姆表明这应该是解析冲突?不仅适用于同类的非关联运算符,而且适用于具有同等优先级且非关联的不同运算符之间,例如:
S ⊂ T ⊆ M
或者指定明确的解析然后在语义级别处理它的唯一解决方案?
你是对的,这应该在语义层面上处理。所以 ⊂ 应该在语法中被标记为左结合的,以便于分析,即使它不是。对于字符串 S ⊂ T ⊂ M
,它将被解析为:
(op ⊂
(op ⊂
(id S)
(id T)
)
(id M)
)
然后,在语义级别,您可以添加一个规则,检查 ⊂
是否有任何子节点也是 ⊂
(或任何其他具有同等优先级的运算符),您可以将其显示为associativity/precedence 冲突错误。