如何消除 JavaCC 中的选择冲突?
How do I remove a choice conflict in JavaCC?
我的制作规则如下:
OtherNonTerminal := NonTerminal | {}
NonTerminal := <TOKEN>:A() | <TOKEN>:A(), Nonterminal()
在JavaCC中,NonTerminal有一个选择冲突:
void OtherNonTerminal() : {}
{
Nonterminal() | {}
}
void Nonterminal() : {}
{
<TOKEN> <COLON> A()
|
<TOKEN> <COLON> A() <COMMA> Nonterminal()
}
这是消除选择冲突的一种方法吗?程序是否会像我的 NonTerminal 生产规则那样按照指定的方式运行?
void Nonterminal() : {}
{
<TOKEN> <COLON> A() (<COMMA> NonTerminal())?
}
为什么会出现问题
在 JavaCC 中,决定采用哪个分支的默认方法是查看下一个标记。如果令牌与第一选择兼容,则采用第一选择并且该决定是不可逆的。没有回溯。
所以看选择
void Nonterminal() : {}
{
<TOKEN> <COLON> A()
|
<TOKEN> <COLON> A() <COMMA> Nonterminal()
}
并假设输入中的下一个标记是 <TOKEN>
。不管后面有没有<COMMA>
,都取第一个。也就是说
<TOKEN> <COLON> A()
| <TOKEN> <COLON> A() <COMMA> Nonterminal()
等同于
<TOKEN> <COLON> A()
除了第一个会产生一条警告消息,因为 JavaCC 认为您编写的内容没有意义。
一个好的解决方案
您问题的答案是 "yes"。一种解决方案是做你所做的并分解出公共前缀
void Nonterminal() : {}
{
<TOKEN> <COLON> A() (<COMMA> NonTerminal())?
}
可能更好的解决方案,具体取决于
如果出于某种原因,您真的不知道要考虑什么,您也可以执行以下操作
void Nonterminal() : {}
{
LOOKAHEAD( <TOKEN> <COLON> A() <COMMA>)
<TOKEN> <COLON> A() <COMMA> Nonterminal()
|
<TOKEN> <COLON> A()
}
在这里,解析器将在输入流中向前看。如果它看到逗号,则采用第一个选择。否则,第二个。
如果两种情况下的语义动作不同,这可能会有用。例如
LOOKAHEAD( <TOKEN> <COLON> A() <COMMA>)
<TOKEN> {doSomething();} <COLON> A() <COMMA> Nonterminal()
|
<TOKEN> {doSomethingDifferent();} <COLON> A()
非递归解决方案。
第三个选择是
void Nonterminal() : {}
{
Foo() (<COMMA> Foo() )*
}
void Foo() : {}
{
<TOKEN> <COLON> A()
}
我的制作规则如下:
OtherNonTerminal := NonTerminal | {}
NonTerminal := <TOKEN>:A() | <TOKEN>:A(), Nonterminal()
在JavaCC中,NonTerminal有一个选择冲突:
void OtherNonTerminal() : {}
{
Nonterminal() | {}
}
void Nonterminal() : {}
{
<TOKEN> <COLON> A()
|
<TOKEN> <COLON> A() <COMMA> Nonterminal()
}
这是消除选择冲突的一种方法吗?程序是否会像我的 NonTerminal 生产规则那样按照指定的方式运行?
void Nonterminal() : {}
{
<TOKEN> <COLON> A() (<COMMA> NonTerminal())?
}
为什么会出现问题
在 JavaCC 中,决定采用哪个分支的默认方法是查看下一个标记。如果令牌与第一选择兼容,则采用第一选择并且该决定是不可逆的。没有回溯。
所以看选择
void Nonterminal() : {}
{
<TOKEN> <COLON> A()
|
<TOKEN> <COLON> A() <COMMA> Nonterminal()
}
并假设输入中的下一个标记是 <TOKEN>
。不管后面有没有<COMMA>
,都取第一个。也就是说
<TOKEN> <COLON> A()
| <TOKEN> <COLON> A() <COMMA> Nonterminal()
等同于
<TOKEN> <COLON> A()
除了第一个会产生一条警告消息,因为 JavaCC 认为您编写的内容没有意义。
一个好的解决方案
您问题的答案是 "yes"。一种解决方案是做你所做的并分解出公共前缀
void Nonterminal() : {}
{
<TOKEN> <COLON> A() (<COMMA> NonTerminal())?
}
可能更好的解决方案,具体取决于
如果出于某种原因,您真的不知道要考虑什么,您也可以执行以下操作
void Nonterminal() : {}
{
LOOKAHEAD( <TOKEN> <COLON> A() <COMMA>)
<TOKEN> <COLON> A() <COMMA> Nonterminal()
|
<TOKEN> <COLON> A()
}
在这里,解析器将在输入流中向前看。如果它看到逗号,则采用第一个选择。否则,第二个。
如果两种情况下的语义动作不同,这可能会有用。例如
LOOKAHEAD( <TOKEN> <COLON> A() <COMMA>)
<TOKEN> {doSomething();} <COLON> A() <COMMA> Nonterminal()
|
<TOKEN> {doSomethingDifferent();} <COLON> A()
非递归解决方案。
第三个选择是
void Nonterminal() : {}
{
Foo() (<COMMA> Foo() )*
}
void Foo() : {}
{
<TOKEN> <COLON> A()
}