递归布尔值 and/or 到数组 jison 解析器
recursive boolean and/or to array jison parser
我是 jison 的新手,并且设法拼凑出一个有用的查询解析器。我现在正在尝试创建一个解析器,可以将 "a == 1 and b == 1 and c == 1" 之类的字符串解析为
之类的对象
{and: [
{a: {eq: 1}},
{b: {eq: 1}},
{c: {eq: 2}}
]}
而像 "a == 1 or b == 1 and c == 1" 这样的字符串应该解析成像
这样的对象
{or: [
{a: {eq: 1}},
{and: [
{b: {eq: 1}},
{c: {eq: 1}}
]}
]}
到目前为止我的语法是这样的:
%lex
%%
\s+ /*skip whitespace*/
\"(\.|[^"])*\" yytext = yytext.substr(1, yyleng-2); return 'STRING';
"==" return '==';
and[^\w] return 'and';
or[^\w] return 'or';
[0-9]+(?:\.[0-9]+)?\b return 'NUMBER';
[a-zA-Z][\.a-zA-Z0-9_]* return 'SYMBOL';
<<EOF>> return 'EOF';
/lex
%left 'or'
%left 'and'
%left '=='
%start expressions
%%
expressions
: e EOF
{$$ = ;}
;
e
: property '==' value
{ $$ = {}; $[] = {eq: }; }
| boolAnd
{ $$ = {and: }}
| boolOr
{ $$ = {or: }}
;
boolAnd
: boolAnd 'and' e
{$$ = ; .push();}
| e 'and' e
{$$ = [, ];}
;
boolOr
: boolOr 'or' e
{$$ = ; .push();}
| e 'or' e
{$$ = [, ];}
;
property
: SYMBOL
{$$ = ;}
;
value
: NUMBER
{$$ = Number(yytext);}
| STRING
{$$ = yytext; }
;
它给我以下冲突错误:
Conflict in grammar: multiple actions possible when lookahead token is and in state 4
- reduce by rule: e -> boolAnd
- shift token (then go to state 11)
Conflict in grammar: multiple actions possible when lookahead token is or in state 5
- reduce by rule: e -> boolOr
- shift token (then go to state 12)
States with conflicts:
State 4
e -> boolAnd . #lookaheads= EOF and or
boolAnd -> boolAnd .and e #lookaheads= EOF and or
State 5
e -> boolOr . #lookaheads= EOF and or
boolOr -> boolOr .or e #lookaheads= EOF or and
有人能对我做错的地方提出建议吗?非常感谢
自
e : boolAnd
无法在两者之间做出决定:
boolAnd: e 'and' e
| boolAnd 'and' e
这就是 jison 所抱怨的。 (值得注意的是 boolAnd
到 e
的减少似乎不是你想要的。这实际上是一个类型错误,或者如果 JS 有类型。)
就个人而言,我只使用二叉树;根据我的经验,事实证明他们更容易合作。您可以使用单个非终结符和优先级声明轻松做到这一点。
%left 'or'
%left 'and'
%%
e
: property '==' value
{ $$ = {eq: [, ]}; /* This seems better to me. YMMV. }
| e 'and' e
{ $$ = {and: [, ]}}
| e 'or' e
{ $$ = {or: [, ]}}
| '(' e ')'
{ $$ = /* You didn't have this one, but it seems useful */ }
;
可以编写一个语法来处理可变运算符(即将 x OP y OP z
减少为 {OP: [x, y, z]}
),但实际上需要大量工作才能使其正确,而且它不会很容易产生基于优先声明的解决方案。除非你真的想区分 x OP y OP z
和 x OP (y OP z)
,这在布尔运算符的情况下是不必要的,否则在解析树的第二次遍历中折叠多个相似的二元运算符通常更容易和更通用,或直接在创建二进制节点时,通过检查子表达式的运算符类型。
我是 jison 的新手,并且设法拼凑出一个有用的查询解析器。我现在正在尝试创建一个解析器,可以将 "a == 1 and b == 1 and c == 1" 之类的字符串解析为
之类的对象{and: [
{a: {eq: 1}},
{b: {eq: 1}},
{c: {eq: 2}}
]}
而像 "a == 1 or b == 1 and c == 1" 这样的字符串应该解析成像
这样的对象{or: [
{a: {eq: 1}},
{and: [
{b: {eq: 1}},
{c: {eq: 1}}
]}
]}
到目前为止我的语法是这样的:
%lex
%%
\s+ /*skip whitespace*/
\"(\.|[^"])*\" yytext = yytext.substr(1, yyleng-2); return 'STRING';
"==" return '==';
and[^\w] return 'and';
or[^\w] return 'or';
[0-9]+(?:\.[0-9]+)?\b return 'NUMBER';
[a-zA-Z][\.a-zA-Z0-9_]* return 'SYMBOL';
<<EOF>> return 'EOF';
/lex
%left 'or'
%left 'and'
%left '=='
%start expressions
%%
expressions
: e EOF
{$$ = ;}
;
e
: property '==' value
{ $$ = {}; $[] = {eq: }; }
| boolAnd
{ $$ = {and: }}
| boolOr
{ $$ = {or: }}
;
boolAnd
: boolAnd 'and' e
{$$ = ; .push();}
| e 'and' e
{$$ = [, ];}
;
boolOr
: boolOr 'or' e
{$$ = ; .push();}
| e 'or' e
{$$ = [, ];}
;
property
: SYMBOL
{$$ = ;}
;
value
: NUMBER
{$$ = Number(yytext);}
| STRING
{$$ = yytext; }
;
它给我以下冲突错误:
Conflict in grammar: multiple actions possible when lookahead token is and in state 4
- reduce by rule: e -> boolAnd
- shift token (then go to state 11)
Conflict in grammar: multiple actions possible when lookahead token is or in state 5
- reduce by rule: e -> boolOr
- shift token (then go to state 12)
States with conflicts:
State 4
e -> boolAnd . #lookaheads= EOF and or
boolAnd -> boolAnd .and e #lookaheads= EOF and or
State 5
e -> boolOr . #lookaheads= EOF and or
boolOr -> boolOr .or e #lookaheads= EOF or and
有人能对我做错的地方提出建议吗?非常感谢
自
e : boolAnd
无法在两者之间做出决定:
boolAnd: e 'and' e
| boolAnd 'and' e
这就是 jison 所抱怨的。 (值得注意的是 boolAnd
到 e
的减少似乎不是你想要的。这实际上是一个类型错误,或者如果 JS 有类型。)
就个人而言,我只使用二叉树;根据我的经验,事实证明他们更容易合作。您可以使用单个非终结符和优先级声明轻松做到这一点。
%left 'or'
%left 'and'
%%
e
: property '==' value
{ $$ = {eq: [, ]}; /* This seems better to me. YMMV. }
| e 'and' e
{ $$ = {and: [, ]}}
| e 'or' e
{ $$ = {or: [, ]}}
| '(' e ')'
{ $$ = /* You didn't have this one, but it seems useful */ }
;
可以编写一个语法来处理可变运算符(即将 x OP y OP z
减少为 {OP: [x, y, z]}
),但实际上需要大量工作才能使其正确,而且它不会很容易产生基于优先声明的解决方案。除非你真的想区分 x OP y OP z
和 x OP (y OP z)
,这在布尔运算符的情况下是不必要的,否则在解析树的第二次遍历中折叠多个相似的二元运算符通常更容易和更通用,或直接在创建二进制节点时,通过检查子表达式的运算符类型。