PEGJS:为谓词优先语法生成 AST
PEGJS: Generating an AST for a predicate first syntax
我又开始探索 pegjs,显然还没有掌握核心概念。我正在尝试解析以谓词开头的 "query language",然后是操作数列表(可能包含另一个谓词)。所以一个简单的例子是:
OR(
"string1"
"string2"
)
我想将上面的转化为:
{
predicate: "OR",
operands: [
{
type: "STRING",
value: "string1"
},
{
type: "STRING",
value: "string2"
}
]
}
本次查询:
OR(
"string1"
"string2"
AND (
"string4"
"string5"
)
"string3"
)
会变成这个 AST:
{
predicate: "OR",
operands: [
{
type: "STRING",
value: "string1"
},
{
type: "STRING",
value: "string2"
},
{
predicate: "AND"
operands: [
{
type: "STRING",
value: "string4"
},
{
type: "STRING",
value: "string5"
}
]
},
{
type: "STRING",
value: "string3"
}
]
}
我的语法很接近,但有几个问题。这是当前的 PEGJS 语法。可以直接粘贴到在线的pegjs解析器(http://pegjs.majda.cz/online).
start =
or_predicate
or_predicate
= ws* "OR" ws* "(" ws* operands:or_predicate ws* ")" ws*
{ if(Array.isArray(operands)) {
return {predicate: "OR", operands: operands}
} else {
return {predicate: "OR", operands: [operands] }
}
}
/ and_predicate
and_predicate
= ws* "AND" ws* "(" operands:and_predicate ")"
{ if(Array.isArray(operands)) {
return {predicate: "AND", operands: operands}
} else {
return {predicate: "AND", operands: [operands] }
}
}
/ operands
operands
= ws* values:operand+ { return values; }
operand =
string
/ ws or_predicate:or_predicate { return or_predicate; }
string =
ws* "\"" value:valid_variable_characters "\""
{ return { type: "STRING", value: value.join("")}}
// List of valid characters for string variables
valid_variable_characters =
[a-zA-Z0-9 _]+
ws =
[ \t\n]
上面的语法处理了我给出的两个例子,但我注意到两个问题,这导致我提出以下三个问题。
1.The 语法在这个看似简单的输入上失败(关键是嵌套 OR 紧跟在父 OR 之后并且 "string" 在末尾):
OR(
OR (
"string1"
)
"string2"
)
我不确定是什么原因造成的,也不知道如何解决。
2.The 语法目前有这条愚蠢的行 operand
规则:
operand =
string
/ ws or_predicate:or_predicate { return or_predicate; }
注意第三行 or_predicate
之前的前导空格 (ws)。没有那个空格,我得到错误 'Maximum call stack size exceeded'。我认为这与左递归有关,但对此并不积极。理想情况下,我希望能够没有必需的 'ws' 这样一个没有空格的查询就可以了:
OR("string1"OR("string2")"string3")
现在你必须像这样人为地添加一些额外的空格:
OR("string1" OR("string2") "string3")
3.Am 我完全错误地处理了这个语法?这只是我尝试过的第二个,第一个是基于 pegjs 算术示例,所以我意识到我可能会完全错误地解决这个问题,这可能就是我 运行 陷入这些问题的原因。
感谢您的协助和时间!
此致,
埃德
我对 PEG 也很陌生,但在主要查看 examples 而不是阅读文档后你就掌握了它。
尝试将您的版本与这个版本进行比较:
start
= ws* predicate:predicate ws* { return predicate; }
predicate
= "OR" ws* "(" operands:operand+ ")" { return { predicate: 'OR', operands: operands }; }
/ "AND" ws* "(" operands:operand+ ")" { return { predicate: 'AND', operands: operands }; }
operand
= ws* predicate:predicate ws* { return predicate; }
/ ws* string:string ws* { return string; }
string
= "\"" chars:valid_variable_characters+ "\"" { return { type: "STRING", value: chars.join("")}}
valid_variable_characters = [a-zA-Z0-9 _]
ws = [ \t\n]
空格是可选的。
OR("str1"OR("str2""str3"AND("str4""str5"))"str6")
给出:
{
"predicate": "OR",
"operands": [
{
"type": "STRING",
"value": "str1"
},
{
"predicate": "OR",
"operands": [
{
"type": "STRING",
"value": "str2"
},
{
"type": "STRING",
"value": "str3"
},
{
"predicate": "AND",
"operands": [
{
"type": "STRING",
"value": "str4"
},
{
"type": "STRING",
"value": "str5"
}
]
}
]
},
{
"type": "STRING",
"value": "str6"
}
]
}
我又开始探索 pegjs,显然还没有掌握核心概念。我正在尝试解析以谓词开头的 "query language",然后是操作数列表(可能包含另一个谓词)。所以一个简单的例子是:
OR(
"string1"
"string2"
)
我想将上面的转化为:
{
predicate: "OR",
operands: [
{
type: "STRING",
value: "string1"
},
{
type: "STRING",
value: "string2"
}
]
}
本次查询:
OR(
"string1"
"string2"
AND (
"string4"
"string5"
)
"string3"
)
会变成这个 AST:
{
predicate: "OR",
operands: [
{
type: "STRING",
value: "string1"
},
{
type: "STRING",
value: "string2"
},
{
predicate: "AND"
operands: [
{
type: "STRING",
value: "string4"
},
{
type: "STRING",
value: "string5"
}
]
},
{
type: "STRING",
value: "string3"
}
]
}
我的语法很接近,但有几个问题。这是当前的 PEGJS 语法。可以直接粘贴到在线的pegjs解析器(http://pegjs.majda.cz/online).
start =
or_predicate
or_predicate
= ws* "OR" ws* "(" ws* operands:or_predicate ws* ")" ws*
{ if(Array.isArray(operands)) {
return {predicate: "OR", operands: operands}
} else {
return {predicate: "OR", operands: [operands] }
}
}
/ and_predicate
and_predicate
= ws* "AND" ws* "(" operands:and_predicate ")"
{ if(Array.isArray(operands)) {
return {predicate: "AND", operands: operands}
} else {
return {predicate: "AND", operands: [operands] }
}
}
/ operands
operands
= ws* values:operand+ { return values; }
operand =
string
/ ws or_predicate:or_predicate { return or_predicate; }
string =
ws* "\"" value:valid_variable_characters "\""
{ return { type: "STRING", value: value.join("")}}
// List of valid characters for string variables
valid_variable_characters =
[a-zA-Z0-9 _]+
ws =
[ \t\n]
上面的语法处理了我给出的两个例子,但我注意到两个问题,这导致我提出以下三个问题。
1.The 语法在这个看似简单的输入上失败(关键是嵌套 OR 紧跟在父 OR 之后并且 "string" 在末尾):
OR(
OR (
"string1"
)
"string2"
)
我不确定是什么原因造成的,也不知道如何解决。
2.The 语法目前有这条愚蠢的行 operand
规则:
operand =
string
/ ws or_predicate:or_predicate { return or_predicate; }
注意第三行 or_predicate
之前的前导空格 (ws)。没有那个空格,我得到错误 'Maximum call stack size exceeded'。我认为这与左递归有关,但对此并不积极。理想情况下,我希望能够没有必需的 'ws' 这样一个没有空格的查询就可以了:
OR("string1"OR("string2")"string3")
现在你必须像这样人为地添加一些额外的空格:
OR("string1" OR("string2") "string3")
3.Am 我完全错误地处理了这个语法?这只是我尝试过的第二个,第一个是基于 pegjs 算术示例,所以我意识到我可能会完全错误地解决这个问题,这可能就是我 运行 陷入这些问题的原因。
感谢您的协助和时间!
此致,
埃德
我对 PEG 也很陌生,但在主要查看 examples 而不是阅读文档后你就掌握了它。
尝试将您的版本与这个版本进行比较:
start
= ws* predicate:predicate ws* { return predicate; }
predicate
= "OR" ws* "(" operands:operand+ ")" { return { predicate: 'OR', operands: operands }; }
/ "AND" ws* "(" operands:operand+ ")" { return { predicate: 'AND', operands: operands }; }
operand
= ws* predicate:predicate ws* { return predicate; }
/ ws* string:string ws* { return string; }
string
= "\"" chars:valid_variable_characters+ "\"" { return { type: "STRING", value: chars.join("")}}
valid_variable_characters = [a-zA-Z0-9 _]
ws = [ \t\n]
空格是可选的。
OR("str1"OR("str2""str3"AND("str4""str5"))"str6")
给出:
{
"predicate": "OR",
"operands": [
{
"type": "STRING",
"value": "str1"
},
{
"predicate": "OR",
"operands": [
{
"type": "STRING",
"value": "str2"
},
{
"type": "STRING",
"value": "str3"
},
{
"predicate": "AND",
"operands": [
{
"type": "STRING",
"value": "str4"
},
{
"type": "STRING",
"value": "str5"
}
]
}
]
},
{
"type": "STRING",
"value": "str6"
}
]
}