将语义动作附加到具有提升精神的解析器
attaching semantic actions to parser with boost spirit
我想了解 "attaching" 语义操作对解析器的确切含义,更准确地说,我想了解语义操作何时以及持续多长时间绑定到解析器。
为此,我对 boost spirit 库的 employee.cpp 示例进行了以下修改:
1°/ 添加了一个print()
函数,其输出仅在调用时跟踪:
void print(const struct employee & e) { std::cout << e.surname << "\n"}
2°/ 在classemployee_parser
的构造函数的末尾,我将print()
函数绑定到start
解析器:
employee_parser() : employee_parser::base_type(start)
{
using qi::int_;
using qi::lit;
using qi::double_;
using qi::lexeme;
using ascii::char_;
quoted_string %= lexeme['"' >> +(char_ - '"') >> '"'];
start %=
lit("employee")
>> '{'
>> int_ >> ','
>> quoted_string >> ','
>> quoted_string >> ','
>> double_
>> '}'
;
start[&print];
}
尽管在我看来我已将 start
解析器附加到语义操作 print
,如文档中所示,但从未调用 print()
函数。它接缝语义动作需要附加在解析器定义的右端,与解析器出现在同一个定义中的次数一样多.有人可以详细说明一下吗?
从本质上讲,解析器是一个函数对象,并且在大多数情况下,重载运算符以允许您创建新的解析器,例如 >>
等,return 不同的函数对象,而不是修改原来的。
如果你曾经使用过java并遇到过java的不可变字符串,你可以认为它有点像那样。
当你有这样的表达时
rule1 = lit("employee");
rule2 = (rule1 >> lit(",") >> rule1) [ &print ];
发生的事情是生成了一个新的解析器对象并将其分配给变量 rule2,并且该解析器对象附加了语义操作。
事实上,表达式中的每个运算符都有一个新的临时解析器对象。在构造解析器时开销只有一次,在解析时并不重要。
当你有
start[&print];
这就像产生一个立即被丢弃的临时值。它对 start
变量中的值没有副作用。这就是为什么永远不会调用 print 的原因。
如果不是这样的话,那么创建语法可能会复杂得多。
当你在spirit qi中定义一个语法时,通常定义基本上是在语法对象的构造函数中完成的。首先给出规则的原型,指定它们的类型、船长等。然后你一个一个地构建规则。您必须确保在初始化之前不在另一个规则的定义中使用该规则。但是在初始化之后,就语法而言,它基本上不会改变。 (不过您可以修改调试信息等内容。)
如果所有规则在初始化后都可能发生变化,那么它们都必须相互更新这些变化,这会更加复杂。
您可能会想象,通过让规则存储对彼此的引用而不是值来避免这种情况。但这意味着指针和动态分配 afaik,并且会更慢。精神的一部分是它是表达式模板——所有这些 "pointer dereferences" 应该在编译时得到解决,据我所知。
我想了解 "attaching" 语义操作对解析器的确切含义,更准确地说,我想了解语义操作何时以及持续多长时间绑定到解析器。
为此,我对 boost spirit 库的 employee.cpp 示例进行了以下修改:
1°/ 添加了一个print()
函数,其输出仅在调用时跟踪:
void print(const struct employee & e) { std::cout << e.surname << "\n"}
2°/ 在classemployee_parser
的构造函数的末尾,我将print()
函数绑定到start
解析器:
employee_parser() : employee_parser::base_type(start)
{
using qi::int_;
using qi::lit;
using qi::double_;
using qi::lexeme;
using ascii::char_;
quoted_string %= lexeme['"' >> +(char_ - '"') >> '"'];
start %=
lit("employee")
>> '{'
>> int_ >> ','
>> quoted_string >> ','
>> quoted_string >> ','
>> double_
>> '}'
;
start[&print];
}
尽管在我看来我已将 start
解析器附加到语义操作 print
,如文档中所示,但从未调用 print()
函数。它接缝语义动作需要附加在解析器定义的右端,与解析器出现在同一个定义中的次数一样多.有人可以详细说明一下吗?
从本质上讲,解析器是一个函数对象,并且在大多数情况下,重载运算符以允许您创建新的解析器,例如 >>
等,return 不同的函数对象,而不是修改原来的。
如果你曾经使用过java并遇到过java的不可变字符串,你可以认为它有点像那样。
当你有这样的表达时
rule1 = lit("employee");
rule2 = (rule1 >> lit(",") >> rule1) [ &print ];
发生的事情是生成了一个新的解析器对象并将其分配给变量 rule2,并且该解析器对象附加了语义操作。
事实上,表达式中的每个运算符都有一个新的临时解析器对象。在构造解析器时开销只有一次,在解析时并不重要。
当你有
start[&print];
这就像产生一个立即被丢弃的临时值。它对 start
变量中的值没有副作用。这就是为什么永远不会调用 print 的原因。
如果不是这样的话,那么创建语法可能会复杂得多。
当你在spirit qi中定义一个语法时,通常定义基本上是在语法对象的构造函数中完成的。首先给出规则的原型,指定它们的类型、船长等。然后你一个一个地构建规则。您必须确保在初始化之前不在另一个规则的定义中使用该规则。但是在初始化之后,就语法而言,它基本上不会改变。 (不过您可以修改调试信息等内容。)
如果所有规则在初始化后都可能发生变化,那么它们都必须相互更新这些变化,这会更加复杂。
您可能会想象,通过让规则存储对彼此的引用而不是值来避免这种情况。但这意味着指针和动态分配 afaik,并且会更慢。精神的一部分是它是表达式模板——所有这些 "pointer dereferences" 应该在编译时得到解决,据我所知。