Spirit X3,如何让属性类型匹配规则类型?
Spirit X3, How to get attribute type to match rule type?
对于Spirit X3解析器的开发,我想使用语义动作(脚注1)。控制如何将属性存储到 STL 容器中对我来说很重要。
本题是关于如何控制解析器属性:_attr(ctx)与规则类型:_val(ctx)匹配,以便正确赋值。也许这个问题归结为如何应用未记录的
transform_attribute 特征。但是请和我一起阅读,看看示例代码中是否真的为我解决了这个问题。
印刷类型objects/variables
当我尝试不同的语法表达式时,我发现非常有用的是能够在语义操作中打印 _attr( ctx ) 和 _val( ctx ) 的类型。
所以根据Howard Hinnant的回答,我写了一个实用程序头文件,根据自己的喜好提供这样的便利。
code below is to be put in a file named utility.h
#include <string>
#include <type_traits>
#include <typeinfo>
#include <cxxabi.h>
namespace utility
{
template<typename T>
std::string type2string()
{
std::string r;
typedef typename std::remove_reference<T>::type TR;
std::string space = "";
if ( std::is_const<TR>::value )
{ r = "const"; space = " "; }
if ( std::is_volatile<TR>::value )
{ r += space + " volatile"; space = " "; }
int status;
char* demangled =
abi::__cxa_demangle( typeid(TR).name(), nullptr, nullptr, &status );
switch ( status )
{
case 0: { goto proceed; }
case -1: { r = "type2string failed: malloc failure"; goto fail; }
case -2: { r = "type2string failed: " + std::string(typeid(TR).name()) +
" nonvalid C++ ABI name"; goto fail; }
case -3: { r = "type2string failed: invalid argument(s)"; goto fail; }
default: { r = "type2string failed: unknown status " +
status; goto fail; }
}
proceed:
r += space + demangled;
free( demangled );
/* references are without a space */
if ( std::is_lvalue_reference<T>::value ) { r += '&'; }
if ( std::is_rvalue_reference<T>::value ) { r += "&&"; }
fail:
return r;
}
}
现在实际工作的示例代码:
#include <cstddef>
#include <cstdio>
#include <cstdint>
#define BOOST_SPIRIT_X3_DEBUG
#include <boost/config/warning_disable.hpp>
#include <boost/spirit/home/x3.hpp>
#include <string>
#include <vector>
#include <utility> // this is for std::move
#include "utility.h" // to print types
namespace client
{
namespace x3 = boost::spirit::x3;
namespace ascii = boost::spirit::x3::ascii;
namespace semantic_actions
{
using x3::_val; // assign to _val( ctx )
using x3::_attr; // from _attr( ctx )
struct move_assign
{
template <typename Context>
void operator()(const Context& ctx) const
{
printf( "move_assign\n" );
_val( ctx ) = std::move( _attr( ctx ) );
}
};
struct print_type
{
template <typename Context>
void operator()(const Context& ctx) const
{
printf( "print_type\n" );
std::string str;
str = utility::type2string< decltype( _attr( ctx ) ) >();
printf( "_attr type: %s\n", str.c_str() );
// reuse str
str = utility::type2string< decltype( _val( ctx ) ) >();
printf( "_val type: %s\n", str.c_str() );
}
};
}
namespace parser
{
using x3::char_;
using x3::lit;
using namespace semantic_actions;
x3::rule<struct main_rule_class, std::string> main_rule_ = "main_rule";
const auto main_rule__def = (*( !lit(';') >> char_) >> lit(';'))[print_type()][move_assign()];
BOOST_SPIRIT_DEFINE( main_rule_ )
const auto entry_point = x3::skip(x3::space)[ main_rule_ ];
}
}
int main()
{
printf( "Give me a string to test rule.\n" );
printf( "Type [q or Q] to quit.\n" );
std::string input_str;
std::string output_str;
while (getline(std::cin, input_str))
{
if ( input_str.empty() || input_str[0] == 'q' || input_str[0] == 'Q')
{ break; }
auto first = input_str.begin(), last = input_str.end();
if ( parse( first, last, client::parser::entry_point, output_str) )
{
printf( "Parsing succeeded\n" );
printf( "input: \"%s\"\n", input_str.c_str() );
printf( "output: \"%s\"\n", output_str.c_str() );
}
else
{
printf( "Parsing failed\n" );
}
}
return 0;
}
输入总是:
abcd;
输出:
Give me a string to test rule.
Type [q or Q] to quit.
<main_rule>
<try>abcd;</try>
print_type
_attr type: std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> >&
_val type: std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> >&
move_assign
<success></success>
<attributes>[a, b, c, d]</attributes>
</main_rule>
Parsing succeeded
input: "abcd;"
output: "abcd"
好的,到目前为止一切正常,但假设我想在解析结果中包含分号。我将语法行更改为:
const auto main_rule__def = (*( !lit(';') >> char_) >> char_(";"))[print_type()];
注意:我删除了语义操作 [move_assign()],因为它由于不兼容的 _attr 和 _val 类型而无法编译。
现在输出是:
Give me a string to test rule.
Type [q or Q] to quit.
<main_rule>
<try>abcd;</try>
print_type
_attr type: boost::fusion::deque<std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> >, char>&
_val type: std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> >&
<success></success>
<attributes>[]</attributes>
</main_rule>
Parsing succeeded
input: "abcd;"
output: ""
现在 boost::fusion::deque<> 的 _attr 类型不是我想要的,我只是 std::string。我不明白为什么如果我在语义操作括号内有语法赋值的完整右侧,_attr 仍然不是 _val 类型。 X3 功能 transform_attribute 在这里有帮助吗?我应该如何应用它?或者解决这个问题的另一种好方法是什么,而无需使用 boost fusion class 接口或其他实现细节。
当前解决方法
我目前的解决方法是定义另一个规则,该规则仅从具有语义操作的第一条规则分配。只有那里的 _attr 是 std::string 类型。
namespace parser
{
using x3::char_;
using x3::lit;
using namespace semantic_actions;
x3::rule<struct main_rule_class, std::string> main_rule_ = "main_rule";
x3::rule<struct main_rule2_class, std::string> main_rule2_ = "main_rule2";
const auto main_rule__def = *( !lit(';') >> char_) >> char_(";");
const auto main_rule2__def = main_rule_[print_type()][move_assign()];
BOOST_SPIRIT_DEFINE( main_rule_, main_rule2_ )
const auto entry_point = x3::skip(x3::space)[ main_rule2_ ];
}
输出:
Give me a string to test rule.
Type [q or Q] to quit.
<main_rule2>
<try>abcd;</try>
<main_rule>
<try>abcd;</try>
<success></success>
<attributes>[a, b, c, d, ;]</attributes>
</main_rule>
print_type
_attr type: std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> >&
_val type: std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> >&
move_assign
<success></success>
<attributes>[a, b, c, d, ;]</attributes>
</main_rule2>
Parsing succeeded
input: "abcd;"
output: "abcd;"
我希望有一种方法,无需制定另一条规则即可使 _attr 的类型与 _val 匹配。
(1)
我不欣赏作者在这个库中隐藏的聪明才智。因为只是一个看似无害的变化就可以破坏应用程序。而更明确和详尽的方法将更清楚地传达正在发生的事情。我只需要把它说出来。
使用 char_(';'),属性有 2 个部分。这两部分都需要添加到 _val。类似于:
namespace semantic_actions
{
using x3::_val; // assign to _val( ctx )
using x3::_attr; // from _attr( ctx )
using boost::fusion::at_c;
struct move_assign
{
template <typename Context>
void operator()(const Context& ctx) const
{
printf( "move_assign\n" );
auto attr=_attr( ctx );
_val( ctx ) = at_c<0>( attr );
_val( ctx ) += at_c<1>( attr );
}
};
.
.
.
}
直接回答
transform_attribute
尚未 记录 X3 (https://www.boost.org/doc/libs/1_70_0/libs/spirit/doc/x3/html/index.html) but you can find its Qi counterpart here: https://www.boost.org/doc/libs/1_70_0/libs/spirit/doc/html/spirit/advanced/customize/transform.html.
Would the X3 feature transform_attribute help here? And how should I apply that?
无论如何,这是一个您可以使用规则轻松访问的实现细节。我喜欢使用匿名规则来帮助解决这个问题:
template <typename T>
struct as_type {
template <typename E>
constexpr auto operator[](E e) const { return x3::rule<struct _, T> {} = e; }
};
template <typename T>
static inline constexpr as_type<T> as;
现在你可以写了
const auto main_rule__def = as<std::string> [ (*(char_ - ';') >> char_(';')) ];
#include <iostream>
//#define BOOST_SPIRIT_X3_DEBUG
#include <boost/spirit/home/x3.hpp>
#include <iomanip> // std::quoted
namespace client {
namespace x3 = boost::spirit::x3;
namespace ascii = boost::spirit::x3::ascii;
namespace parser {
using x3::char_;
using x3::lit;
x3::rule<struct main_rule_class, std::string> main_rule_ = "main_rule";
template <typename T>
struct as_type {
template <typename E>
constexpr auto operator[](E e) const { return x3::rule<struct _, T> {} = e; }
};
template <typename T>
static inline constexpr as_type<T> as;
const auto main_rule__def = as<std::string> [ (*(char_ - ';') >> char_(';')) ];
BOOST_SPIRIT_DEFINE(main_rule_)
const auto entry_point = x3::skip(x3::space)[main_rule_];
} // namespace parser
} // namespace client
int main() {
std::string output_str;
for(std::string const input_str : { "abcd;" }) {
auto first = input_str.begin(), last = input_str.end();
if (parse(first, last, client::parser::entry_point, output_str)) {
std::cout << "Parsing succeeded\n";
std::cout << "input: " << std::quoted(input_str) << "\n";
std::cout << "output: " << std::quoted(output_str) << "\n";
} else {
std::cout << "Parsing failed\n";
}
}
}
版画
Parsing succeeded
input: "abcd;"
output: "abcd;"
理论上可能会有性能开销,但我强烈怀疑所有编译器都会在这里内联所有内容,因为没有任何外部链接或 vtables,而且所有内容都是 const/constexpr.
备选方案、简化:
使用x3::raw
在这种情况下,您可以使用现有指令获得所需的行为:x3::raw
const auto main_rule__def = x3::raw [ *(char_ - ';') >> ';' ];
不要总是使用rule<>
仅当您有递归规则或需要规则的外部链接时才需要(在单独的翻译单元中定义它们)。整个程序缩小到...
#include <iostream>
#include <boost/spirit/home/x3.hpp>
#include <iomanip> // std::quoted
namespace x3 = boost::spirit::x3;
namespace client::parser {
auto const entry_point = x3::raw [ *(x3::char_ - ';') >> ';' ];
}
int main() {
for(std::string const input : { "abcd;" }) {
std::string output;
if (parse(input.begin(), input.end(), client::parser::entry_point, output)) {
std::cout << "Parsing succeeded\n";
std::cout << "input: " << std::quoted(input) << "\n";
std::cout << "output: " << std::quoted(output) << "\n";
} else {
std::cout << "Parsing failed\n";
}
}
}
最后——关于跳过
我认为您不需要 char_ - ';'
(或者您拼写的更详细的方式:!lit(';') >> char_
)。使用船长,它将跨空白解析("ab c\nd ;"
-> "abcd;"`)。
您可能希望使规则更具限制性(如 lexeme [+(graph - ';')]
或什至只是 raw[lexeme[+(alnum|'_')]
或 lexeme[+char_("a-zA-Z0-9_")]
)。
见Boost spirit skipper issues
对于Spirit X3解析器的开发,我想使用语义动作(脚注1)。控制如何将属性存储到 STL 容器中对我来说很重要。
本题是关于如何控制解析器属性:_attr(ctx)与规则类型:_val(ctx)匹配,以便正确赋值。也许这个问题归结为如何应用未记录的 transform_attribute 特征。但是请和我一起阅读,看看示例代码中是否真的为我解决了这个问题。
印刷类型objects/variables
当我尝试不同的语法表达式时,我发现非常有用的是能够在语义操作中打印 _attr( ctx ) 和 _val( ctx ) 的类型。
所以根据Howard Hinnant的回答,我写了一个实用程序头文件,根据自己的喜好提供这样的便利。
code below is to be put in a file named utility.h
#include <string>
#include <type_traits>
#include <typeinfo>
#include <cxxabi.h>
namespace utility
{
template<typename T>
std::string type2string()
{
std::string r;
typedef typename std::remove_reference<T>::type TR;
std::string space = "";
if ( std::is_const<TR>::value )
{ r = "const"; space = " "; }
if ( std::is_volatile<TR>::value )
{ r += space + " volatile"; space = " "; }
int status;
char* demangled =
abi::__cxa_demangle( typeid(TR).name(), nullptr, nullptr, &status );
switch ( status )
{
case 0: { goto proceed; }
case -1: { r = "type2string failed: malloc failure"; goto fail; }
case -2: { r = "type2string failed: " + std::string(typeid(TR).name()) +
" nonvalid C++ ABI name"; goto fail; }
case -3: { r = "type2string failed: invalid argument(s)"; goto fail; }
default: { r = "type2string failed: unknown status " +
status; goto fail; }
}
proceed:
r += space + demangled;
free( demangled );
/* references are without a space */
if ( std::is_lvalue_reference<T>::value ) { r += '&'; }
if ( std::is_rvalue_reference<T>::value ) { r += "&&"; }
fail:
return r;
}
}
现在实际工作的示例代码:
#include <cstddef>
#include <cstdio>
#include <cstdint>
#define BOOST_SPIRIT_X3_DEBUG
#include <boost/config/warning_disable.hpp>
#include <boost/spirit/home/x3.hpp>
#include <string>
#include <vector>
#include <utility> // this is for std::move
#include "utility.h" // to print types
namespace client
{
namespace x3 = boost::spirit::x3;
namespace ascii = boost::spirit::x3::ascii;
namespace semantic_actions
{
using x3::_val; // assign to _val( ctx )
using x3::_attr; // from _attr( ctx )
struct move_assign
{
template <typename Context>
void operator()(const Context& ctx) const
{
printf( "move_assign\n" );
_val( ctx ) = std::move( _attr( ctx ) );
}
};
struct print_type
{
template <typename Context>
void operator()(const Context& ctx) const
{
printf( "print_type\n" );
std::string str;
str = utility::type2string< decltype( _attr( ctx ) ) >();
printf( "_attr type: %s\n", str.c_str() );
// reuse str
str = utility::type2string< decltype( _val( ctx ) ) >();
printf( "_val type: %s\n", str.c_str() );
}
};
}
namespace parser
{
using x3::char_;
using x3::lit;
using namespace semantic_actions;
x3::rule<struct main_rule_class, std::string> main_rule_ = "main_rule";
const auto main_rule__def = (*( !lit(';') >> char_) >> lit(';'))[print_type()][move_assign()];
BOOST_SPIRIT_DEFINE( main_rule_ )
const auto entry_point = x3::skip(x3::space)[ main_rule_ ];
}
}
int main()
{
printf( "Give me a string to test rule.\n" );
printf( "Type [q or Q] to quit.\n" );
std::string input_str;
std::string output_str;
while (getline(std::cin, input_str))
{
if ( input_str.empty() || input_str[0] == 'q' || input_str[0] == 'Q')
{ break; }
auto first = input_str.begin(), last = input_str.end();
if ( parse( first, last, client::parser::entry_point, output_str) )
{
printf( "Parsing succeeded\n" );
printf( "input: \"%s\"\n", input_str.c_str() );
printf( "output: \"%s\"\n", output_str.c_str() );
}
else
{
printf( "Parsing failed\n" );
}
}
return 0;
}
输入总是:
abcd;
输出:
Give me a string to test rule.
Type [q or Q] to quit.
<main_rule>
<try>abcd;</try>
print_type
_attr type: std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> >&
_val type: std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> >&
move_assign
<success></success>
<attributes>[a, b, c, d]</attributes>
</main_rule>
Parsing succeeded
input: "abcd;"
output: "abcd"
好的,到目前为止一切正常,但假设我想在解析结果中包含分号。我将语法行更改为:
const auto main_rule__def = (*( !lit(';') >> char_) >> char_(";"))[print_type()];
注意:我删除了语义操作 [move_assign()],因为它由于不兼容的 _attr 和 _val 类型而无法编译。 现在输出是:
Give me a string to test rule.
Type [q or Q] to quit.
<main_rule>
<try>abcd;</try>
print_type
_attr type: boost::fusion::deque<std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> >, char>&
_val type: std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> >&
<success></success>
<attributes>[]</attributes>
</main_rule>
Parsing succeeded
input: "abcd;"
output: ""
现在 boost::fusion::deque<> 的 _attr 类型不是我想要的,我只是 std::string。我不明白为什么如果我在语义操作括号内有语法赋值的完整右侧,_attr 仍然不是 _val 类型。 X3 功能 transform_attribute 在这里有帮助吗?我应该如何应用它?或者解决这个问题的另一种好方法是什么,而无需使用 boost fusion class 接口或其他实现细节。
当前解决方法
我目前的解决方法是定义另一个规则,该规则仅从具有语义操作的第一条规则分配。只有那里的 _attr 是 std::string 类型。
namespace parser
{
using x3::char_;
using x3::lit;
using namespace semantic_actions;
x3::rule<struct main_rule_class, std::string> main_rule_ = "main_rule";
x3::rule<struct main_rule2_class, std::string> main_rule2_ = "main_rule2";
const auto main_rule__def = *( !lit(';') >> char_) >> char_(";");
const auto main_rule2__def = main_rule_[print_type()][move_assign()];
BOOST_SPIRIT_DEFINE( main_rule_, main_rule2_ )
const auto entry_point = x3::skip(x3::space)[ main_rule2_ ];
}
输出:
Give me a string to test rule.
Type [q or Q] to quit.
<main_rule2>
<try>abcd;</try>
<main_rule>
<try>abcd;</try>
<success></success>
<attributes>[a, b, c, d, ;]</attributes>
</main_rule>
print_type
_attr type: std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> >&
_val type: std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> >&
move_assign
<success></success>
<attributes>[a, b, c, d, ;]</attributes>
</main_rule2>
Parsing succeeded
input: "abcd;"
output: "abcd;"
我希望有一种方法,无需制定另一条规则即可使 _attr 的类型与 _val 匹配。
(1) 我不欣赏作者在这个库中隐藏的聪明才智。因为只是一个看似无害的变化就可以破坏应用程序。而更明确和详尽的方法将更清楚地传达正在发生的事情。我只需要把它说出来。
使用 char_(';'),属性有 2 个部分。这两部分都需要添加到 _val。类似于:
namespace semantic_actions
{
using x3::_val; // assign to _val( ctx )
using x3::_attr; // from _attr( ctx )
using boost::fusion::at_c;
struct move_assign
{
template <typename Context>
void operator()(const Context& ctx) const
{
printf( "move_assign\n" );
auto attr=_attr( ctx );
_val( ctx ) = at_c<0>( attr );
_val( ctx ) += at_c<1>( attr );
}
};
.
.
.
}
直接回答
transform_attribute
尚未 记录 X3 (https://www.boost.org/doc/libs/1_70_0/libs/spirit/doc/x3/html/index.html) but you can find its Qi counterpart here: https://www.boost.org/doc/libs/1_70_0/libs/spirit/doc/html/spirit/advanced/customize/transform.html.
Would the X3 feature transform_attribute help here? And how should I apply that?
无论如何,这是一个您可以使用规则轻松访问的实现细节。我喜欢使用匿名规则来帮助解决这个问题:
template <typename T>
struct as_type {
template <typename E>
constexpr auto operator[](E e) const { return x3::rule<struct _, T> {} = e; }
};
template <typename T>
static inline constexpr as_type<T> as;
现在你可以写了
const auto main_rule__def = as<std::string> [ (*(char_ - ';') >> char_(';')) ];
#include <iostream>
//#define BOOST_SPIRIT_X3_DEBUG
#include <boost/spirit/home/x3.hpp>
#include <iomanip> // std::quoted
namespace client {
namespace x3 = boost::spirit::x3;
namespace ascii = boost::spirit::x3::ascii;
namespace parser {
using x3::char_;
using x3::lit;
x3::rule<struct main_rule_class, std::string> main_rule_ = "main_rule";
template <typename T>
struct as_type {
template <typename E>
constexpr auto operator[](E e) const { return x3::rule<struct _, T> {} = e; }
};
template <typename T>
static inline constexpr as_type<T> as;
const auto main_rule__def = as<std::string> [ (*(char_ - ';') >> char_(';')) ];
BOOST_SPIRIT_DEFINE(main_rule_)
const auto entry_point = x3::skip(x3::space)[main_rule_];
} // namespace parser
} // namespace client
int main() {
std::string output_str;
for(std::string const input_str : { "abcd;" }) {
auto first = input_str.begin(), last = input_str.end();
if (parse(first, last, client::parser::entry_point, output_str)) {
std::cout << "Parsing succeeded\n";
std::cout << "input: " << std::quoted(input_str) << "\n";
std::cout << "output: " << std::quoted(output_str) << "\n";
} else {
std::cout << "Parsing failed\n";
}
}
}
版画
Parsing succeeded
input: "abcd;"
output: "abcd;"
理论上可能会有性能开销,但我强烈怀疑所有编译器都会在这里内联所有内容,因为没有任何外部链接或 vtables,而且所有内容都是 const/constexpr.
备选方案、简化:
使用x3::raw
在这种情况下,您可以使用现有指令获得所需的行为:x3::raw
const auto main_rule__def = x3::raw [ *(char_ - ';') >> ';' ];
不要总是使用rule<>
仅当您有递归规则或需要规则的外部链接时才需要(在单独的翻译单元中定义它们)。整个程序缩小到...
#include <iostream>
#include <boost/spirit/home/x3.hpp>
#include <iomanip> // std::quoted
namespace x3 = boost::spirit::x3;
namespace client::parser {
auto const entry_point = x3::raw [ *(x3::char_ - ';') >> ';' ];
}
int main() {
for(std::string const input : { "abcd;" }) {
std::string output;
if (parse(input.begin(), input.end(), client::parser::entry_point, output)) {
std::cout << "Parsing succeeded\n";
std::cout << "input: " << std::quoted(input) << "\n";
std::cout << "output: " << std::quoted(output) << "\n";
} else {
std::cout << "Parsing failed\n";
}
}
}
最后——关于跳过
我认为您不需要 char_ - ';'
(或者您拼写的更详细的方式:!lit(';') >> char_
)。使用船长,它将跨空白解析("ab c\nd ;"
-> "abcd;"`)。
您可能希望使规则更具限制性(如 lexeme [+(graph - ';')]
或什至只是 raw[lexeme[+(alnum|'_')]
或 lexeme[+char_("a-zA-Z0-9_")]
)。
见Boost spirit skipper issues