如何为非字符串的自定义选项值类型处理 Boost::program_options 配置文件中的空格?

How to handle spaces in Boost::program_options config files for custom option value types that are not strings?

此问题涉及 Boost::program_options 配置文件中值的解析。

我有一个简单的自定义数据结构:

struct Vector {
    double x, y, z;
};

我有一个格式为“(x, y, z)”的 istream 反序列化器,我从另一个 SO post:

那里借来的
// https://codereview.stackexchange.com/a/93811/186081
struct Expect {
    char expected;
    Expect(char expected) : expected(expected) {}
    friend std::istream& operator>>(std::istream& is, Expect const& e) {
        char actual;
        if ((is >> actual) && (actual != e.expected)) {
            is.setstate(std::ios::failbit);
        }
        return is;
    }
};

template<typename CharT>
std::basic_istream<CharT> &
operator>>(std::basic_istream<CharT> &in, Vector &v) {
    in >> Expect('(') >> v.x
       >> Expect(',') >> v.y
       >> Expect(',') >> v.z
       >> Expect(')');
    return in;
}

我正在使用 Vector 的实例作为 Boost::program_options 的值存储:

Vector vector {0.0, 0.0, 0.0};
po::options_description opts("Usage");
opts.add_options()
      ("vector", po::value(&vector), "The vector");

po::variables_map vm;
po::store(po::parse_config_file("config.cfg", opts, true), vm);
po::notify(vm);

问题是如果向量 value 表示包含空格,则配置文件格式不起作用。例如,此配置文件正确解析:

vector = (0.0,1.1,2.2)

然而,这个,带空格,不解析:

vector = (0.0, 1.1, 2.2)

相反,program_options 抛出:

the argument ('(0.0, 1.1, 2.2)') for option 'vector' is invalid

但是,对于声明为 std::string 的选项,空格似乎没问题:

some_string = this is a string

我发现一些 post 提到使用引号,但这似乎不起作用(同样的错误):

vector = "(0.0, 1.1, 2.2)"

其他一些 post 建议使用自定义解析器,但是我不确定我将如何实现它,而且处理一些空格似乎需要做很多工作。

我假设此行为来自命令行选项的解析方式,即使这是配置文件解析。在这种情况下,像 --vector (0.0, 1.1, 2.2) 这样的命令行没有多大意义(暂时忽略 shell 保留字符 ( & ) 的使用)

请问有什么好方法可以解决吗?

不,你不能..

编辑:经过深思熟虑,我认为您可以尝试修改分隔符,如 https://en.cppreference.com/w/cpp/locale/ctype

program_options 使用 lexical_cast ,这需要在 operator>> 之后消耗全部内容。当存在 space 时,内容永远不会被一个 >> 消耗,默认情况下会出现错误。

因此你可以这样做:

    struct Optional {
        char optional;
        Optional(char optional):optional(optional){}
        friend std::istream& operator>>(std::istream& is, Optional const& o) {
            char next;
            do{
                next = is.peek();
            }while(next == o.optional && is.get());
            return is;
        }
    };

    struct vector_ctype : std::ctype<wchar_t> {
        bool do_is(mask m, char_type c) const {   
            if ((m & space) && c == L' ') {
                return false; // space will NOT be classified as whitespace
            }
            return ctype::do_is(m, c); // leave the rest to the parent class
        } 
    };


    template<typename CharT>
    std::basic_istream<CharT> &
    operator>>(std::basic_istream<CharT> &in, Vector &v) {    
        std::locale default_locale = in.getloc();
        in.imbue(std::locale(default_locale, new vector_ctype()));
        in >> Expect('(') >> Optional(' ') >> v.x >> Optional(' ')
           >> Expect(',') >> Optional(' ') >> v.y >> Optional(' ')
           >> Expect(',') >> Optional(' ') >> v.z >> Optional(' ')
           >> Expect(')');
        in.imbue(default_locale);
        return in;
    }
int main()
{
    Vector v  = boost::lexical_cast<Vector>("(1,  2,  3)");
    std::cout << v.x <<"," <<v.y <<"," << v.z <<std::endl;
}

输出:

1,2,3

这应该会在 program_options

中为您提供正确的输出

您可以编写一个例程来过滤输入文件中不需要的字符,然后将其传递给 boost::program_options 进行解析,而不是编写自定义解析器。

使用 SO answer to Remove spaces from std::string in C++,这是一个基于您的代码的工作示例:

#include <iostream>
#include <sstream>
#include <fstream>
#include <string>
#include <boost/program_options/options_description.hpp>
#include <boost/program_options/parsers.hpp>
#include <boost/program_options/variables_map.hpp>

struct Vector {
  double x, y, z;
};

// https://codereview.stackexchange.com/a/93811/186081
struct Expect {
    char expected;
    Expect(char expected) : expected(expected) {}
    friend std::istream& operator>>(std::istream& is, Expect const& e) {
        char actual;
        if ((is >> actual) && (actual != e.expected)) {
            is.setstate(std::ios::failbit);
        }
        return is;
    }
};

template<typename CharT>
std::basic_istream<CharT> &
operator>>(std::basic_istream<CharT> &in, Vector &v) {
    in >> Expect('(') >> v.x
       >> Expect(',') >> v.y
       >> Expect(',') >> v.z
       >> Expect(')');
    return in;
}

std::stringstream filter(const std::string& filename)
{
  std::ifstream inputfile(filename);

  std::stringstream s;
  std::string line;
  while (std::getline(inputfile, line))
    {
      auto end_pos = std::remove(line.begin(), line.end(), ' ');
      line.erase(end_pos, line.end());
      s << line << '\n';
    }
  s.seekg(0, std::ios_base::beg);

  return s;
}

int main()
{
  namespace po = boost::program_options;

  po::options_description opts("Usage");
  opts.add_options()
    ("vector", po::value<Vector>(), "The vector");

  auto input = filter("config.cfg");
  po::variables_map vm;
  po::store(po::parse_config_file(input, opts, true), vm);
  po::notify(vm);

  auto read_vec = vm["vector"].as<Vector>();
  std::cout << "vector is : {" << read_vec.x << ", " << read_vec.y << ", " << read_vec.z << "}" << std::endl;

  return 0;
}

要测试程序,您必须创建一个文件 config.cfg 包含,例如:

vector = (1,  2, 3)

(额外的间距是故意的,以测试例程)。

有了这个,程序的输出就是

vector is : {1, 2, 3}