如何在编译时从 string_view 中删除子字符串？

Question

我创建了一个名为 DBG 的宏，它打印一个表达式本身和它的计算结果。所以 DBG(5+1) 应该打印 5+1 = 6。该宏运行良好。

然而，如果我封装了不止一个这样的宏，那将变得非常不可读，因为 "DBG" 本身总是被拖来拖去。

我想做的是在编译时从表达式本身中删除所有出现的子字符串 "DBG"。因此 DBG(DBG(5*3) + DBG(20/4)) 结果将 而不是

5*3 = 15
20/4 = 5
DBG(5*3)+DBG(20/4) = 20

而是

5*3 = 15
20/4 = 5
(5*3)+(20/4) = 20

如果需要：宏如下所示：#define DBG(expression) debug_log((#expression, expression) 其中 debug_log 为：

template<typename T>
inline constexpr T debug_log(const std::string_view& raw_expression, T&& x)
{
    using namespace std;
    cout << raw_expression << " = " << x << endl;
    return x;
}

我已经编写了一个应该执行此操作的辅助函数，但我不知道如何在编译时连接两个 string_views。


inline constexpr auto clean_expression(const std::string_view& expression)
{
    constexpr std::string_view macro_name = "DBG";
    constexpr auto marco_name_length = macro_name.size();

    auto pos = expression.find(macro_name);

    if (pos == -1) {
        return expression;
    }
    else {
        auto after_macro_name = expression.substr(pos + marco_name_length);

        auto length_before_macro = expression.size() - after_macro_name.size() - marco_name_length;
        std::string_view string_before_macro_name = expression.substr(0, length_before_macro);

        // TODO: Finish implementation by concatenating the string_before_macro_name and after_macro_name and cleaning the result
        //auto partly_cleaned_string = concatenate(string_before_macro_name, after_macro_name)}; <-- that one is missing
        //return clean_expression(partly_cleaned_string);
    }
}

Answer 1

您当前的策略将不起作用，因为 std::string_view 必须指向一些现有的连续数据块。因此，除非您 return 正在 string_view 的单个切片，否则您必须分配一个 char 数组并 return 它在结构中：

template <size_t N>
struct fixed_string {
    char data[N];
};

现在，除非你想做 C 风格的事情并选择一个最大长度的缓冲区，否则你需要将表达式大小作为编译时常量（知道这是一个上限）。这...不起作用，因为函数参数不是 constexpr:

constexpr auto clean_expression(std::string_view& expression) {
    fixed_string<expression.size()> result; // fails
    /*...*/
    return result;
}

所以，尽管听起来很奇怪，但为了安全起见，您需要将输入作为普通的旧字符数组传递：

template <size_t N>
constexpr auto clean_expression(const char (&expr)[N]) {
    fixed_string<N> result = {};
    /* ... */
    return result;
}

由于我们知道结果大小将小于或等于缓冲区大小，我们可以添加一个字段以使其可用作字符串：

template <size_t N>
struct fixed_string {
    constexpr std::string_view view() const { return { data, size }; }
    char data[N];
    size_t size;
};

之后，跳过std::string方法，写一个小循环来选择性复制字符：

template <size_t N>
template <size_t N>
constexpr auto clean_expression(const char (&expr)[N]) {
    fixed_string<N> result = {};

    int src_idx = 0;
    int dst_idx = 0;
    while (src_idx < N - 2) {
        if (expr[src_idx] == 'D' && expr[src_idx+1] == 'B' && expr[src_idx+2] == 'G') {
            src_idx += 3;
        } else {
            result.data[dst_idx++] = expr[src_idx++];
        }
    }
    result.data[dst_idx++] = expr[N-2];
    result.data[dst_idx++] = expr[N-1];
    result.size = dst_idx;
    return result;
}

并使用：

constexpr auto expr = clean_expression("DBG(DBG(y) + DBG(z))");
std::cout << expr.view(); // ((y) + (z))

演示：https://godbolt.org/z/8j3RCs

需要注意的是你必须在使用前把它变成一个变量，因为这个表达式的结果仍然是临时的，不是全局的。如果您将它直接传递给函数参数，则视图将比对象长寿。

也许这对您不起作用，因为您希望直接将宏粘贴到字符串文字的位置。但是您可能会逃脱它，因为清理后的字符串数据可能会在全局数据部分中，并且由此产生的未定义行为将具有预期的输出。

如何在编译时从 string_view 中删除子字符串？

How to remove a substring from a string_view at compile time?

c++

substring

string-concatenation

constexpr

string-view