如何在编译时从 string_view 中删除子字符串?
How to remove a substring from a string_view at compile time?
我创建了一个名为 DBG 的宏,它打印一个表达式本身和它的计算结果。所以 DBG(5+1)
应该打印 5+1 = 6
。该宏运行良好。
然而,如果我封装了不止一个这样的宏,那将变得非常不可读,因为 "DBG" 本身总是被拖来拖去。
我想做的是在编译时从表达式本身中删除所有出现的子字符串 "DBG"。因此 DBG(DBG(5*3) + DBG(20/4))
结果将 而不是
5*3 = 15
20/4 = 5
DBG(5*3)+DBG(20/4) = 20
而是
5*3 = 15
20/4 = 5
(5*3)+(20/4) = 20
如果需要:宏如下所示:#define DBG(expression) debug_log((#expression, expression)
其中 debug_log 为:
template<typename T>
inline constexpr T debug_log(const std::string_view& raw_expression, T&& x)
{
using namespace std;
cout << raw_expression << " = " << x << endl;
return x;
}
我已经编写了一个应该执行此操作的辅助函数,但我不知道如何在编译时连接两个 string_views。
inline constexpr auto clean_expression(const std::string_view& expression)
{
constexpr std::string_view macro_name = "DBG";
constexpr auto marco_name_length = macro_name.size();
auto pos = expression.find(macro_name);
if (pos == -1) {
return expression;
}
else {
auto after_macro_name = expression.substr(pos + marco_name_length);
auto length_before_macro = expression.size() - after_macro_name.size() - marco_name_length;
std::string_view string_before_macro_name = expression.substr(0, length_before_macro);
// TODO: Finish implementation by concatenating the string_before_macro_name and after_macro_name and cleaning the result
//auto partly_cleaned_string = concatenate(string_before_macro_name, after_macro_name)}; <-- that one is missing
//return clean_expression(partly_cleaned_string);
}
}
您当前的策略将不起作用,因为 std::string_view
必须指向一些现有的连续数据块。因此,除非您 return 正在 string_view
的单个切片,否则您必须分配一个 char 数组并 return 它在结构中:
template <size_t N>
struct fixed_string {
char data[N];
};
现在,除非你想做 C 风格的事情并选择一个最大长度的缓冲区,否则你需要将表达式大小作为编译时常量(知道这是一个上限)。这...不起作用,因为函数参数不是 constexpr:
constexpr auto clean_expression(std::string_view& expression) {
fixed_string<expression.size()> result; // fails
/*...*/
return result;
}
所以,尽管听起来很奇怪,但为了安全起见,您需要将输入作为普通的旧字符数组传递:
template <size_t N>
constexpr auto clean_expression(const char (&expr)[N]) {
fixed_string<N> result = {};
/* ... */
return result;
}
由于我们知道结果大小将小于或等于缓冲区大小,我们可以添加一个字段以使其可用作字符串:
template <size_t N>
struct fixed_string {
constexpr std::string_view view() const { return { data, size }; }
char data[N];
size_t size;
};
之后,跳过std::string
方法,写一个小循环来选择性复制字符:
template <size_t N>
template <size_t N>
constexpr auto clean_expression(const char (&expr)[N]) {
fixed_string<N> result = {};
int src_idx = 0;
int dst_idx = 0;
while (src_idx < N - 2) {
if (expr[src_idx] == 'D' && expr[src_idx+1] == 'B' && expr[src_idx+2] == 'G') {
src_idx += 3;
} else {
result.data[dst_idx++] = expr[src_idx++];
}
}
result.data[dst_idx++] = expr[N-2];
result.data[dst_idx++] = expr[N-1];
result.size = dst_idx;
return result;
}
并使用:
constexpr auto expr = clean_expression("DBG(DBG(y) + DBG(z))");
std::cout << expr.view(); // ((y) + (z))
演示:https://godbolt.org/z/8j3RCs
需要注意的是你必须在使用前把它变成一个变量,因为这个表达式的结果仍然是临时的,不是全局的。如果您将它直接传递给函数参数,则视图将比对象长寿。
也许这对您不起作用,因为您希望直接将宏粘贴到字符串文字的位置。但是您可能会逃脱它,因为清理后的字符串数据可能会在全局数据部分中,并且由此产生的未定义行为将具有预期的输出。
我创建了一个名为 DBG 的宏,它打印一个表达式本身和它的计算结果。所以 DBG(5+1)
应该打印 5+1 = 6
。该宏运行良好。
然而,如果我封装了不止一个这样的宏,那将变得非常不可读,因为 "DBG" 本身总是被拖来拖去。
我想做的是在编译时从表达式本身中删除所有出现的子字符串 "DBG"。因此 DBG(DBG(5*3) + DBG(20/4))
结果将 而不是
5*3 = 15
20/4 = 5
DBG(5*3)+DBG(20/4) = 20
而是
5*3 = 15
20/4 = 5
(5*3)+(20/4) = 20
如果需要:宏如下所示:#define DBG(expression) debug_log((#expression, expression)
其中 debug_log 为:
template<typename T>
inline constexpr T debug_log(const std::string_view& raw_expression, T&& x)
{
using namespace std;
cout << raw_expression << " = " << x << endl;
return x;
}
我已经编写了一个应该执行此操作的辅助函数,但我不知道如何在编译时连接两个 string_views。
inline constexpr auto clean_expression(const std::string_view& expression)
{
constexpr std::string_view macro_name = "DBG";
constexpr auto marco_name_length = macro_name.size();
auto pos = expression.find(macro_name);
if (pos == -1) {
return expression;
}
else {
auto after_macro_name = expression.substr(pos + marco_name_length);
auto length_before_macro = expression.size() - after_macro_name.size() - marco_name_length;
std::string_view string_before_macro_name = expression.substr(0, length_before_macro);
// TODO: Finish implementation by concatenating the string_before_macro_name and after_macro_name and cleaning the result
//auto partly_cleaned_string = concatenate(string_before_macro_name, after_macro_name)}; <-- that one is missing
//return clean_expression(partly_cleaned_string);
}
}
您当前的策略将不起作用,因为 std::string_view
必须指向一些现有的连续数据块。因此,除非您 return 正在 string_view
的单个切片,否则您必须分配一个 char 数组并 return 它在结构中:
template <size_t N>
struct fixed_string {
char data[N];
};
现在,除非你想做 C 风格的事情并选择一个最大长度的缓冲区,否则你需要将表达式大小作为编译时常量(知道这是一个上限)。这...不起作用,因为函数参数不是 constexpr:
constexpr auto clean_expression(std::string_view& expression) {
fixed_string<expression.size()> result; // fails
/*...*/
return result;
}
所以,尽管听起来很奇怪,但为了安全起见,您需要将输入作为普通的旧字符数组传递:
template <size_t N>
constexpr auto clean_expression(const char (&expr)[N]) {
fixed_string<N> result = {};
/* ... */
return result;
}
由于我们知道结果大小将小于或等于缓冲区大小,我们可以添加一个字段以使其可用作字符串:
template <size_t N>
struct fixed_string {
constexpr std::string_view view() const { return { data, size }; }
char data[N];
size_t size;
};
之后,跳过std::string
方法,写一个小循环来选择性复制字符:
template <size_t N>
template <size_t N>
constexpr auto clean_expression(const char (&expr)[N]) {
fixed_string<N> result = {};
int src_idx = 0;
int dst_idx = 0;
while (src_idx < N - 2) {
if (expr[src_idx] == 'D' && expr[src_idx+1] == 'B' && expr[src_idx+2] == 'G') {
src_idx += 3;
} else {
result.data[dst_idx++] = expr[src_idx++];
}
}
result.data[dst_idx++] = expr[N-2];
result.data[dst_idx++] = expr[N-1];
result.size = dst_idx;
return result;
}
并使用:
constexpr auto expr = clean_expression("DBG(DBG(y) + DBG(z))");
std::cout << expr.view(); // ((y) + (z))
演示:https://godbolt.org/z/8j3RCs
需要注意的是你必须在使用前把它变成一个变量,因为这个表达式的结果仍然是临时的,不是全局的。如果您将它直接传递给函数参数,则视图将比对象长寿。
也许这对您不起作用,因为您希望直接将宏粘贴到字符串文字的位置。但是您可能会逃脱它,因为清理后的字符串数据可能会在全局数据部分中,并且由此产生的未定义行为将具有预期的输出。