在移动的 lambda 中捕获和调试对局部变量引用的无效使用
Catching and debugging invalid use of reference to local variable inside moved lambda
我在我的一个实际项目中遇到过一种难以调试的情况,我不小心访问了对已移动的 lambda 中的局部变量的引用。访问是从另一个线程完成的,但移动的 lambda 一直保持活动状态,直到第二个线程完成。
该错误仅在禁用优化时出现,并且是由粗心的重构引起的。
我创建了一个重现问题的最小示例(available here on wandbox):
struct state
{
int x = 100;
};
template <typename TF>
void eat1(TF&& f)
{
// Call the lambda.
f();
// Simulate waiting for the second thread
// to finish.
std::this_thread::sleep_for(1000ms);
}
template <typename TF>
void eat0(TF&& f)
{
// Move the lambda to some other handler.
eat1(std::forward<TF>(f));
}
void use_state(state& s)
{
// Will print `100`.
std::cout << s.x << "\n";
// Separate thread. Note that `s` is captured by
// reference.
std::thread t{[&s]
{
// Simulate computation delay.
std::this_thread::sleep_for(500ms);
// Will print garbage.
std::cout << s.x << "\n";
}};
t.detach();
}
int main()
{
eat0([]
{
// Local lambda variable that will be accessed
// after the lambda is moved.
state s;
// Function that takes `s` by reference and
// accesses it in a separate thread after the
// lambda is moved.
use_state(s);
});
}
令人惊讶的是,none 消毒剂和警告标志在这方面发挥了作用。
我尝试了以下编译器和消毒剂的组合,
-Wall -Wextra -Wpedantic -g -O0
始终启用标志:
编译器:Arch Linux x64 上的 g++ 6.1.1; clang++ 3.8.0 Arch Linux x64; g++ 5.3.1 在 Fedora x64 上; clang++ 3.7.0 在 Fedora x64 上。
消毒剂:-fsanitize=address
; -fsanitize=undefined
, -fsanitize=thread
.
None 的组合产生了任何有用的诊断。我希望 AddressSanitizer 告诉我我正在访问悬空引用,或者 UndefinedSanitizer 在访问它时捕获 UB,或者 ThreadSanitizer 告诉我一个单独的线程正在访问一个无效的内存位置。
是否有可靠的方法来诊断此问题?我是否应该 post 将此示例作为功能 request/defect 提供给任何消毒剂的错误跟踪器?
valgrind 的 memcheck 工具在默认设置下发现了这个问题。然而,这种讨厌的错误有机会逃脱 memcheck。我不确定这个问题是否会在真正的程序中被捕获。
第一个 lambda 被移动的事实与问题无关(尽管它可能使调试过程复杂化)。问题是由于访问已完成执行的函数中的局部变量(同样,从不同线程发生访问的事实只会使调查更加困难,但不会以任何其他方式导致错误)。第一个 lambda 保持活动状态的事实绝不能保护你 - 局部变量属于 lambda 调用 而不是 lambda 本身。
我在我的一个实际项目中遇到过一种难以调试的情况,我不小心访问了对已移动的 lambda 中的局部变量的引用。访问是从另一个线程完成的,但移动的 lambda 一直保持活动状态,直到第二个线程完成。
该错误仅在禁用优化时出现,并且是由粗心的重构引起的。
我创建了一个重现问题的最小示例(available here on wandbox):
struct state
{
int x = 100;
};
template <typename TF>
void eat1(TF&& f)
{
// Call the lambda.
f();
// Simulate waiting for the second thread
// to finish.
std::this_thread::sleep_for(1000ms);
}
template <typename TF>
void eat0(TF&& f)
{
// Move the lambda to some other handler.
eat1(std::forward<TF>(f));
}
void use_state(state& s)
{
// Will print `100`.
std::cout << s.x << "\n";
// Separate thread. Note that `s` is captured by
// reference.
std::thread t{[&s]
{
// Simulate computation delay.
std::this_thread::sleep_for(500ms);
// Will print garbage.
std::cout << s.x << "\n";
}};
t.detach();
}
int main()
{
eat0([]
{
// Local lambda variable that will be accessed
// after the lambda is moved.
state s;
// Function that takes `s` by reference and
// accesses it in a separate thread after the
// lambda is moved.
use_state(s);
});
}
令人惊讶的是,none 消毒剂和警告标志在这方面发挥了作用。
我尝试了以下编译器和消毒剂的组合,
-Wall -Wextra -Wpedantic -g -O0
始终启用标志:
编译器:Arch Linux x64 上的 g++ 6.1.1; clang++ 3.8.0 Arch Linux x64; g++ 5.3.1 在 Fedora x64 上; clang++ 3.7.0 在 Fedora x64 上。
消毒剂:
-fsanitize=address
;-fsanitize=undefined
,-fsanitize=thread
.
None 的组合产生了任何有用的诊断。我希望 AddressSanitizer 告诉我我正在访问悬空引用,或者 UndefinedSanitizer 在访问它时捕获 UB,或者 ThreadSanitizer 告诉我一个单独的线程正在访问一个无效的内存位置。
是否有可靠的方法来诊断此问题?我是否应该 post 将此示例作为功能 request/defect 提供给任何消毒剂的错误跟踪器?
valgrind 的 memcheck 工具在默认设置下发现了这个问题。然而,这种讨厌的错误有机会逃脱 memcheck。我不确定这个问题是否会在真正的程序中被捕获。
第一个 lambda 被移动的事实与问题无关(尽管它可能使调试过程复杂化)。问题是由于访问已完成执行的函数中的局部变量(同样,从不同线程发生访问的事实只会使调查更加困难,但不会以任何其他方式导致错误)。第一个 lambda 保持活动状态的事实绝不能保护你 - 局部变量属于 lambda 调用 而不是 lambda 本身。