在移动的 lambda 中捕获和调试对局部变量引用的无效使用

Catching and debugging invalid use of reference to local variable inside moved lambda

我在我的一个实际项目中遇到过一种难以调试的情况,我不小心访问了对已移动的 lambda 中的局部变量的引用。访问是从另一个线程完成的,但移动的 lambda 一直保持活动状态,直到第二个线程完成。

该错误仅在禁用优化时出现,并且是由粗心的重构引起的。

我创建了一个重现问题的最小示例(available here on wandbox)

struct state
{
    int x = 100;
};

template <typename TF>
void eat1(TF&& f)
{
    // Call the lambda.
    f();

    // Simulate waiting for the second thread
    // to finish.
    std::this_thread::sleep_for(1000ms);
}

template <typename TF>
void eat0(TF&& f)
{
    // Move the lambda to some other handler.
    eat1(std::forward<TF>(f));
}

void use_state(state& s)
{
    // Will print `100`.
    std::cout << s.x << "\n";

    // Separate thread. Note that `s` is captured by
    // reference.
    std::thread t{[&s]
        {
            // Simulate computation delay.
            std::this_thread::sleep_for(500ms);

            // Will print garbage.
            std::cout << s.x << "\n";
        }};

    t.detach();
}

int main()
{
    eat0([]
        {
            // Local lambda variable that will be accessed
            // after the lambda is moved.
            state s;

            // Function that takes `s` by reference and
            // accesses it in a separate thread after the
            // lambda is moved.
            use_state(s);
        });
}

令人惊讶的是,none 消毒剂和警告标志在这方面发挥了作用。

我尝试了以下编译器和消毒剂的组合,

-Wall -Wextra -Wpedantic -g -O0

始终启用标志:

None 的组合产生了任何有用的诊断。我希望 AddressSanitizer 告诉我我正在访问悬空引用,或者 UndefinedSanitizer 在访问它时捕获 UB,或者 ThreadSanitizer 告诉我一个单独的线程正在访问一个无效的内存位置。

是否有可靠的方法来诊断此问题?我是否应该 post 将此示例作为功能 request/defect 提供给任何消毒剂的错误跟踪器?

valgrind 的 memcheck 工具在默认设置下发现了这个问题。然而,这种讨厌的错误有机会逃脱 memcheck。我不确定这个问题是否会在真正的程序中被捕获。

第一个 lambda 被移动的事实与问题无关(尽管它可能使调试过程复杂化)。问题是由于访问已完成执行的函数中的局部变量(同样,从不同线程发生访问的事实只会使调查更加困难,但不会以任何其他方式导致错误)。第一个 lambda 保持活动状态的事实绝不能保护你 - 局部变量属于 lambda 调用 而不是 lambda 本身。