lambda 对象 + c 回调 sigsegv

lambda object + c callback sigsegv

如果我像这样实现 C 回调:

register_callback([](/*some args*/){/*some stuff*/});

当它触发时我得到一个 SIGSEGV,但是如果我这样注册它:

auto const f([](/*some args*/){/*some stuff*/});

register_callback(f);

然后它工作正常。 (对我来说)特别感兴趣的是地址消毒器产生的堆栈跟踪:

ASAN:SIGSEGV
=================================================================
==22904==ERROR: AddressSanitizer: SEGV on unknown address 0x7f1582c54701 (pc 0x7f1582c54701 sp 0x7f1582c544a8 bp 0x7f1582c54510 T2)
    #0 0x7f1582c54700 ([stack:22906]+0x7fc700)

AddressSanitizer can not provide additional info.
SUMMARY: AddressSanitizer: SEGV ??:0 ??

看起来,好像函数指针指向了堆栈。将 lambda 推入堆栈是否将代码推入堆栈?由于我什么也没捕获,函数指针的位置对我来说是个谜。怎么了?没有使用优化标志。我不是在寻找解决方法。

编辑:显然“+”是工作示例的关键。我不知道为什么有必要。删除 '+' 和带有编译的示例,但 SIGSEGV 将被 clang-3.5gcc-4.9.

触发
#include <curl/curl.h>

#include <ostream>

#include <iostream>

int main()
{
  auto const curl(curl_easy_init());

  if (curl)
  {
    curl_easy_setopt(curl, CURLOPT_URL, "cnn.com");

    curl_easy_setopt(curl, CURLOPT_FOLLOWLOCATION, 1L);

/*
    auto const f([](char* const ptr, size_t const size, size_t const nmemb,
      void* const data)
      {
        *static_cast<::std::ostream*>(data) << ptr;

        return size * nmemb;
      }
    );

    curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION, +f);
*/

    curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION,
      +[](char* const ptr, size_t const size, size_t const nmemb,
        void* const data)
        {
          *static_cast<::std::ostream*>(data) << ptr;

          return size * nmemb;
        }
    );

    curl_easy_setopt(curl, CURLOPT_WRITEDATA, &::std::cout);

    curl_easy_perform(curl);

    curl_easy_cleanup(curl);
  }

  return 0;
}

curl_easy_setopt 定义为(在 curl/easy.h 中):

CURL_EXTERN CURLcode curl_easy_setopt(CURL *curl, CURLoption option, ...);

这意味着第三个参数 param 必须是可以作为 C 可变参数传递的类型。不幸的是,虽然 curl_easy_setopt 需要一个函数指针,但传递 class 对象(并且 lambda 是 class 对象)是“有条件地支持实现定义的语义" ([expr.call]/7),因此编译器接受它,但随后 curl_easy_setopt 试图将 lambda 对象解释为函数指针,具有灾难性结果。

您实际传递的对象是一个无捕获的 lambda,这意味着它是一个空的 class 对象,大小为 1 个字节(所有派生对象的大小必须至少为一个字节)。编译器将该参数提升为字长整数(32 位为 4 个字节,64 位为 8 个字节)并传递 0 或保留 register/stack 插槽未设置,这意味着垃圾得到通过(因为 lambda 在调用时实际上并不使用其内存占用)。

我刚刚用 libcurl 写了一个类似的 lambda,然后崩溃了,仔细检查后,我得到了以下代码,运行正常。

神奇的是,在非捕获的 lambda 表达式中添加前导 +,这将触发转换为普通 C 函数指针。

curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION,
  /* NOTE: Leader '+' trigger conversion from non-captured Lambda Object to plain C pointer */
  +[](void *buffer, size_t size, size_t nmemb, void *userp) -> size_t {
    // invoke the member function via userdata
    return size * nmemb;
  });

我的理解是,curl_easy_setopt()想要一个void*,而不是显式函数类型,所以编译器只给出了lambda OBJECT的地址;如果我们对 lambda 对象进行函数指针操作,编译器将 return 来自 lambda 对象的函数指针。