lambda 对象 + c 回调 sigsegv
lambda object + c callback sigsegv
如果我像这样实现 C 回调:
register_callback([](/*some args*/){/*some stuff*/});
当它触发时我得到一个 SIGSEGV,但是如果我这样注册它:
auto const f([](/*some args*/){/*some stuff*/});
register_callback(f);
然后它工作正常。 (对我来说)特别感兴趣的是地址消毒器产生的堆栈跟踪:
ASAN:SIGSEGV
=================================================================
==22904==ERROR: AddressSanitizer: SEGV on unknown address 0x7f1582c54701 (pc 0x7f1582c54701 sp 0x7f1582c544a8 bp 0x7f1582c54510 T2)
#0 0x7f1582c54700 ([stack:22906]+0x7fc700)
AddressSanitizer can not provide additional info.
SUMMARY: AddressSanitizer: SEGV ??:0 ??
看起来,好像函数指针指向了堆栈。将 lambda 推入堆栈是否将代码推入堆栈?由于我什么也没捕获,函数指针的位置对我来说是个谜。怎么了?没有使用优化标志。我不是在寻找解决方法。
编辑:显然“+”是工作示例的关键。我不知道为什么有必要。删除 '+' 和带有编译的示例,但 SIGSEGV 将被 clang-3.5
和 gcc-4.9
.
触发
#include <curl/curl.h>
#include <ostream>
#include <iostream>
int main()
{
auto const curl(curl_easy_init());
if (curl)
{
curl_easy_setopt(curl, CURLOPT_URL, "cnn.com");
curl_easy_setopt(curl, CURLOPT_FOLLOWLOCATION, 1L);
/*
auto const f([](char* const ptr, size_t const size, size_t const nmemb,
void* const data)
{
*static_cast<::std::ostream*>(data) << ptr;
return size * nmemb;
}
);
curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION, +f);
*/
curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION,
+[](char* const ptr, size_t const size, size_t const nmemb,
void* const data)
{
*static_cast<::std::ostream*>(data) << ptr;
return size * nmemb;
}
);
curl_easy_setopt(curl, CURLOPT_WRITEDATA, &::std::cout);
curl_easy_perform(curl);
curl_easy_cleanup(curl);
}
return 0;
}
curl_easy_setopt
定义为(在 curl/easy.h
中):
CURL_EXTERN CURLcode curl_easy_setopt(CURL *curl, CURLoption option, ...);
这意味着第三个参数 param
必须是可以作为 C 可变参数传递的类型。不幸的是,虽然 curl_easy_setopt
需要一个函数指针,但传递 class 对象(并且 lambda 是 class 对象)是“有条件地支持实现定义的语义" ([expr.call]/7),因此编译器接受它,但随后 curl_easy_setopt
试图将 lambda 对象解释为函数指针,具有灾难性结果。
您实际传递的对象是一个无捕获的 lambda,这意味着它是一个空的 class 对象,大小为 1 个字节(所有派生对象的大小必须至少为一个字节)。编译器将该参数提升为字长整数(32 位为 4 个字节,64 位为 8 个字节)并传递 0
或保留 register/stack 插槽未设置,这意味着垃圾得到通过(因为 lambda 在调用时实际上并不使用其内存占用)。
我刚刚用 libcurl 写了一个类似的 lambda,然后崩溃了,仔细检查后,我得到了以下代码,运行正常。
神奇的是,在非捕获的 lambda 表达式中添加前导 +
,这将触发转换为普通 C 函数指针。
curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION,
/* NOTE: Leader '+' trigger conversion from non-captured Lambda Object to plain C pointer */
+[](void *buffer, size_t size, size_t nmemb, void *userp) -> size_t {
// invoke the member function via userdata
return size * nmemb;
});
我的理解是,curl_easy_setopt()
想要一个void*
,而不是显式函数类型,所以编译器只给出了lambda OBJECT的地址;如果我们对 lambda 对象进行函数指针操作,编译器将 return 来自 lambda 对象的函数指针。
如果我像这样实现 C 回调:
register_callback([](/*some args*/){/*some stuff*/});
当它触发时我得到一个 SIGSEGV,但是如果我这样注册它:
auto const f([](/*some args*/){/*some stuff*/});
register_callback(f);
然后它工作正常。 (对我来说)特别感兴趣的是地址消毒器产生的堆栈跟踪:
ASAN:SIGSEGV
=================================================================
==22904==ERROR: AddressSanitizer: SEGV on unknown address 0x7f1582c54701 (pc 0x7f1582c54701 sp 0x7f1582c544a8 bp 0x7f1582c54510 T2)
#0 0x7f1582c54700 ([stack:22906]+0x7fc700)
AddressSanitizer can not provide additional info.
SUMMARY: AddressSanitizer: SEGV ??:0 ??
看起来,好像函数指针指向了堆栈。将 lambda 推入堆栈是否将代码推入堆栈?由于我什么也没捕获,函数指针的位置对我来说是个谜。怎么了?没有使用优化标志。我不是在寻找解决方法。
编辑:显然“+”是工作示例的关键。我不知道为什么有必要。删除 '+' 和带有编译的示例,但 SIGSEGV 将被 clang-3.5
和 gcc-4.9
.
#include <curl/curl.h>
#include <ostream>
#include <iostream>
int main()
{
auto const curl(curl_easy_init());
if (curl)
{
curl_easy_setopt(curl, CURLOPT_URL, "cnn.com");
curl_easy_setopt(curl, CURLOPT_FOLLOWLOCATION, 1L);
/*
auto const f([](char* const ptr, size_t const size, size_t const nmemb,
void* const data)
{
*static_cast<::std::ostream*>(data) << ptr;
return size * nmemb;
}
);
curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION, +f);
*/
curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION,
+[](char* const ptr, size_t const size, size_t const nmemb,
void* const data)
{
*static_cast<::std::ostream*>(data) << ptr;
return size * nmemb;
}
);
curl_easy_setopt(curl, CURLOPT_WRITEDATA, &::std::cout);
curl_easy_perform(curl);
curl_easy_cleanup(curl);
}
return 0;
}
curl_easy_setopt
定义为(在 curl/easy.h
中):
CURL_EXTERN CURLcode curl_easy_setopt(CURL *curl, CURLoption option, ...);
这意味着第三个参数 param
必须是可以作为 C 可变参数传递的类型。不幸的是,虽然 curl_easy_setopt
需要一个函数指针,但传递 class 对象(并且 lambda 是 class 对象)是“有条件地支持实现定义的语义" ([expr.call]/7),因此编译器接受它,但随后 curl_easy_setopt
试图将 lambda 对象解释为函数指针,具有灾难性结果。
您实际传递的对象是一个无捕获的 lambda,这意味着它是一个空的 class 对象,大小为 1 个字节(所有派生对象的大小必须至少为一个字节)。编译器将该参数提升为字长整数(32 位为 4 个字节,64 位为 8 个字节)并传递 0
或保留 register/stack 插槽未设置,这意味着垃圾得到通过(因为 lambda 在调用时实际上并不使用其内存占用)。
我刚刚用 libcurl 写了一个类似的 lambda,然后崩溃了,仔细检查后,我得到了以下代码,运行正常。
神奇的是,在非捕获的 lambda 表达式中添加前导 +
,这将触发转换为普通 C 函数指针。
curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION,
/* NOTE: Leader '+' trigger conversion from non-captured Lambda Object to plain C pointer */
+[](void *buffer, size_t size, size_t nmemb, void *userp) -> size_t {
// invoke the member function via userdata
return size * nmemb;
});
我的理解是,curl_easy_setopt()
想要一个void*
,而不是显式函数类型,所以编译器只给出了lambda OBJECT的地址;如果我们对 lambda 对象进行函数指针操作,编译器将 return 来自 lambda 对象的函数指针。