来自 pthread_exit 的错误退出值
Wrong exit value from pthread_exit
下面的代码简单地创建了两个线程并尝试获取它们的 return 个值。
我已经在 32 位 glibc-2.15 系统上编译并 运行 它,一切正常(输出:r1: 1,r2: 2)。然而,当我在 64 位 glibc-2.17 系统上做同样的事情时,输出是错误的(输出:r1:0,r2:2)。为什么相同的代码在不同的系统上表现不同?
注意:如果 r1 和 r2 的类型更改为 void*
或 int*
,如下所述,代码在两个系统上都有效。
#include <stdio.h>
#include <pthread.h>
#include <unistd.h>
#include <string.h>
void* worker(void* arg) {
int i = (int) arg;
pthread_exit((void*)i);
}
int main(int argc, char** argv) {
pthread_t tid[2];
int err = 0;
err = pthread_create(&tid[0], NULL, worker, (void*) 1);
if(err != 0) printf("error: %s\n", strerror(err));
err = pthread_create(&tid[1], NULL, worker, (void*) 2);
if(err != 0) printf("error: %s\n", strerror(err));
///*
int r1 = 0, r2 = 0; // <-- WRONG: r1: 0, r2: 2
//void *r1, *r2; // <-- OK: r1: 1, r2: 2
pthread_join(tid[0], (void**) &r1);
pthread_join(tid[1], (void**) &r2);
printf("r1: %d, r2: %d\n", (int) r1, (int) r2);
//*/
// make comment above snippet and uncomment below snippet: // <-- OK: r1: 1, r2: 2
/*
int *r1 = (int*) malloc(sizeof(int));
int *r2 = (int*) malloc(sizeof(int));
pthread_join(tid[0], (void**) r1);
pthread_join(tid[1], (void**) r2);
printf("r1: %d, r2: %d\n", (int)(*r1), (int)(*r2));
*/
return 0;
}
简短回答:在 64 位系统上,sizeof(void*) != sizeof(int)
,通过将 &int
传递给 pthread_join
,您将调用未定义的行为(并破坏堆栈;运行 Address Sanitizer 下的那个程序变体应该检测到错误)。
在您传递 &int
但 int
是堆分配的情况下,您正在破坏堆,但您还没有注意到(您的程序可能会崩溃稍后 malloc
或 free
)。 运行 Valgrind 或 Address Sanitizer 下的程序变体应该可以向您证明堆损坏。
更长的答案:pthread_join(tid, &x)
基本上执行此操作:
memcpy(&x, previosly_used_pthread_exit_value, sizeof(void*));
现在应该很清楚,传入任何 sizeof(x) < sizeof(void*)
调用未定义行为的变量的地址。
下面的代码简单地创建了两个线程并尝试获取它们的 return 个值。
我已经在 32 位 glibc-2.15 系统上编译并 运行 它,一切正常(输出:r1: 1,r2: 2)。然而,当我在 64 位 glibc-2.17 系统上做同样的事情时,输出是错误的(输出:r1:0,r2:2)。为什么相同的代码在不同的系统上表现不同?
注意:如果 r1 和 r2 的类型更改为 void*
或 int*
,如下所述,代码在两个系统上都有效。
#include <stdio.h>
#include <pthread.h>
#include <unistd.h>
#include <string.h>
void* worker(void* arg) {
int i = (int) arg;
pthread_exit((void*)i);
}
int main(int argc, char** argv) {
pthread_t tid[2];
int err = 0;
err = pthread_create(&tid[0], NULL, worker, (void*) 1);
if(err != 0) printf("error: %s\n", strerror(err));
err = pthread_create(&tid[1], NULL, worker, (void*) 2);
if(err != 0) printf("error: %s\n", strerror(err));
///*
int r1 = 0, r2 = 0; // <-- WRONG: r1: 0, r2: 2
//void *r1, *r2; // <-- OK: r1: 1, r2: 2
pthread_join(tid[0], (void**) &r1);
pthread_join(tid[1], (void**) &r2);
printf("r1: %d, r2: %d\n", (int) r1, (int) r2);
//*/
// make comment above snippet and uncomment below snippet: // <-- OK: r1: 1, r2: 2
/*
int *r1 = (int*) malloc(sizeof(int));
int *r2 = (int*) malloc(sizeof(int));
pthread_join(tid[0], (void**) r1);
pthread_join(tid[1], (void**) r2);
printf("r1: %d, r2: %d\n", (int)(*r1), (int)(*r2));
*/
return 0;
}
简短回答:在 64 位系统上,sizeof(void*) != sizeof(int)
,通过将 &int
传递给 pthread_join
,您将调用未定义的行为(并破坏堆栈;运行 Address Sanitizer 下的那个程序变体应该检测到错误)。
在您传递 &int
但 int
是堆分配的情况下,您正在破坏堆,但您还没有注意到(您的程序可能会崩溃稍后 malloc
或 free
)。 运行 Valgrind 或 Address Sanitizer 下的程序变体应该可以向您证明堆损坏。
更长的答案:pthread_join(tid, &x)
基本上执行此操作:
memcpy(&x, previosly_used_pthread_exit_value, sizeof(void*));
现在应该很清楚,传入任何 sizeof(x) < sizeof(void*)
调用未定义行为的变量的地址。