来自 pthread_exit 的错误退出值

Question

下面的代码简单地创建了两个线程并尝试获取它们的 return 个值。

我已经在 32 位 glibc-2.15 系统上编译并运行它，一切正常（输出：r1: 1，r2: 2）。然而，当我在 64 位 glibc-2.17 系统上做同样的事情时，输出是错误的（输出：r1：0，r2：2）。为什么相同的代码在不同的系统上表现不同？

注意：如果 r1 和 r2 的类型更改为 void* 或 int*，如下所述，代码在两个系统上都有效。

#include <stdio.h>
#include <pthread.h>
#include <unistd.h>
#include <string.h>

void* worker(void* arg) {
    int i = (int) arg;
    pthread_exit((void*)i);
}

int main(int argc, char** argv) {

    pthread_t tid[2];
    int err = 0;
    err = pthread_create(&tid[0], NULL, worker, (void*) 1);
    if(err != 0) printf("error: %s\n", strerror(err));
    err = pthread_create(&tid[1], NULL, worker, (void*) 2);
    if(err != 0) printf("error: %s\n", strerror(err));

    ///*
    int r1 = 0, r2 = 0; // <-- WRONG: r1: 0, r2: 2
    //void *r1, *r2; // <-- OK: r1: 1, r2: 2
    pthread_join(tid[0], (void**) &r1);
    pthread_join(tid[1], (void**) &r2);
    printf("r1: %d, r2: %d\n", (int) r1, (int) r2);
    //*/

    // make comment above snippet and uncomment below snippet: // <-- OK: r1: 1, r2: 2 
    /*
    int *r1 = (int*) malloc(sizeof(int));
    int *r2 = (int*) malloc(sizeof(int));
    pthread_join(tid[0], (void**) r1);
    pthread_join(tid[1], (void**) r2);
    printf("r1: %d, r2: %d\n", (int)(*r1), (int)(*r2));
    */
    return 0;
}

Answer 1

简短回答：在 64 位系统上，sizeof(void*) != sizeof(int)，通过将 &int 传递给 pthread_join，您将调用未定义的行为（并破坏堆栈；运行 Address Sanitizer 下的那个程序变体应该检测到错误）。

在您传递 &int 但 int 是堆分配的情况下，您正在破坏堆，但您还没有注意到（您的程序可能会崩溃稍后 malloc 或 free）。运行 Valgrind 或 Address Sanitizer 下的程序变体应该可以向您证明堆损坏。

更长的答案：pthread_join(tid, &x) 基本上执行此操作：

memcpy(&x, previosly_used_pthread_exit_value, sizeof(void*));

现在应该很清楚，传入任何 sizeof(x) < sizeof(void*) 调用未定义行为的变量的地址。

来自 pthread_exit 的错误退出值

Wrong exit value from pthread_exit

linux

glibc

pthread-join