来自 pthread_exit 的错误退出值

Wrong exit value from pthread_exit

下面的代码简单地创建了两个线程并尝试获取它们的 return 个值。

我已经在 32 位 glibc-2.15 系统上编译并 运行 它,一切正常(输出:r1: 1,r2: 2)。然而,当我在 64 位 glibc-2.17 系统上做同样的事情时,输出是错误的(输出:r1:0,r2:2)。为什么相同的代码在不同的系统上表现不同?

注意:如果 r1 和 r2 的类型更改为 void*int*,如下所述,代码在两个系统上都有效。

#include <stdio.h>
#include <pthread.h>
#include <unistd.h>
#include <string.h>

void* worker(void* arg) {
    int i = (int) arg;
    pthread_exit((void*)i);
}

int main(int argc, char** argv) {

    pthread_t tid[2];
    int err = 0;
    err = pthread_create(&tid[0], NULL, worker, (void*) 1);
    if(err != 0) printf("error: %s\n", strerror(err));
    err = pthread_create(&tid[1], NULL, worker, (void*) 2);
    if(err != 0) printf("error: %s\n", strerror(err));

    ///*
    int r1 = 0, r2 = 0; // <-- WRONG: r1: 0, r2: 2
    //void *r1, *r2; // <-- OK: r1: 1, r2: 2
    pthread_join(tid[0], (void**) &r1);
    pthread_join(tid[1], (void**) &r2);
    printf("r1: %d, r2: %d\n", (int) r1, (int) r2);
    //*/

    // make comment above snippet and uncomment below snippet: // <-- OK: r1: 1, r2: 2 
    /*
    int *r1 = (int*) malloc(sizeof(int));
    int *r2 = (int*) malloc(sizeof(int));
    pthread_join(tid[0], (void**) r1);
    pthread_join(tid[1], (void**) r2);
    printf("r1: %d, r2: %d\n", (int)(*r1), (int)(*r2));
    */
    return 0;
}

简短回答:在 64 位系统上,sizeof(void*) != sizeof(int),通过将 &int 传递给 pthread_join,您将调用未定义的行为(并破坏堆栈;运行 Address Sanitizer 下的那个程序变体应该检测到错误)。

在您传递 &intint 是堆分配的情况下,您正在破坏堆,但您还没有注意到(您的程序可能会崩溃稍后 mallocfree)。 运行 Valgrind 或 Address Sanitizer 下的程序变体应该可以向您证明堆损坏。

更长的答案:pthread_join(tid, &x) 基本上执行此操作:

memcpy(&x, previosly_used_pthread_exit_value, sizeof(void*));

现在应该很清楚,传入任何 sizeof(x) < sizeof(void*) 调用未定义行为的变量的地址。