OS X 10.10 上 ucontext makecontext 的分段错误

Segmentation fault with ucontext makecontext on OS X 10.10

#include <stdio.h>
#include <stdlib.h>
#define _XOPEN_SOURCE 600
#include <ucontext.h>

/* Tests creation.
   Should print "Hello World!" */

typedef struct thread_t{
  ucontext_t thread_context;
}thread_t;

void *thr1(void *in) {
  printf("Hello World!\n");
  fflush(stdout);
  return NULL;
}

void *thr2(void *in) {
  printf("goodbye World!\n");
  fflush(stdout);
  return NULL;
}

int main() {
  thread_t t1;
  thread_t t2;

  thread_create( &t1, thr1, NULL);
  // if you comment out the following line, the program will run like a charm. 
  thread_create( &t2, thr2, NULL);
  setcontext(&t1.thread_context);

  return EXIT_SUCCESS;
}

void thread_routine(void *(*start_routine)(void *), void *arg)
{
  start_routine(arg);
  printf("gtthread routine finished\n");
}

int thread_create(thread_t *thread,
        void *(*start_routine)(void *),
        void *arg){
  if (getcontext(&(thread->thread_context)) == -1)
  {
    perror("getcontext");
  }

  thread->thread_context.uc_stack.ss_sp = (char*) malloc(SIGSTKSZ);
  thread->thread_context.uc_stack.ss_size = SIGSTKSZ;
  thread->thread_context.uc_link = NULL;

  makecontext(&(thread->thread_context), thread_routine, 2, (void *)start_routine, arg);
}

我 运行 我的代码在 OS X 10.10 和 gcc 中。我正在尝试实现一个用户上下文库。

如果我注释掉thread_create( &t2, thr2, NULL);,代码将产生预期的效果。我不知道为什么与 t2 相关的行会导致 t1.

的分段错误

作者注释

切换到 Ubuntu 后,我很高兴地致力于实现用户上下文库。一切正常。不再有分段错误。正如预期的那样,它在 OS X 10.10 上崩溃。

我的猜测是,由于 makecontext()、swapcontext() 等在 OS X 上已被弃用,正如编译器警告的那样,自 10.6 以来,我不应该期望它会起作用。

我想,你说 "thread.h",你为什么要使用线程 如果你可以试试

您的程序存在一些缺陷,其中一些缺陷导致程序产生未定义的行为。未定义的行为可能会完全按照您的预期表现出来,但如果它碰巧在某些特定环境中出现过一次,则没有任何理由期望它会再次出现——不是在那个环境中,并且当然不是在不同的环境中。

以下是我注意到的更严重的问题:

  • thread_routine() 没有正确的 return 类型或上下文启动函数的参数类型。上下文启动函数预计 return void(即什么都没有)而不是 void *,这是完全不同的。此外,传递给它的实际参数(如果有的话)都将是 int 类型。因此,当您的程序由于 setcontext() 而调用此函数时,会产生未定义的行为。在函数指针和对象指针的大小都与 int 相同的机器上,您可能会侥幸逃脱,但在其他机器上,程序可能会严重崩溃。这可能是您观察到的段错误的原因。

  • thread_create() 中,您将 thread->thread_context.uc_link 初始化为 NULL。这本身并不是一个错误,但从更大的角度来看,它会产生这样的效果,即当上下文的启动函数 returns 时,它所在的 (OS) 线程 运行 将出口。据推测,您更愿意有机会在不同的环境中交换。

  • 您使用 setcontext() 切换到 t1 上下文。如果成功,此调用不会 return 既不会当时也不会稍后,让您无法稍后切换到 t2 上下文。但实际上,当 t1 的启动函数 returns(见上文)时,线程和整个程序无论如何都会退出,所以这对你来说没有实际意义。不过,就其价值而言,您可能应该改用 swapcontext()

  • thread_create() 声明为 return 和 int,但它没有 return 声明。

顺便说一句,

gcc 应该针对其中一些问题发出警告。如果不是,则调高警告级别。 -Wall 级别应该足够了,但我经常打开 -Wextra 来查找问题。有时您可以安全地忽略一些警告(尤其是 -Wextra),但您应该对每个警告分别进行评估。