从 child 调用 _exit(errno) 时状态错误

Wrong status when calling _exit(errno) from child

我在调用 execvp() 时故意在 fork() 中使用错误的参数 child。 errno 数字在 child 过程中正确设置为 ENOENT。然后我用 _exit(errno);.

终止 child 进程

我的主进程调用 wait()。当我使用 WIFEXITEDWEXITSTATUS 检查 returned 状态时,我 always 第一次调用时得到 EINVAL。所有其他调用 return 正确的 ENOENT 代码。

我无法解释这种行为。下面是完整的函数,它完成了上述所有事情,但有点复杂。

QVariantMap
System::exec(const QString & prog, const QStringList & args)
{
  pid_t pid = fork();

  if (pid == 0) {
    int cargs_len = args.length() + 2;
    char * cargs[cargs_len];
    cargs[cargs_len - 1] = NULL;

    QByteArrayList as;
    as.push_back(prog.toLocal8Bit());

    std::transform(args.begin(), args.end(), std::back_inserter(as),
        [](const QString & s) { return s.toLocal8Bit(); });

    for (int i = 0; i < as.length(); ++i) {
      cargs[i] = as[i].data();
    }

    execvp(cargs[0], cargs);

    // in case execvp fails, terminate the child process immediately
    qDebug() << "(" << errno << ") " << strerror(errno);  // <----------
    _exit(errno);

  } else if (pid < 0) {
    goto fail;

  } else {

    sigset_t mask;
    sigset_t orig_mask;

    sigemptyset(&mask);
    sigaddset(&mask, SIGCHLD);

    if (sigprocmask(SIG_BLOCK, &mask, &orig_mask) < 0) {
      goto fail;
    }

    struct timespec timeout;
    timeout.tv_sec = 0;
    timeout.tv_nsec = 10 * 1000 * 1000;

    while (true) {
      int ret = sigtimedwait(&mask, NULL, &timeout);

      if (ret < 0) {
        if (errno == EAGAIN) {
          // timeout
          goto win;
        } else {
          // error
          goto fail;
        }

      } else {
        if (errno == EINTR) {
          // not SIGCHLD
          continue;
        } else {
          int status = 0;
          if (wait(&status) == pid) {
            if (WIFEXITED(status)) {
              return { { "error", strerror(WEXITSTATUS(status)) } };
            } else {
              goto fail;
            }
          } else {
            goto fail;
          }
        }
      }
    }
  }

win:
  return {};

fail:
  return { { "error", strerror(errno) } };
}

事实证明,删除带有 qDebug() 调用的行可以使问题消失。为什么添加调试调用会改变程序的行为?

qDebug() << "(" << errno << ") " << strerror(errno);
_exit(errno);

几乎任何对标准库函数的调用都可以修改 errnoqDebug 可能会调用一些 I/O 函数来设置 errno,或者甚至 << I/O 运算符。 errno 不会被大多数成功的调用修改,但是级别越高,您就越不知道幕后没有一些正常的失败调用。因此,您正在打印的 errno 的值不是您传递给 _exit.

errno 的值

作为 errno 的一般原则,如果您要做的事情比打印一次更复杂,请在执行任何其他事情之前将值保存到变量中。

如评论中所述,请注意大多数 Unix 系统(包括所有常见系统)仅传递 8 位值作为退出状态,但 errno 可以大于 255。例如,如果您 运行 该程序在 256 可能是错误代码的系统上调用 _exit(256) 会导致调用者看到 return 代码 0,从而错误地认为成功。

通常将所有错误值折叠到 success/failure 就足够了。如果您需要区分更多,请确保您通过 exit/wait 传递的信息在 0–255 范围内。

int exec_error = errno;
qDebug() << "(" << exec_error << ") " << strerror(exec_error);
_exit(!!exec_error);