unshare --pid /bin/bash - fork 无法分配内存

Question

我正在试验 linux 命名空间。特别是 pid 命名空间。

我想我会用 bash 来测试一些东西，但是运行这个问题：

unshare -p /bin/bash
bash: fork: Cannot allocate memory

运行 ls 从那里给出了核心转储。退出是唯一的可能。

为什么要这样做？

Answer 1

这并没有解释为什么会发生这种情况，而是展示了如何在新的 pid 命名空间中正确启动 shell：

使用 -f 标志从 unshare:

中分叉出 shell

unshare -fp /bin/bash

您还需要传递 --mount-proc 选项以确保 shell 将在新创建的命名空间中获得 PID 1:

unshare -fp --mount-proc /bin/bash

现在运行ps:

# ps
   PID TTY          TIME CMD
 1 pts/1    00:00:00 bash
11 pts/1    00:00:00 ps

Answer 2

该错误是由于 PID 1 进程退出到新命名空间造成的。

在bash开始到运行之后，bash会fork几个新的子进程做一些事情。如果您运行不使用 -f 取消共享，bash 将具有与当前 "unshare" 进程相同的 pid。当前"unshare"进程调用unshare系统调用，创建新的pid命名空间，但是当前"unshare"进程不在新的pid命名空间中。这是linux内核期望的行为：进程A创建一个新的命名空间，进程A本身不会被放入新的命名空间，只有进程A的子进程会被放入新的命名空间。所以当你运行:

unshare -p /bin/bash

unshare进程会执行/bin/bash，/bin/bash会fork出几个子进程，bash的第一个子进程会成为新命名空间的PID 1，子进程将在完成其工作后退出。所以新命名空间的PID 1退出。

PID 1 进程有一个特殊的功能：它应该成为所有孤儿进程的父进程。如果根命名空间中的 PID 1 进程退出，内核将崩溃。如果子命名空间中的 PID 1 进程退出，linux 内核将调用 disable_pid_allocation 函数，该函数将清除该命名空间中的 PIDNS_HASH_ADDING 标志。当linux内核创建一个新进程时，内核会调用alloc_pid函数在命名空间中分配一个PID，如果PIDNS_HASH_ADDING标志没有设置，alloc_pid函数将return -ENOMEM 错误。这就是您收到 "Cannot allocate memory" 错误的原因。

您可以使用“-f”选项解决此问题：

unshare -fp /bin/bash

如果您运行使用“-f”选项取消共享，取消共享将在创建新的 pid 命名空间后派生一个新进程。而新进程中的运行/bin/bash。新进程将是新 pid 命名空间的 pid 1。然后bash也会fork几个子进程做一些工作。由于bash本身就是新的pid命名空间的pid 1，它的子进程可以正常退出。

unshare --pid /bin/bash - fork 无法分配内存

unshare --pid /bin/bash - fork cannot allocate memory

linux

bash

linux-namespaces