runit 会获取孤儿进程吗?

Does runit reap orphan processes?

我正在编写一个基于 Phusion baseimage 的小型 Docker 容器,它提供开箱即用的 runit。

我将 Cassandra 和 Opscenter 代理放入我的容器中。两者都在 /etc/service 下作为服务启动(如文档中所述)。

这个 blog post 提到 my_init 会收集僵尸进程,但对于它对孤立进程的作用含糊不清。

这是我的 Docker 容器中 ps -ef 的示例输出:

UID        PID  PPID  C STIME TTY          TIME CMD
root         1     0  0 06:05 ?        00:00:00 /usr/bin/python3 -u /sbin/my_init
root        27     1  0 06:05 ?        00:00:00 /usr/bin/runsvdir -P /etc/service
root        28    27  0 06:05 ?        00:00:00 runsv sshd
root        29    27  0 06:05 ?        00:00:00 runsv syslog-ng
root        30    27  0 06:05 ?        00:00:00 runsv cron
root        31    27  0 06:05 ?        00:00:00 runsv cassandra
root        32    27  0 06:05 ?        00:00:00 runsv syslog-forwarder
root        33    27  0 06:05 ?        00:00:00 runsv opscenter-agent
root        34    32  0 06:05 ?        00:00:00 tail -F -n 0 /var/log/syslog
root        35    30  0 06:05 ?        00:00:00 /usr/sbin/cron -f
root        36    29  0 06:05 ?        00:00:00 syslog-ng -F -p /var/run/syslog-ng.pid --no-caps
root        37    31 43 06:05 ?        00:00:10 java -ea -javaagent:/usr/share/cassandra/lib/jamm-0.3.0.jar -XX:+CMSClassUnloadingEnabled -XX:+UseThreadPriorities -XX:ThreadPrio
root        38    33  0 06:05 ?        00:00:00 /bin/bash /usr/local/opscenter/datastax-agent-5.2.0/bin/datastax-agent -f
root       471    38 51 06:05 ?        00:00:11 /usr/lib/jvm/jre1.8.0_51/bin/java -Dagent-foreground=yes -Xmx128M -Djclouds.mpu.parts.magnitude=100000 -Djclouds.mpu.parts.size=1
root       494     0  0 06:05 ?        00:00:00 bash
root       761   494  0 06:05 ?        00:00:00 ps -ef

注意 runsv opscenter-agent (pid 33) 启动一个子进程,它是一个 bash 调用 (pid 38) 与子进程 (pid 471)。

然后我运行 sv stop opscenter-agent, ps -ef:

UID        PID  PPID  C STIME TTY          TIME CMD
root         1     0  0 06:05 ?        00:00:00 /usr/bin/python3 -u /sbin/my_init
root        27     1  0 06:05 ?        00:00:00 /usr/bin/runsvdir -P /etc/service
root        28    27  0 06:05 ?        00:00:00 runsv sshd
root        29    27  0 06:05 ?        00:00:00 runsv syslog-ng
root        30    27  0 06:05 ?        00:00:00 runsv cron
root        31    27  0 06:05 ?        00:00:00 runsv cassandra
root        32    27  0 06:05 ?        00:00:00 runsv syslog-forwarder
root        33    27  0 06:05 ?        00:00:00 runsv opscenter-agent
root        34    32  0 06:05 ?        00:00:00 tail -F -n 0 /var/log/syslog
root        35    30  0 06:05 ?        00:00:00 /usr/sbin/cron -f
root        36    29  0 06:05 ?        00:00:00 syslog-ng -F -p /var/run/syslog-ng.pid --no-caps
root        37    31 19 06:05 ?        00:00:11 java -ea -javaagent:/usr/share/cassandra/lib/jamm-0.3.0.jar -XX:+CMSClassUnloadingEnabled -XX:+UseThreadPriorities -XX:ThreadPrio
root       471     1 20 06:05 ?        00:00:11 /usr/lib/jvm/jre1.8.0_51/bin/java -Dagent-foreground=yes -Xmx128M -Djclouds.mpu.parts.magnitude=100000 -Djclouds.mpu.parts.size=1
root       494     0  0 06:05 ?        00:00:00 bash
root       768   494  0 06:06 ?        00:00:00 ps -ef

请注意,pid 38 已消失,但 pid 471 现在附加到 my_init

这是正确的行为吗?子进程reap怎么办?

my_init 采用孤立进程并收获它们。但是你误解了 "reaping" 的意思。 my_init 不告诉它退出; my_init 等待 直到它退出。您(或进程)仍然有责任确保它退出。