Docker 容器健康检查停止不健康的容器

Docker container healthcheck stop unhealthy container

我有一个 docker 容器,每 1 分钟进行一次健康检查 运行。我读到将“|| kill 1”附加到 docker 文件中的健康检查可以在健康检查失败后停止容器,但它似乎对我不起作用,我找不到有效的示例。

有人知道如何在标记为不健康后停止容器吗?我目前在我的 docker 文件中有这个:

HEALTHCHECK --start-period=30s --timeout=5s --interval=1m --retries=2 CMD bash /expressvpn/healthcheck.sh || kill 1

编辑 1
Dockerfile

FROM debian:buster-slim

ENV CODE="code"
ENV SERVER="smart"

ARG VERSION="expressvpn_2.6.0.32-1_armhf.deb"

COPY files/ /expressvpn/

 RUN apt-get update && apt-get install -y --no-install-recommends \
expect curl ca-certificates iproute2 wget jq \
&& wget -q https://download.expressvpn.xyz/clients/linux/${VERSION} -O /expressvpn/${VERSION} \
&& dpkg -i /expressvpn/${VERSION} \
&& rm -rf /expressvpn/*.deb \
&& rm -rf /var/lib/apt/lists/* \
&& apt-get purge --autoremove -y wget \
&& rm -rf /var/log/*.log

HEALTHCHECK --start-period=30s --timeout=5s --interval=1m --retries=2 CMD bash /expressvpn/healthcheck.sh || exit 1

ENTRYPOINT ["/bin/bash", "/expressvpn/start.sh"]

healthcheck.sh

if [[ ! -z $DDNS ]];
then
    checkIP=$(getent hosts $DDNS | awk '{ print  }')
else
    checkIP=$IP
fi

if [[ ! -z $checkIP ]];
then
    ipinfo=$(curl -s -H "Authorization: Bearer $BEARER" 'ipinfo.io' | jq -r '.')
    currentIP=$(jq -r '.ip' <<< "$ipinfo")
    hostname=$(jq -r '.hostname' <<< "$ipinfo")
    if [[ $checkIP = $currentIP ]];
    then
        if [[ ! -z $HEALTHCHECK ]];
        then
            curl https://hc-ping.com/$HEALTHCHECK/fail
            expressvpn disconnect
            expressvpn connect $SERVER
            exit 1
        else
            expressvpn disconnect
            expressvpn connect $SERVER
            exit 1
       fi
    else
        if [[ ! -z $HOSTNAME_PART && ! -z $hostname && $hostname != *"$HOSTNAME_PART"* ]];
        then
            #THIS IS WHERE THE CONTAINER SHOULD STOP <------------
            kill 1
        fi

        if [[ ! -z $HEALTHCHECK ]];
        then
            curl https://hc-ping.com/$HEALTHCHECK
            exit 0
        else
            exit 0
        fi
    fi
else
    exit 0
fi

start.sh

#!/usr/bin/bash
cp /etc/resolv.conf /etc/resolv.conf.bak
umount /etc/resolv.conf
cp /etc/resolv.conf.bak /etc/resolv.conf
rm /etc/resolv.conf.bak
service expressvpn restart
expect /expressvpn/activate.sh
expressvpn connect $SERVER

touch /var/log/temp.log
tail -f /var/log/temp.log

exec "$@"

尝试从 kill 更改为 exit 1

HEALTHCHECK --start-period=30s --timeout=5s --interval=1m --retries=2 \
CMD bash /expressvpn/healthcheck.sh || exit 1

Reference from docker docs

编辑 1:

经过一些测试,如果您想在 unhealthy 状态下终止容器,您需要在运行状况检查脚本 /expressvpn/healthcheck.sh 或主机上的脚本中执行此操作。

下面例子容器状态是健康的:

HEALTHCHECK --start-period=30s --timeout=5s --interval=10s --retries=2 CMD bash -c 'echo "0" || kill 1' || exit 1

以下示例容器停止,因为命令 ech 未退出然后 kill 1 被执行并且容器被杀死:

HEALTHCHECK --start-period=30s --timeout=5s --interval=10s --retries=2 CMD bash -c 'ech "0" || kill 1' || exit 1

编辑 2:

经过一番挖掘,我明白了我在一些 docker 文件中看到的内容:

RUN apt update -y && apt install tini -y

ENTRYPOINT ["tini", "--"]
CMD ["./echo.sh"]

根据我得到的 docker 防止 pid 1=entrypoint 进程被 SIGTERM 杀死所以为此你有 tini 小实用程序可以帮助解决这个问题(仍然不确定这个的确切目的是什么我会保留它以备下次我有心情..)。
无论如何,在添加 tini 之后,容器被 kill 1

杀死

谢谢你的提问。

请检查您的健康检查的输出。您必须确保您的健康检查实际上连续失败了 2 次。

docker inspect  --format "{{json .State.Health }}" <container name> | jq