Airflow Scheduler - 临时存储 - 已驱逐
Airflow Scheduler - Ephemeral Storage - Evicted
我一直在 运行关注我的气流调度程序应该是一个简单的问题。每隔几周,调度程序就会变成 Evicted
。当我 运行 在 pod 上描述时,问题是因为 The node was low on resource: ephemeral-storage. Container scheduler was using 14386916Ki, which exceeds its request of 0.
问题有两个。首先,为什么调度程序使用临时存储?其次,在 eks 上 运行ning 时是否可以添加临时存储?
谢谢!
我相信 Ephemeral Storage 不是 Airflow 的问题,更多的是你的 K8S 集群的配置问题。
假设我们谈论的是 OpenShift 的临时存储:
https://docs.openshift.com/container-platform/4.9/storage/understanding-ephemeral-storage.html
这可以在您的集群中配置,它将使“/var/log”变得短暂。
我认为问题在于 /var/logs
已满。可能是一些系统日志(不是来自 airlfow,而是来自同一容器中的其他一些进程 运行)。我认为解决方案是定期清理该系统日志。
例如,我们有这个清理 Airlfow 日志的脚本:
https://github.com/apache/airflow/blob/main/scripts/in_container/prod/clean-logs.sh
我一直在 运行关注我的气流调度程序应该是一个简单的问题。每隔几周,调度程序就会变成 Evicted
。当我 运行 在 pod 上描述时,问题是因为 The node was low on resource: ephemeral-storage. Container scheduler was using 14386916Ki, which exceeds its request of 0.
问题有两个。首先,为什么调度程序使用临时存储?其次,在 eks 上 运行ning 时是否可以添加临时存储?
谢谢!
我相信 Ephemeral Storage 不是 Airflow 的问题,更多的是你的 K8S 集群的配置问题。
假设我们谈论的是 OpenShift 的临时存储:
https://docs.openshift.com/container-platform/4.9/storage/understanding-ephemeral-storage.html
这可以在您的集群中配置,它将使“/var/log”变得短暂。
我认为问题在于 /var/logs
已满。可能是一些系统日志(不是来自 airlfow,而是来自同一容器中的其他一些进程 运行)。我认为解决方案是定期清理该系统日志。
例如,我们有这个清理 Airlfow 日志的脚本:
https://github.com/apache/airflow/blob/main/scripts/in_container/prod/clean-logs.sh