为什么EKS节点自己变得不可调度

Why does EKS node becomes Unschedulable on its own

我有一个 EKS 集群和一个节点组 运行 6 个节点。对于某些共振节点,随机标记为 unschedulable,一两周一次,并且它们保持这种状态。当我注意到我手动解除封锁并且一切正常时。

为什么会发生这种情况,如何调试、防止或配置集群自动修复?

在我的例子中,问题是 AWS Termination Handler daemonset 那是 运行。它已经过时,并没有真正在集群中使用,在删除它之后,节点被标记为不可调度的问题就消失了。