如何找到 k8s 节点处于 Ready,SchedulingDisabled 状态的原因

How to find reason why k8s node in Ready,SchedulingDisabled

每天都会发生一些变化,我的节点会将其状态更改为 Ready,SchedulingDisabled。 我检查了 kubectl describe node mynode,但什么也没找到。 kubectl uncordon 只帮助了几个小时。 如何对我的集群进行故障排除?我使用 opensuse kubic, cluster created with kubicctl and salt 谢谢。

根据 Api docs,布尔标志通过向 Kubernetes API 服务器公开的节点 API /api/v1/nodes/nodename 发出补丁请求更新为真。当发生这种情况时,kubectl events 中也会有一个事件

+ kubectl get events
LAST SEEN   TYPE     REASON               OBJECT                    MESSAGE
5m26s       Normal   NodeNotSchedulable   node/kind-control-plane   Node kind-control-plane status is now: NodeNotSchedulable

因此增加 Kubernetes API 服务器的日志记录详细程度以监视并查明补丁请求何时到达 API 并关联是否有任何 activity(cordon) 正在进行在那段时间在集群中。