如何调试此 Kubernetes coreDNS 错误?
How do I debug this Kubernetes coreDNS error?
我的 coredns pod 日志中的这个错误是什么意思,我该如何调试它?
[ERROR] plugin/errors: 2 2858211404501823821.6843583298703021155. HINFO: read udp 192.168.27.16:47449->67.207.67.3:53: i/o timeout
行为很奇怪。
单个测试pod会正确执行curl命令,但网络不会。
此外,每个节点都能够与其他每个节点通信。
据我所知,自网络上次“按预期”运行以来,我没有更改任何相关配置。
更新:
所以我不知道这是否算作解决方案,但我删除了所有 pods (包括 coreDNS)并允许它们重新启动。系统现在可以工作了。
我会保留这个问题并将其标记为已解决,以防万一有人不知道这个漂亮的命令(不要在生产集群上使用)
kubectl delete po -A --all
我删除了所有 pods(包括 coreDNS)并让它们重新启动。系统现在可以工作了。
我会保留这个问题并将其标记为已解决,以防万一有人不知道这个漂亮的命令(不要在生产集群上使用)
kubectl delete po -A --all
另一种方法(可能更安全)是:
kubectl -n kube-system rollout restart deployment coredns
感谢@Richard_Bateman
我的 coredns pod 日志中的这个错误是什么意思,我该如何调试它?
[ERROR] plugin/errors: 2 2858211404501823821.6843583298703021155. HINFO: read udp 192.168.27.16:47449->67.207.67.3:53: i/o timeout
行为很奇怪。
单个测试pod会正确执行curl命令,但网络不会。 此外,每个节点都能够与其他每个节点通信。
据我所知,自网络上次“按预期”运行以来,我没有更改任何相关配置。
更新: 所以我不知道这是否算作解决方案,但我删除了所有 pods (包括 coreDNS)并允许它们重新启动。系统现在可以工作了。
我会保留这个问题并将其标记为已解决,以防万一有人不知道这个漂亮的命令(不要在生产集群上使用)
kubectl delete po -A --all
我删除了所有 pods(包括 coreDNS)并让它们重新启动。系统现在可以工作了。
我会保留这个问题并将其标记为已解决,以防万一有人不知道这个漂亮的命令(不要在生产集群上使用)
kubectl delete po -A --all
另一种方法(可能更安全)是:
kubectl -n kube-system rollout restart deployment coredns
感谢@Richard_Bateman