将 okd 集群从 3.6 升级到 3.7 的问题(试图将其完全升级到最新版本)

Issues upgrade okd cluster from 3.6 to 3.7 (trying to get it fully to the latest)

我正在 运行 在实验室环境中进行自动就地升级,以便我可以在更新我们更常用的开发人员环境之前进行测试。 运行 升级剧本执行无任何错误。我重新启动了所有节点,然后继续进行测试,但我遇到了服务网络故障。 Pods 已部署无法访问 172.30.0.0 网络上的任何内容。我已经确认我无法在 172.30.0.1 端点上访问 kubernetes api 并收到 "no route to host" 消息。进一步调查,似乎在升级 none 之后,正在为 172.30.0.x 地址创建 iptables NAT 规则。我查看了文档,看看清单文件中是否遗漏了什么,但我没有看到任何明显的东西。从那以后,我将机器回滚到升级前的快照,并进行了测试以验证所有网络是否正常工作,确实如此。再次执行升级会产生相同的结果。有人曾经 运行 参与过这个吗?

它看了 24 小时后终于决定 post 了,我会在几个小时后弄清楚。看起来这是 kube 代理的问题:

https://github.com/kubernetes/kubernetes/issues/58956

我正在使用 openshift-ansible 的最新版本 3.6 分支进行升级,但显然它仍然是一个问题。通过降级修复:

yum 降级 http://vault.centos.org/centos/7.5.1804/updates/x86_64/Packages/iptables-1.4.21-24.1.el7_5.x86_64.rpm http://vault.centos.org/centos/7.5.1804/updates/x86_64/Packages/iptables-services-1.4.21-24.1.el7_5.x86_64.rpm