HA k3s 设置中的容错

Fault tolerance in HA k3s setup

我正在尝试设置一个 HA k3s 集群,其中嵌入了 etcd 作为数据存储,服务器上有一些虚拟机 运行 和一些树莓派。

我想我明白了 kubernetes 和 k3s 背后的所有概念,但是有一件事我不明白,那就是有多少服务器(etcd,控制平面)可以离线以使集群仍然运行.我尝试查找有关此主题的更多信息 this post,但似乎没有任何内容可以回答我的问题:

如果我在集群中有 3 个服务器,集群是否仍然可以运行,只有一个服务器在线,另外 2 个服务器离线?

我对 k3s 一无所知,对 k8s 也知之甚少,但从 etcd 的角度来看 https://etcd.io/docs/v3.5/faq/#what-is-failure-tolerance 很好地回答了你的问题。

TL;DR;

您需要集群中的大多数服务器在线才能使集群正常工作,因此您需要集群中至少有 3 台服务器才能在一台服务器离线时幸存下来。