ArangoDB集群在一个节点故障后停止

Question

我有 3 个节点的 ArangoDB 集群。第一个有 service.config :

> ExecStart=/usr/bin/arangodb \
        --starter.data-dir=/var/lib/arangodb3/cluster \
        --server.storage-engine=rocksdb \
        --auth.jwt-secret=/etc/arangodb3/arangodb.secret \
        --agents.agency.supervision-grace-period=30 \
        --log.file=true \
        --log.dir=/var/log/arangodb3/cluster \
        --log.verbose
TimeoutStopSec=60

和另外两个节点有：

> ExecStart=/usr/bin/arangodb \
        --starter.data-dir=/var/lib/arangodb3/cluster \
        --server.storage-engine=rocksdb \
        --auth.jwt-secret=/etc/arangodb3/arangodb.secret \
        --agents.agency.supervision-grace-period=30 \
        --starter.join arangodb01.domain.com \
        --log.file=true \
        --log.dir=/var/log/arangodb3/cluster \
        --log.verbose

它工作正常，直到任何节点停止。一个节点停止后，没有处理任何请求。我只在“[root@arangodb01 ~]# journalctl -u arangodb”中看到：

>We're master, try to remain it component=arangodb\
>Master changed callback from [arangobd01 IP]:57722 component=arangodb\
>Received GET /hello request from [arangobd02 IP]:38436 component=arangodb

如果集群中只有 2 个节点工作，是否可以工作？

UPD：我遇到分片迁移问题/这是我的集群的问题

Answer 1

终于找到了“坏”分片的原因。对于您在集群中创建的每个集合，请检查集合信息部分中的“replicationFactor”。默认情况下它是 1，如果你在 API 的帮助下创建它，它是“replicationFactor: (cluster only)”

ArangoDB集群在一个节点故障后停止

ArangoDB cluster stop after one node failure

arangodb