Cloudant:运行 天气报告检查集群健康状况时出错

Cloudant : Error with running weatherreport to check cluster health

我们有三个节点集群设置并面临 运行 天气报告命令的问题。 通过查看错误,很明显 weatherreport 实用程序所在的机器 运行ning 无法连接到其他两台机器。我已经检查了所有机器,并且可以使用 fqdn 访问它们。但是从消息来看,它似乎在连接到对等计算机时使用了短名称。那么如何检查它从哪里获取对等机器名称呢?所以我可以尝试将它们更改为完整的机器名称,这可能对我有用。如果有任何其他解决方案,请告诉我们。

出现错误

['cloudant_diag17506@machine2031.domain.com'] [crit] Could not run check weatherreport_check_safe_to_rebuild on cluster node 'cloudant@machine2031'
['cloudant_diag17506@machine2031.domain.com'] [crit] Could not run check weatherreport_check_safe_to_rebuild on cluster node 'cloudant@machine2032'
['cloudant_diag17506@machine2031.domain.com'] [crit] Could not run check weatherreport_check_safe_to_rebuild on cluster node 'cloudant@machine2033'

['cloudant@machine2032.domain.com'] [crit] Rebuilding this node will leave the following shard with NO live copies: default/t_alpha e0000000-ffffffff, default/t_alpha a0000000-bfffffff, default/t_alpha 60000000-7fffffff, default/t_alpha 20000000-3fffffff, default/metrics_app e0000000-ffffffff, default/metrics_app a0000000-bfffffff, default/metrics_app 60000000-7fffffff, default/metrics_app 20000000-3fffffff

我找到了这个问题的解决方案。 这是第一次创建数据库时使用短名称的问题,因此在数据库中它可能引用短名称以连接到其他对等主机。

既然 Cloudant Local 安装处于问题阶段,要使其保持一致,将删除所有数据库节点上 /srv/cloudant/ 下的所有文件。这将删除所有默认的 Cloudant 数据库。然后像以前一样在每个节点上再次 运行 configure.sh 脚本,但现在 "hostname -f" 正确输出完全限定的主机名,然后再次创建数据库。