How to debug "ERROR: Could not reach the worker node."?

How to debug "ERROR: Could not reach the worker node."?

我正在尝试使用 SSH 凭据在 BlueData 3.7 控制器上设置网关和工作节点。

我相信我已经满足 docs 中的所有先决条件,但是,我在控制器的安装部分尝试安装网关和 worker 时遇到错误 UI :

我得到的两台主机的错误是:

ERROR: Could not reach the worker node.

错误的 URL 是:

我检查了网关和工作器上的日志。两者均显示:

# tree /var/log/bluedata/
/var/log/bluedata/
└── install

1 directory, 0 files

所有主机都可以在没有密码提示的情况下相互连接。

没有防火墙 运行:

# iptables --list
Chain INPUT (policy ACCEPT)
target     prot opt source               destination         

Chain FORWARD (policy ACCEPT)
target     prot opt source               destination         

Chain OUTPUT (policy ACCEPT)
target     prot opt source               destination  

我在使用 tcpdump 侦听 worker 时删除了 worker:

# tcpdump -i eth0  -ttttnnvvS src host x.x.x.x and tcp
tcpdump: listening on eth0, link-type EN10MB (Ethernet), capture size 262144 bytes
2019-08-17 00:08:41.570940 IP (tos 0x0, ttl 64, id 3977, offset 0, flags [DF], proto TCP (6), length 48)
    x.x.x.x.39039 > y.y.y.y.22: Flags [S], cksum 0x6215 (correct), seq 1453535125, win 29200, options [mss 1460,nop,wscale 9], length 0
    ...
    x.x.x.x.46064 > y.y.y.y.22: Flags [F.], cksum 0x564b (correct), seq 1997087540, ack 4031219947, win 238, length 0
2019-08-17 00:14:54.710739 IP (tos 0x0, ttl 64, id 15525, offset 0, flags [DF], proto TCP (6), length 40)
    x.x.x.x.46064 > y.y.y.y.22: Flags [.], cksum 0x564a (correct), seq 1997087541, ack 4031219948, win 238, length 0

检查控制器上的端口 46064,我可以看到它来自光束进程,这让我相信两台机器之间的网络连接正常:

# lsof -i -P -n | grep 46064
beam.smp  12714      root   16u  IPv4 498735      0t0  TCP x.x.x.x:46064->y.y.y.y:22 (ESTABLISHED)

我还能做些什么来调试?

我需要的调试信息可以在工作主机和网关主机的 /tmp 文件夹中找到,例如

/tmp/bd_prechecks.nnnnn.log
/tmp/bd_prechecks.nnnnn.log.xtrace
/tmp/bds-nnnnnnnnnnnnnn.log
/tmp/bds-nnnnnnnnnnnnnn.log.xtrace
/tmp/worker_setup_x.x.x.x-n-n-n-n-n-n
/tmp/worker_setup_x.x.x.x-n-n-n-n-n-n.xtrace

有关详细信息,请参阅 http://docs.bluedata.com/37_step-1-troubleshooting