Solr Cloud - Solr 挂起/无法启动或无法完全创建集合:<collection_name>

Solr Cloud - Solr Hanging / can't start OR Could not fully create collection: <collection_name>

我的 creation/deletion Solr 集合不再有效。 当我启动创建(通过卷曲)时,我得到以下答案(30 秒后):

Error 500 - Could not fully create collection: <collection_name>

编辑:我还有一次,同样的问题:Solr 无法完全重启,或者挂起。

HDP: 2.6.2
Solr(云):5.5.5
ZK: 3.4.6

我已经为这个问题苦苦挣扎了很多天!

事实上,Zookeeper 中的监督者队列太大了:

zkCli.sh -server zkhost:2181 ls /solr/overseer/queuezkCli.sh -server zkhost:2181 ls /solr/overseer/queue-work 返回了数个 100k 条目并保持增长!

恢复过程:
1. 停止 Solr 节点
2. 删除监督者队列并重新创建它们:
zkCli.sh -server zkhost:2181 rmr /solr/overseer/queue
zkCli.sh -server zkhost:2181 create /solr/overseer/queue
zkCli.sh -server zkhost:2181 rmr /solr/overseer/queue-work null
zkCli.sh -server zkhost:2181 create /solr/overseer/queue-work null
3.启动solr节点

我们在代码中可以看到: https://github.com/apache/lucene-solr/blob/dbed8bafe6ee167361599deaa4f1b5fdbb0b1c32/solr/core/src/java/org/apache/solr/cloud/api/collections/CreateCollectionCmd.java#L170 该代码尝试为 Solr 集合创建节点,然后在 30 秒内轮询 Zookeeper 以检查它是否已创建节点。如果不是,它会失败 "Could not fully create collection:"