优化大型 SolrCloud 索引中的一个分片
Optimize one shard in large SolrCloud index
我有一个很大的 v5.3 SolrCloud 索引,我只想优化一个分片。我读到虽然可以优化整个索引,但不可能只优化单个分片。尽管如此,我还是想确保:http://grokbase.com/t/lucene/solr-user/153se1jvg4/optimize-solrcloud-without-downtime:“...使用 SolrCloud,任何优化命令都会优化整个集合,一次一个分片副本,无论任何 distrib 参数如何。”
据我从代码中可以看出,不,您不能在单个分片上调用优化。
然而,您所包含的引用是错误的(至少对于某些版本的 Solr)- 任何优化在整个集合中并行执行 运行(至少包含在 4.10 和 6.0 中,不确定5 个分支)。
通常不需要实际调用优化,因为 mergeFactor 应该为您透明地处理这个问题。例外情况是,如果您有一个在初始处理和更新后永远不会改变的高度静态索引。
另请记住,优化至少需要 2 倍的可用磁盘空间 space,并且会占用正在优化索引的服务器上的大量资源。
我有一个很大的 v5.3 SolrCloud 索引,我只想优化一个分片。我读到虽然可以优化整个索引,但不可能只优化单个分片。尽管如此,我还是想确保:http://grokbase.com/t/lucene/solr-user/153se1jvg4/optimize-solrcloud-without-downtime:“...使用 SolrCloud,任何优化命令都会优化整个集合,一次一个分片副本,无论任何 distrib 参数如何。”
据我从代码中可以看出,不,您不能在单个分片上调用优化。
然而,您所包含的引用是错误的(至少对于某些版本的 Solr)- 任何优化在整个集合中并行执行 运行(至少包含在 4.10 和 6.0 中,不确定5 个分支)。
通常不需要实际调用优化,因为 mergeFactor 应该为您透明地处理这个问题。例外情况是,如果您有一个在初始处理和更新后永远不会改变的高度静态索引。
另请记住,优化至少需要 2 倍的可用磁盘空间 space,并且会占用正在优化索引的服务器上的大量资源。