SolrCloud 上完全重建索​​引的频率

Frequency of Full reindex on SolrCloud

我需要多久 运行 在 SolrCloud 上完全重建索​​引? 完全重建索​​引到 运行 需要超过 12 小时,我们每晚都 运行 它,但真的有必要正确地以 delta 运行 的形式进行。 新数据以每 30 秒每个增量 2000 个文档的速度传入。 总索引大小:20GB 索尔:6.5.2

如果 delta 运行 正确,则根本不需要 运行 重建索引。例外情况可能是您在索引运行时没有禁用任何合并;在那种情况下,您可能最终会得到一个非常零散的索引文件,而 reindex 最终会构建一个完整的集合作为单个索引文件,但通常不是 Solr 的配置方式,如果是 - 它已经完成了原因。

所以 - 如果您的 delta 工作正常并且您 运行 Solr 具有相当标准的设置,您可以安全地跳过重建索引,除非您从一个空索引开始(或者模式有改变了)。但要确保这也包括删除——重建索引可能不包括删除的元素,所以问题就变成了你的增量导入是否也处理删除。

None 我们基于 Solr 的服务完全重新索引 - 一切都是通过实时更新和适当的合并因素完成的。