以分布式方式在 SOLR 中执行大量分面日期查询

Executing huge number of faceted date queries in SOLR in a distributed manner

我从事的一个项目需要尽快在 SOLR 上执行大量日期分面查询。

请你推荐合适的方法。

我正在探索 spark-solr 库以通过 Spark 将多个并行查询发送到 solr。但不确定这是否是最好的方法。

每个 Solr 搜索都是它自己的线程,因此发出并发请求是增加吞吐量的既定方法。 Solr 中的日期分面(或真正的范围分面)依赖于 FilterCache 的性能,因此请确保它足够大;在你的情况下,它应该比你的构面设置中的桶数多一点。您可以通过 Solr 管理界面检查缓存状态,以确保驱逐次数较低。