选择具有模糊选项的最快搜索引擎
Choose the quickest search engine with fuzzy option
目前我们有 ASP.Net 应用程序,其搜索基于 Lucene.Net 3.0.3。我们将实施搜索服务以处理超过 250 万个项目,并且有类似的问题,在这种情况下哪种搜索引擎最快。
我们知道 Lucene.Net 基于经典的 Java Lucene 原则,理想情况下它应该具有几乎相同的速度。但是我们发现 Lucene.Net 3.0.3 引擎在模糊搜索速度上存在问题。
我们找到了一些解释为什么 Lucene 中模糊搜索的性能不好(根据我们的数据,每个请求需要 6-8 秒):Solr/Lucene fuzzy search too slow
我们还描述了使用 Lucene.Net 3.0.3 的速度问题 here
所以我们为 Lucene 社区和所有有经验的 IT 专业人员列出了问题列表:
- 从 .Net 迁移到 Java 有意义吗?
- 您是否看到任何其他替代方法来处理如此大量的数据?
- 有没有这样的经验,能分享一些根据Lucene模糊搜索的数字吗? (我们对 250 万索引的每个搜索请求有 4-8 秒的时间,请参阅上面的 link 以了解更多详细信息)
- 您有使用 FlexLucene 的经验吗?比Lucene.Net好吗?
谢谢。
我建议您升级到更新版本的 Lucene,因为模糊搜索的性能已经显着提高(通过利用有限状态机)。
目前我们有 ASP.Net 应用程序,其搜索基于 Lucene.Net 3.0.3。我们将实施搜索服务以处理超过 250 万个项目,并且有类似的问题,在这种情况下哪种搜索引擎最快。
我们知道 Lucene.Net 基于经典的 Java Lucene 原则,理想情况下它应该具有几乎相同的速度。但是我们发现 Lucene.Net 3.0.3 引擎在模糊搜索速度上存在问题。 我们找到了一些解释为什么 Lucene 中模糊搜索的性能不好(根据我们的数据,每个请求需要 6-8 秒):Solr/Lucene fuzzy search too slow
我们还描述了使用 Lucene.Net 3.0.3 的速度问题 here
所以我们为 Lucene 社区和所有有经验的 IT 专业人员列出了问题列表:
- 从 .Net 迁移到 Java 有意义吗?
- 您是否看到任何其他替代方法来处理如此大量的数据?
- 有没有这样的经验,能分享一些根据Lucene模糊搜索的数字吗? (我们对 250 万索引的每个搜索请求有 4-8 秒的时间,请参阅上面的 link 以了解更多详细信息)
- 您有使用 FlexLucene 的经验吗?比Lucene.Net好吗?
谢谢。
我建议您升级到更新版本的 Lucene,因为模糊搜索的性能已经显着提高(通过利用有限状态机)。