Lucene StoredField 与 StringField 性能对比

Lucene StoredField vs StringField performance

在 lucene 索引部分,我开始使用 StoredField,我不需要索引字段(在我对相同字段使用 StringField 之前)。

这基本上是为了减少一些索引space。

我正在处理包含 100 万条记录的文件,但我没有看到任何性能差异。但很快我可能不得不处理超过 1 亿条记录。

所以,我想知道当我使用 StoredField 与 StringField 相比会有任何性能影响吗?

谢谢 香卡

我猜你的任务是 I/O-bound 而不是 CPU,因为大部分时间花在文档合并上而不是简化索引(对于 StringField,是非常便宜)。

分析可能有助于揭示这个猜测是否不正确。