Lucene StoredField 与 StringField 性能对比
Lucene StoredField vs StringField performance
在 lucene 索引部分,我开始使用 StoredField,我不需要索引字段(在我对相同字段使用 StringField 之前)。
这基本上是为了减少一些索引space。
我正在处理包含 100 万条记录的文件,但我没有看到任何性能差异。但很快我可能不得不处理超过 1 亿条记录。
所以,我想知道当我使用 StoredField 与 StringField 相比会有任何性能影响吗?
谢谢
香卡
我猜你的任务是 I/O-bound 而不是 CPU,因为大部分时间花在文档合并上而不是简化索引(对于 StringField
,是非常便宜)。
分析可能有助于揭示这个猜测是否不正确。
在 lucene 索引部分,我开始使用 StoredField,我不需要索引字段(在我对相同字段使用 StringField 之前)。
这基本上是为了减少一些索引space。
我正在处理包含 100 万条记录的文件,但我没有看到任何性能差异。但很快我可能不得不处理超过 1 亿条记录。
所以,我想知道当我使用 StoredField 与 StringField 相比会有任何性能影响吗?
谢谢 香卡
我猜你的任务是 I/O-bound 而不是 CPU,因为大部分时间花在文档合并上而不是简化索引(对于 StringField
,是非常便宜)。
分析可能有助于揭示这个猜测是否不正确。