sphinx 可以使用形态学计算其索引中的所有单词吗?

Can sphinx count all words in its index using morphology?

我想对 sphinx 索引中出现频率最高的词进行评分。我发现的唯一一种方法是 /usr/bin/indexer -c /etc/sphinxsearch/sphinx.conf indexname --buildfreqs --buildstops /home/user/test.txt 1000。但是这种方法没有考虑形态学。一个词的不同形式算作几个词。也许还有另一种计算所有索引词的方法?

如评论中所述,可以使用 indextool --dumpdict - 它应该给出索引中的字数。因为它来自索引,它已经 'normalized' 根据 charset_table,词形,甚至形态。

(但仅适用于 dict=keywords 索引)