tf-idf vectorizer的use_idf参数解释
tf-idf vectorizer's use_idf parameter explanation
use_idf参数在tfidf Vectorizer中有什么用?
文档没有给出太多解释。
有人可以解释一下吗?
如果 use_idf
设置为 True
(默认值),则在转换过程中会考虑 逆向文档频率 。这导致出现在大量文档中的标记将被自动认为比出现在较少文档中的标记信息量少。
如果将其设置为 False
,则仅使用词频(文档中的单词数)。
在 Wikipedia 上查看这个很好的解释。
use_idf参数在tfidf Vectorizer中有什么用? 文档没有给出太多解释。 有人可以解释一下吗?
如果 use_idf
设置为 True
(默认值),则在转换过程中会考虑 逆向文档频率 。这导致出现在大量文档中的标记将被自动认为比出现在较少文档中的标记信息量少。
如果将其设置为 False
,则仅使用词频(文档中的单词数)。
在 Wikipedia 上查看这个很好的解释。