.vocabulary_ 与 .get_feature_names()

.vocabulary_ vs .get_feature_names()

这些与sklearnTfidfVectorizer有关。

请解释一下这两者之间的相似点和不同点,以及它们在什么时候有用。

这很令人困惑,因为它们看起来非常相似但又完全不同。

此外,相当有限的 sklearn 文档在这种情况下也无济于事。

基本上,我认为它们包含的信息完全相同。

但是,如果您有术语的名称并在 tf-idf 矩阵中查找它的列位置,那么您会找到 .vocabulary_.

.vocabulary_ 将术语的名称作为键,并将它们在 tf-idf 矩阵中的列位置作为值。

然而,如果您知道术语在 tf-idf 矩阵中的列位置并且查找它的名称,那么您会查找 .get_feature_names().

项在.get_feature_names()中的位置对应于元素在tf-idf矩阵中的列位置。