Textacy - 向量化器加权误差
Textacy - Vectorizer Weighting Error
我最近发现了 Textacy,在阅读 API 参考指南时,我 运行 遇到了 Vectorizer 的错误。如果我从 API 参考中添加任何选项,我会得到一个 TypeError: unexpected 关键字参数。除了加权之外,我还为其他选项收到此错误。
我使用 pip 安装了 textacy,我在 Ubuntu 上使用 Python3。任何帮助表示赞赏。谢谢!
vectorizer = textacy.vsm.Vectorizer(weighting='tfidf')
TypeError: __init__() got an unexpected keyword argument 'weighting'
运行成同样的问题。 API 文档没有反映当前的 Vectorizer 关键字参数。 Vectorizer 现在提供不同的关键字参数,以更好地控制 TF*IDF 的应用方式。
vectorizer = textacy.Vectorizer(tf_type='linear', apply_idf=True, idf_type='smooth')
tf_type
应用标准词频 (TF),apply_idf=True
应用逆文档频率 (IDF)。从回购评论中,idf_type='smooth'
为每个文档频率加一以避免零分。
要查看有关选项的更多信息,请在此处查看存储库中第 182 行的注释:https://github.com/chartbeat-labs/textacy/blob/master/textacy/vsm/vectorizers.py
我最近发现了 Textacy,在阅读 API 参考指南时,我 运行 遇到了 Vectorizer 的错误。如果我从 API 参考中添加任何选项,我会得到一个 TypeError: unexpected 关键字参数。除了加权之外,我还为其他选项收到此错误。
我使用 pip 安装了 textacy,我在 Ubuntu 上使用 Python3。任何帮助表示赞赏。谢谢!
vectorizer = textacy.vsm.Vectorizer(weighting='tfidf')
TypeError: __init__() got an unexpected keyword argument 'weighting'
运行成同样的问题。 API 文档没有反映当前的 Vectorizer 关键字参数。 Vectorizer 现在提供不同的关键字参数,以更好地控制 TF*IDF 的应用方式。
vectorizer = textacy.Vectorizer(tf_type='linear', apply_idf=True, idf_type='smooth')
tf_type
应用标准词频 (TF),apply_idf=True
应用逆文档频率 (IDF)。从回购评论中,idf_type='smooth'
为每个文档频率加一以避免零分。
要查看有关选项的更多信息,请在此处查看存储库中第 182 行的注释:https://github.com/chartbeat-labs/textacy/blob/master/textacy/vsm/vectorizers.py