使用朴素贝叶斯获取 TF/Count 向量
Getting TF/Count vector with Naive Bayes
我正在使用 Python 3.7(Windows,64 位)。虽然我可以获得 TF-IDF 结果,但之后我无法获得 TF/Count 向量。这是我获得 TF-IDF 结果的示例代码,
DOC, LBL = read_corpus()
# Splits the dataset into training (75%) and test set(25%)
split_point = int(0.75*len(DOC))
trainDoc = DOC[:split_point]
trainClass = LBL[:split_point]
testDoc = DOC[split_point:]
testClass = LBL[split_point:]
# Calling the classifier (use the tf-idf/count feature/vectorizer)
Multinomial_Naive_Bayes(trainDoc, trainClass, testDoc, testClass, tfIdf=True)
经过一些 google 搜索后,我找不到任何包含 Multinomial_Naive_Bayes()
方法的库。
您可能需要编辑您的问题并在此处粘贴您自己的方法,例如 Multinomial_Naive_Bayes()
和 read_corpus()
。
但是如果你正在使用 scikit-learn,你可以这样做:
vectorizer = CountVectorizer()
transformer = TfidfTransformer()
word_freq_matrix = vectorizer.fit_transform(corpus)
tfidf_result = transformer.fit_transform(word_freq_matrix)
我正在使用 Python 3.7(Windows,64 位)。虽然我可以获得 TF-IDF 结果,但之后我无法获得 TF/Count 向量。这是我获得 TF-IDF 结果的示例代码,
DOC, LBL = read_corpus()
# Splits the dataset into training (75%) and test set(25%)
split_point = int(0.75*len(DOC))
trainDoc = DOC[:split_point]
trainClass = LBL[:split_point]
testDoc = DOC[split_point:]
testClass = LBL[split_point:]
# Calling the classifier (use the tf-idf/count feature/vectorizer)
Multinomial_Naive_Bayes(trainDoc, trainClass, testDoc, testClass, tfIdf=True)
经过一些 google 搜索后,我找不到任何包含 Multinomial_Naive_Bayes()
方法的库。
您可能需要编辑您的问题并在此处粘贴您自己的方法,例如 Multinomial_Naive_Bayes()
和 read_corpus()
。
但是如果你正在使用 scikit-learn,你可以这样做:
vectorizer = CountVectorizer()
transformer = TfidfTransformer()
word_freq_matrix = vectorizer.fit_transform(corpus)
tfidf_result = transformer.fit_transform(word_freq_matrix)