python 中的情绪分析
sentiment analysis in python
我从各种网站提取评论并将它们存储在一个文件中,然后借助 senti-wordnet(给出一定的分数)将每个句子分类为正面或负面。我正在使用 python 2.7 .我不知道它如何处理存储在文件中的评论。有人知道 python 中的代码吗?
f1=open("foodP.txt","r")
word_features =[]
words = []
for line in f1:
word_features.append(line)
s=str(word_features)
tokens=nltk.word_tokenize(s)
for i,j in nltk.pos_tag(tokens):
if j in ['VBN','VBP','VB','JJ', 'JJR', 'JJS', 'RB', 'RBR', 'RBS']:
words.append(i)
print words
这段代码只会给出我需要的形容词、副词和动词。我想将这些词归类为正面或负面。
情感分析不需要POS,至少不需要。通过在 X 中使用 bag_of_words 并在 Y 中使用 "neg"/"pos" 来准备特征。然后分成 train/test 组并应用分类算法 - NaiveBayes、MaxEnt、RandomForest、SVM。
我从各种网站提取评论并将它们存储在一个文件中,然后借助 senti-wordnet(给出一定的分数)将每个句子分类为正面或负面。我正在使用 python 2.7 .我不知道它如何处理存储在文件中的评论。有人知道 python 中的代码吗?
f1=open("foodP.txt","r")
word_features =[]
words = []
for line in f1:
word_features.append(line)
s=str(word_features)
tokens=nltk.word_tokenize(s)
for i,j in nltk.pos_tag(tokens):
if j in ['VBN','VBP','VB','JJ', 'JJR', 'JJS', 'RB', 'RBR', 'RBS']:
words.append(i)
print words
这段代码只会给出我需要的形容词、副词和动词。我想将这些词归类为正面或负面。
情感分析不需要POS,至少不需要。通过在 X 中使用 bag_of_words 并在 Y 中使用 "neg"/"pos" 来准备特征。然后分成 train/test 组并应用分类算法 - NaiveBayes、MaxEnt、RandomForest、SVM。