情绪分析中的用户输入或文本文件数据问题

Question

我是 Python-NLTK 的新手。我已经使用电影评论数据集编写了我的代码。当我将硬编码示例文本用于情感分析时它工作正常但是当我尝试获取用户输入或从文本文件中获取数据时它显示字母级别拆分。

例如当示例文本被硬编码为 ["Music was awesome", "Special effects are awesome"] 然后分裂就像评论：音乐很棒评论：特效很棒。

但是如果我要求用户输入或从文本文件中获取数据，那么它会显示评论为；评论：M 点评：你评论：S 点评：我评论：c 评论：.

#对于文本文件下面是我的示例代码。

t = open ("Sample1.txt", "r")           
File_input = (t.read())
for review in File_input:
  print ("\nReview:", review)
  probdist = classifier.prob_classify(extract_features(review.split()))
  pred_sentiment = probdist.max()

print ("Predicted sentiment:", pred_sentiment) 
print ("Probability:", round(probdist.prob(pred_sentiment), 5))

#供用户输入下面是我的示例代码。

User_input = input("Enter your value: ")
for review in User_input:
  print ("\nReview:", review)
  probdist = classifier.prob_classify(extract_features(review.split()))
  pred_sentiment = probdist.max()
print ("Predicted sentiment:", pred_sentiment) 
print ("Probability:", round(probdist.prob(pred_sentiment), 3))

请指导。谢谢！

Answer 1

User_input 变量是一个字符串，所以遍历它就是遍历字符，你想要做的是删除 for 循环并将 User_input 视为评论假设它有 1 条评论，否则你可以在评论之间定义一个分隔字符并像这样迭代：

for review in User_input.split(sep_char):

情绪分析中的用户输入或文本文件数据问题

Issue in user input or text file data in sentiment analysis

python

corpus

nltk

sentiment-analysis