Textblob 情感算法

Textblob sentiment algorithm

有谁知道 textblob 情绪是如何运作的?我知道它是基于模式工作的,但我找不到任何文章或文档来解释模式如何为句子分配极性值。

这里是textblog情感模块的代码: https://github.com/sloria/TextBlob/blob/90cc87ab0f9e25f37379079840ec43aba59af440/textblob/en/sentiments.py

如你所见,它有一个预分类电影评论的训练集,当你给一个新文本进行分析时,它使用 NaiveBayes 分类器将新文本的极性分类为 posneg 概率。

默认情况下,它会使用形容词及其手写词典计算给定文本中每个单词的平均极性主观性标记分数。它实际上使用 pattern library for that, which takes the individual word scores from sentiwordnet.

如果通过指定 NaiveBayesAnalyzer 来调用情绪分数,例如

TextBlob("The movie was excellent!", analyzer=NaiveBayesAnalyzer())

然后它将通过在电影评论数据集上训练的 NaiveBayesAnalyzer 计算情感分数。