情感计算公式是什么

what is the formula of sentiment calculation

使用情绪评级词典计算情绪的实际公式是什么。我正在使用的词典包含 -5 到 5 范围内的评级。我想计算单个句子的情绪。要么我必须计算句子中所有情感排名词的平均值,要么只对它们求和。

有几种方法可以根据句子的评分情感成分计算指数。每个都是基于比较正面和负面的词,每个都有优点和缺点。

对于您的量表,衡量单词的集中趋势将是一个公平的衡量标准,其中分母是得分单词的数量。这是下面使用的 "relative proportional difference" 度量的一种形式。您可能不想将总情感词的分数除以所有词,因为这会使每个句子的度量受到非情感词的强烈影响。

如果您不相信您描述的 11 分评级是准确的,您可以根据其符号将其分类为正面或负面。然后你可以在你已经转换的地方应用以下方法 其中每个 PN 指的是正面和负面编码情感词的计数,并且 O是所有其他单词的计数(因此单词总数 = P + N + O).

  1. 绝对比例差。边界:[0,1]

    情绪 = (PN) / (P + N + O)

    缺点:句子的得分受非情感相关内容的影响。

  2. 相对比例差。边界:[-1, 1]

    情绪 = (PN) / (P + N)

    缺点:句子的分数可能倾向于在量表端点附近非常强烈地聚集(因为它们可能主要或完全包含正面或负面的内容)。

  3. Logit 量表。界限:[-无穷大,+无穷大]

    情绪 = log(P + 0.5) - log(N + 0.5)

    这往往具有最平滑的特性并且围绕零对称。 0.5 更平滑以防止 log(0).

有关详细信息,请参阅 William Lowe, Kenneth Benoit, Slava Mikhaylov, and Michael Laver. (2011) "Scaling Policy Preferences From Coded Political Texts." Legislative Studies Quarterly 26(1, Feb): 123-155. 我们比较了它们在衡量左右意识形态方面的属性,但我们讨论的所有内容也适用于正负情绪。

您可以使用 R 工具进行情绪计算。这里是link你可以参考: https://sites.google.com/site/miningtwitter/questions/sentiment/analysis