如何在 Quanteda 中对文档进行情绪评分?

How to have a sentiment score for a document in Quanteda?

我是情绪分析新手。 Quanteda examples 展示如何输出正面和负面单词的数量。我测试了一些文件。它输出如下:

案例一

document    negative    positive
file1   28  28
file2   98  71
file3   28  22
file4   37  39
file5   7   36

或以下

案例二

document    negative    positive    neg_positive    neg_negative
file1   28  28  0   1
file2   98  71  0   0
file3   28  22  1   0
file4   37  39  0   1
file5   7   36  0   1

你能告诉我如何在这两种情况下获得 file1 .. file5 的分数吗?是吗

(#positive - #negative) / #all in case 1 file2, (71-98)/(71+98)=-27/169= - 0.15 ?

案例 2 呢?

非常感谢。

一个

如果您将 neg_positive 视为 negative,并且将 neg_negative 视为正数,那么您可以通过组合列对来创建索引。这是合理的,因为 "neg positive" 例如包含 "not good".

等序列
(rowSums(object[, c("negative", "neg_positive")]) -
    rowSums(object[, c("positive", "neg_negative")])) / rowSums(object) * 100

另一个(更好的)衡量标准是在 2011. 威廉·洛、肯尼斯·伯努瓦、斯拉瓦·米哈伊洛夫和迈克尔·拉沃尔。 "Scaling Policy Preferences From Coded Political Texts." 立法研究季刊 26(1,2 月):123-155。这是日志(positive/negative) 或

log( rowSums(object[, c("positive", "neg_negative")]) /
     rowSums(object[, c("negative", "neg_positive")]) )