如何在 Quanteda 中对文档进行情绪评分?
How to have a sentiment score for a document in Quanteda?
我是情绪分析新手。 Quanteda examples 展示如何输出正面和负面单词的数量。我测试了一些文件。它输出如下:
案例一
document negative positive
file1 28 28
file2 98 71
file3 28 22
file4 37 39
file5 7 36
或以下
案例二
document negative positive neg_positive neg_negative
file1 28 28 0 1
file2 98 71 0 0
file3 28 22 1 0
file4 37 39 0 1
file5 7 36 0 1
你能告诉我如何在这两种情况下获得 file1 .. file5 的分数吗?是吗
(#positive - #negative) / #all in case 1 file2, (71-98)/(71+98)=-27/169= - 0.15 ?
案例 2 呢?
非常感谢。
一个
如果您将 neg_positive
视为 negative
,并且将 neg_negative
视为正数,那么您可以通过组合列对来创建索引。这是合理的,因为 "neg positive" 例如包含 "not good".
等序列
(rowSums(object[, c("negative", "neg_positive")]) -
rowSums(object[, c("positive", "neg_negative")])) / rowSums(object) * 100
另一个(更好的)衡量标准是在
2011. 威廉·洛、肯尼斯·伯努瓦、斯拉瓦·米哈伊洛夫和迈克尔·拉沃尔。 "Scaling Policy Preferences From Coded Political Texts." 立法研究季刊 26(1,2 月):123-155。这是日志(positive/negative) 或
log( rowSums(object[, c("positive", "neg_negative")]) /
rowSums(object[, c("negative", "neg_positive")]) )
我是情绪分析新手。 Quanteda examples 展示如何输出正面和负面单词的数量。我测试了一些文件。它输出如下:
案例一
document negative positive
file1 28 28
file2 98 71
file3 28 22
file4 37 39
file5 7 36
或以下
案例二
document negative positive neg_positive neg_negative
file1 28 28 0 1
file2 98 71 0 0
file3 28 22 1 0
file4 37 39 0 1
file5 7 36 0 1
你能告诉我如何在这两种情况下获得 file1 .. file5 的分数吗?是吗
(#positive - #negative) / #all in case 1 file2, (71-98)/(71+98)=-27/169= - 0.15 ?
案例 2 呢?
非常感谢。
一个
如果您将 neg_positive
视为 negative
,并且将 neg_negative
视为正数,那么您可以通过组合列对来创建索引。这是合理的,因为 "neg positive" 例如包含 "not good".
(rowSums(object[, c("negative", "neg_positive")]) -
rowSums(object[, c("positive", "neg_negative")])) / rowSums(object) * 100
另一个(更好的)衡量标准是在 2011. 威廉·洛、肯尼斯·伯努瓦、斯拉瓦·米哈伊洛夫和迈克尔·拉沃尔。 "Scaling Policy Preferences From Coded Political Texts." 立法研究季刊 26(1,2 月):123-155。这是日志(positive/negative) 或
log( rowSums(object[, c("positive", "neg_negative")]) /
rowSums(object[, c("negative", "neg_positive")]) )