句子与文档级别分析的最佳词典

Best lexicons for sentence vs document level analysis

文档级和句子级分析的最佳词典是什么?我目前正在使用 Vader 进行句子级别的分析,但是我担心当我转到文档级别时,Vader 的表现可能不如其他人。

与 post here 类似的问题,但更具体。

除了链接post中列出的情感词典外,我还可以推荐一个Finn情感词典。

对于情感分析,仅依赖词典可能不是最佳解决方案,尤其是在文档级别。语言是如此灵活,以至于它的属性和概念比充满情感的词汇更能影响语义。

一些核心概念是对比话语标记(尤其是文档级别)、否定和情态。

  • 对比语篇标记

文档中的观点既有优点也有缺点,我们通过 'however'、'nevertheless' 等标记将这些观点联系起来,以传达含义或想法。对于一袋词的方法,下面的句子是一样的,但是如果人们用一个标签来标注他们的情绪,他们可能不会用相同的标注:

The laptop has amazing features, but its screen is killing me.
The laptop's screen is killing me, but it has amazing features.

一般情况下,我们会根据'but'后面的子句的情感评价这类句子或段落。其他对比语篇标记也有它们自己的语义。这是在一个称为话语分析的领域进行检查的。

  • 否定与情态

这些概念也改变了语义。因此,这两个级别都不能忽视它们。有一些研究和论文将否定和情态触发器与情感词汇结合使用。你可以 google 它 'negation and modality on sentiment analysis' 看看你能做什么。

最后我可以建议的是,如果你有一个特定领域的数据集,你可以使用远程监督建立你自己的词典。

希望这对您有所帮助,

干杯