句子的负分数

Negativity score for sentences

我正在处理航空公司客户投诉的数据集。由于它是 "complaints" 普遍的共识是所有句子都是 "negative" 情感。所以我想到了一种量化负面分数的方法。

例如:

更少负面评论:

 "the cabin did not have enough leg space but the food was decent" - Score: 0.3

高差评:

"complete service was horrible, I will not recommend them ever" - Score: 0.8

对现有方法有什么建议吗?

P.S我不是在寻找确切的答案,任何有关方向或方法的建议都会很好。

正如@Vishal 在评论中建议的那样,增加更多复杂性的最简单方法是实施 lexicon based sentiment analysis 评分模型,在该模型中,您可以自定义对词典中每个单词的极性进行评分,使其更高和更低。您还应该包括一些二元组和三元组词典短语以提高准确性。

Public 来自 Google、Azure、IBM 等的情绪分析 API 也确实提供了一定程度的情绪。