使用 Maxent 模型进行情感分析的特征

Features for sentiment analysis using Maxent model

我想使用最大熵模型实现我自己的情绪分析。不使用任何 Api。对于我的最大熵模型,f(c,d) 的最佳特征是什么。我有三个类正面、负面和中性

情感分析中一些最常用和最有效的特征是 unigramsBigrams也可以用,但是到底有没有用,还是比较有争议的。

请注意,使用 unigrams/bigrams 的频率值不会显着改善情绪分析的结果;因此,通常提取词类型并使用布尔值在文本中表达它们的 presence/absence 就足够了。

重要的是在提取这些特征之前如何预处理文本。例如,除了小写你的标记,处理否定范围可以在提取一元字符特征时改善你的结果。

无论如何,情感分析是一个广阔的领域。您会发现,根据您需要执行的特定分析类型(例如基于特征的分析、主观性分析、极性分析等),不同的特征提取策略可能会产生不同的结果。

您几乎可以在这里找到入门所需的一切:

  • http://sentiment.christopherpotts.net
  • 刘,Bing。 "Sentiment analysis and opinion mining." 人类语言技术综合讲座 5.1 (2012): 1-167.
  • 庞、博和莉莲·李。 "Opinion mining and sentiment analysis." 信息检索的基础和趋势 2.1-2 (2008): 1-135.