使用 Maxent 模型进行情感分析的特征
Features for sentiment analysis using Maxent model
我想使用最大熵模型实现我自己的情绪分析。不使用任何 Api。对于我的最大熵模型,f(c,d) 的最佳特征是什么。我有三个类正面、负面和中性
情感分析中一些最常用和最有效的特征是 unigrams。 Bigrams也可以用,但是到底有没有用,还是比较有争议的。
请注意,使用 unigrams/bigrams 的频率值不会显着改善情绪分析的结果;因此,通常提取词类型并使用布尔值在文本中表达它们的 presence/absence 就足够了。
重要的是在提取这些特征之前如何预处理文本。例如,除了小写你的标记,处理否定范围可以在提取一元字符特征时改善你的结果。
无论如何,情感分析是一个广阔的领域。您会发现,根据您需要执行的特定分析类型(例如基于特征的分析、主观性分析、极性分析等),不同的特征提取策略可能会产生不同的结果。
您几乎可以在这里找到入门所需的一切:
- http://sentiment.christopherpotts.net
- 刘,Bing。 "Sentiment analysis and opinion mining." 人类语言技术综合讲座 5.1 (2012): 1-167.
- 庞、博和莉莲·李。 "Opinion mining and sentiment analysis." 信息检索的基础和趋势 2.1-2 (2008): 1-135.
我想使用最大熵模型实现我自己的情绪分析。不使用任何 Api。对于我的最大熵模型,f(c,d) 的最佳特征是什么。我有三个类正面、负面和中性
情感分析中一些最常用和最有效的特征是 unigrams。 Bigrams也可以用,但是到底有没有用,还是比较有争议的。
请注意,使用 unigrams/bigrams 的频率值不会显着改善情绪分析的结果;因此,通常提取词类型并使用布尔值在文本中表达它们的 presence/absence 就足够了。
重要的是在提取这些特征之前如何预处理文本。例如,除了小写你的标记,处理否定范围可以在提取一元字符特征时改善你的结果。
无论如何,情感分析是一个广阔的领域。您会发现,根据您需要执行的特定分析类型(例如基于特征的分析、主观性分析、极性分析等),不同的特征提取策略可能会产生不同的结果。
您几乎可以在这里找到入门所需的一切:
- http://sentiment.christopherpotts.net
- 刘,Bing。 "Sentiment analysis and opinion mining." 人类语言技术综合讲座 5.1 (2012): 1-167.
- 庞、博和莉莲·李。 "Opinion mining and sentiment analysis." 信息检索的基础和趋势 2.1-2 (2008): 1-135.