如何从 vaderSentiment 获取更好的数据?
How to get nicer data from vaderSentiment?
我知道我可以从 vader 那里得到这个:
{'neg':0.071,'neu':0.895,'pos':0.034,'compound':-0.296}
但他们是获得整体结果的一种方式吗?例如说 {'Positive'} 或 {'Negative'}
还有...我要查找什么才能看到我可以用 vader 做的所有事情?比如函数列表之类的。
复合分数是通过对词典中每个词的效价分数求和计算得出的,根据规则进行调整,然后归一化到-1(最极端负值)和+1(最极端正值)之间。如果您想要对给定句子进行单一的一维情绪度量,这是最有用的指标。
然后您可以设置负值[-1, 0)、中性[0, 0.5) 和正值[0.5, 1] 的阈值以将它们分类。例如:
def get_category(compounded):
if compounded < 0:
return 'negative'
elif compounded < 0.5:
return 'neutral'
else:
return 'positive'
选择最适合您的数据和用例的阈值。
我知道我可以从 vader 那里得到这个: {'neg':0.071,'neu':0.895,'pos':0.034,'compound':-0.296}
但他们是获得整体结果的一种方式吗?例如说 {'Positive'} 或 {'Negative'}
还有...我要查找什么才能看到我可以用 vader 做的所有事情?比如函数列表之类的。
复合分数是通过对词典中每个词的效价分数求和计算得出的,根据规则进行调整,然后归一化到-1(最极端负值)和+1(最极端正值)之间。如果您想要对给定句子进行单一的一维情绪度量,这是最有用的指标。
然后您可以设置负值[-1, 0)、中性[0, 0.5) 和正值[0.5, 1] 的阈值以将它们分类。例如:
def get_category(compounded):
if compounded < 0:
return 'negative'
elif compounded < 0.5:
return 'neutral'
else:
return 'positive'
选择最适合您的数据和用例的阈值。