如何构建和标记非英语数据集以进行情感分析

how to build and label a non english dataset for sentiment analysis

最近我开始了一个关于情绪分析的新项目,我应该用波斯语构建一个数据集。虽然构建数据集对于整个过程的准确性很重要,但我想尽我所能 can.what 是在短时间内构建和标记它的最佳方法吗?

您可以使用可用的数据集作为您的参考。获取情绪分析数据集的来源有很多:

google

sananalytics

kaggle

stanford

这是一个数据集列表,给出了单个单词的情感。

positivewordsresearch

我建议您处理上述数据集,以增加您对数据集及其标签的了解。

通常情绪数据集使用有限的标签,例如 "positive/negative" 或 "happy"、"sad"、"angry" 和 "neutral" 或 "anger"、"sadness"、"surprise"、"fear"、"disgust" 和 "joy"

希望对你有用