使用 Stanford coreNLP 进行西班牙语情感分析

Sentiment Analysis in Spanish with Stanford coreNLP

我是新来的,想知道是否有人可以帮助我解决以下问题。

我正在使用 Stanford CoreNLP 对西班牙语文本进行情感分析,但无法得到肯定的结果。

也就是说,如果我分析任何英文文本,用西班牙语分析它是完美的,但结果总是否定的

我一直在寻找如何用西班牙语配置解析器、标记化以及我发现的所有内容都对情绪分析毫无用处。

有人可以告诉我是否唯一有效的是标记化和情绪不是西班牙语?

这是我的属性文件,因此我找到了:

annotators = tokenize, ssplit, pos, ner, parse, sentiment

tokenize.language = en

pos.model = edu / stanford / nlp / models / pos-tagger / english / spanish-distsim.tagger

ner.model = edu/stanford/nlp/models/ner/spanish.ancora.distsim.s512.crf.ser.gz ner.applyNumericClassifiers = 假 ner.useSUTime = 假

parse.model = edu/stanford/nlp/models/lexparser/spanishPCFG.ser.gz

执行情感分析的代码很典型,您可以在任何教程中找到

非常感谢!!

遗憾的是,没有适用于西班牙语的斯坦福情感模型。目前,所有西班牙语单词都可能被情绪分析算法视为通用词 "unknown words",这就是为什么您会看到性能一直很差的原因。

您当然可以训练自己的模型(我相信在 Internet 的其他地方有记录......),但您需要有西班牙语训练数据才能完成此任务。