使用 Stanford coreNLP 进行西班牙语情感分析
Sentiment Analysis in Spanish with Stanford coreNLP
我是新来的,想知道是否有人可以帮助我解决以下问题。
我正在使用 Stanford CoreNLP 对西班牙语文本进行情感分析,但无法得到肯定的结果。
也就是说,如果我分析任何英文文本,用西班牙语分析它是完美的,但结果总是否定的
我一直在寻找如何用西班牙语配置解析器、标记化以及我发现的所有内容都对情绪分析毫无用处。
有人可以告诉我是否唯一有效的是标记化和情绪不是西班牙语?
这是我的属性文件,因此我找到了:
annotators = tokenize, ssplit, pos, ner, parse, sentiment
tokenize.language = en
pos.model = edu / stanford / nlp / models / pos-tagger / english / spanish-distsim.tagger
ner.model = edu/stanford/nlp/models/ner/spanish.ancora.distsim.s512.crf.ser.gz
ner.applyNumericClassifiers = 假
ner.useSUTime = 假
parse.model = edu/stanford/nlp/models/lexparser/spanishPCFG.ser.gz
执行情感分析的代码很典型,您可以在任何教程中找到
非常感谢!!
遗憾的是,没有适用于西班牙语的斯坦福情感模型。目前,所有西班牙语单词都可能被情绪分析算法视为通用词 "unknown words",这就是为什么您会看到性能一直很差的原因。
您当然可以训练自己的模型(我相信在 Internet 的其他地方有记录......),但您需要有西班牙语训练数据才能完成此任务。
我是新来的,想知道是否有人可以帮助我解决以下问题。
我正在使用 Stanford CoreNLP 对西班牙语文本进行情感分析,但无法得到肯定的结果。
也就是说,如果我分析任何英文文本,用西班牙语分析它是完美的,但结果总是否定的
我一直在寻找如何用西班牙语配置解析器、标记化以及我发现的所有内容都对情绪分析毫无用处。
有人可以告诉我是否唯一有效的是标记化和情绪不是西班牙语?
这是我的属性文件,因此我找到了:
annotators = tokenize, ssplit, pos, ner, parse, sentiment
tokenize.language = en
pos.model = edu / stanford / nlp / models / pos-tagger / english / spanish-distsim.tagger
ner.model = edu/stanford/nlp/models/ner/spanish.ancora.distsim.s512.crf.ser.gz ner.applyNumericClassifiers = 假 ner.useSUTime = 假
parse.model = edu/stanford/nlp/models/lexparser/spanishPCFG.ser.gz
执行情感分析的代码很典型,您可以在任何教程中找到
非常感谢!!
遗憾的是,没有适用于西班牙语的斯坦福情感模型。目前,所有西班牙语单词都可能被情绪分析算法视为通用词 "unknown words",这就是为什么您会看到性能一直很差的原因。
您当然可以训练自己的模型(我相信在 Internet 的其他地方有记录......),但您需要有西班牙语训练数据才能完成此任务。