在没有电影训练数据集的情况下,如何将 Stanford Core NLP 与算法进行比较?

How can I compare Stanford Core NLP with an algorithm without the trained dataset for the movies?

我希望使用经过电影评论训练的 Stanford Core NLP。我想将它与未经电影评论训练的常规情感分析算法进行比较。有没有办法在没有经过训练的电影评论数据集的情况下使用 Stanford Core NLP Link Here,或者是否有任何其他来源可以用来直接比较?

在没有训练有素的电影评论数据集的情况下,不清楚您所说的 CoreNLP 情绪是什么意思。情绪模型需要一些数据集来训练——未经训练它根本不会做任何事情。可以在非电影评论的数据集上对其进行训练,但为此您必须找到或创建合适的数据集。

  1. 您可以通过 VADER 执行极性情绪分析:A 基于简约规则的社交媒体情感分析模型 文字。该软件包使用正面和负面单词(词典)的静态知识库。对于每个电影评论,提供 4 个分数:正面, 消极、中性的情绪得分以及“复合”得分 (区分其他三个)。

参见:

https://github.com/cjhutto/vaderSentiment

http://www.nltk.org/howto/sentiment.html

http://www.nltk.org/_modules/nltk/sentiment/vader.html

  1. 可以从 here.

  2. 中获取其他词典
  3. 据我所知,CoreNLP 提供经过训练的英语 CoreNLP 模型。见 here.

Stanford CoreNLP API 与使用电影评论训练的预训练模型捆绑在一起。所以你可以直接使用API。