如何通过训练创建 Stanford coreNLP 模型？

Question

我对斯坦福的 coreNLP 还很陌生，我正在尝试通过创建模型来训练它。我有一个包含 dev.txt、train.txt 和 test.txt 的文件夹以及一个名为 stanford-corenlp-3.5.1-models.jar 的 jar 文件。根据this问题，我可以通过在终端中执行以下命令来创建模型：

java -mx8g edu.stanford.nlp.sentiment.SentimentTraining -numHid 25 -trainPath train.txt -devPath     dev.txt -train -model model.ser.gz

但是，当我在终端中运行时，出现以下错误：

Error: could not find or load main class edu.stanford.nlp.sentiment.SentimentTraining

任何人都可以提供有关如何训练 CoreNLP 的分步说明吗？我去了 Stanford website 看看训练是如何完成的，但我仍然很困惑。我认为我需要创建一个模型（例如 model.ser.gz）的是那三个文本文件和一个 jar 文件。

非常感谢任何帮助，谢谢！

Answer 1

您需要在类路径中包含 CoreNLP jar 文件。因此，您的 java 命令应如下所示：

java -cp /path/to/corenlp/jar:/path/to/corenlp/library/dependencies -mx8g ...

从 CoreNLP 发行版的根目录开始，您可以只包含目录中的所有 jar；例如，

java -cp "*" -mx8g edu.stanford.nlp.sentiment.SentimentTraining -numHid 25 -trainPath train.txt -devPath dev.txt -train -model model.ser.gz

如何通过训练创建 Stanford coreNLP 模型？

How to create a Stanford coreNLP model by training?

java

stanford-nlp

training-data

sentiment-analysis