如何通过训练创建 Stanford coreNLP 模型?

How to create a Stanford coreNLP model by training?

我对斯坦福的 coreNLP 还很陌生,我正在尝试通过创建模型来训练它。我有一个包含 dev.txt、train.txt 和 test.txt 的文件夹以及一个名为 stanford-corenlp-3.5.1-models.jar 的 jar 文件。根据this问题,我可以通过在终端中执行以下命令来创建模型:

java -mx8g edu.stanford.nlp.sentiment.SentimentTraining -numHid 25 -trainPath train.txt -devPath     dev.txt -train -model model.ser.gz

但是,当我在终端中 运行 时,出现以下错误:

Error: could not find or load main class edu.stanford.nlp.sentiment.SentimentTraining

任何人都可以提供有关如何训练 CoreNLP 的分步说明吗?我去了 Stanford website 看看训练是如何完成的,但我仍然很困惑。我认为我需要创建一个模型(例如 model.ser.gz)的是那三个文本文件和一个 jar 文件。

非常感谢任何帮助,谢谢!

您需要在类路径中包含 CoreNLP jar 文件。因此,您的 java 命令应如下所示:

java -cp /path/to/corenlp/jar:/path/to/corenlp/library/dependencies -mx8g ...

从 CoreNLP 发行版的根目录开始,您可以只包含目录中的所有 jar;例如,

java -cp "*" -mx8g edu.stanford.nlp.sentiment.SentimentTraining -numHid 25 -trainPath train.txt -devPath dev.txt -train -model model.ser.gz