如何在 Apache Ruta 中将参数 dictRemoveWS 设置为 true

How to set the parameter dictRemoveWS to true in Apache Ruta

dictRemoveWS 与 Wordlist 有关。我想消除我的自定义 ruta 脚本中的空白问题,该脚本从 txt 文件中获取单词列表。

文档说使用 CONFIGURE 方法,示例如下:

ENGINE utils.HtmlAnnotator; Document{->CONFIGURE(HtmlAnnotator, "onlyContent" = false)}; 但我仍然无法将 dictRemoveWS 参数设置为 true

像这样的参数可以在引擎配置上配置:

在Java中:

AnalysisEngineFactory.createEngine(RutaEngine.class, typeSystemDescription,
                RutaEngine.PARAM_SCRIPT_PATHS, scriptsPath,
                RutaEngine.PARAM_RESOURCE_PATHS, resourcesPath,
                RutaEngine.PARAM_MAIN_SCRIPT, "Main",
                RutaEngine.PARAM_DICT_REMOVE_WS, true)

或在XML定义中:

https://github.com/apache/uima-ruta/blob/trunk/example-projects/ExampleProject/descriptor/BasicEngine.xml

有关详细信息,请参阅 Ruta 文档: https://uima.apache.org/d/ruta-current/tools.ruta.book.html#ugr.tools.ruta.ae.basic