如何在 Apache Ruta 中将参数 dictRemoveWS 设置为 true
How to set the parameter dictRemoveWS to true in Apache Ruta
dictRemoveWS
与 Wordlist 有关。我想消除我的自定义 ruta 脚本中的空白问题,该脚本从 txt 文件中获取单词列表。
文档说使用 CONFIGURE
方法,示例如下:
ENGINE utils.HtmlAnnotator;
Document{->CONFIGURE(HtmlAnnotator, "onlyContent" = false)};
但我仍然无法将 dictRemoveWS
参数设置为 true
像这样的参数可以在引擎配置上配置:
在Java中:
AnalysisEngineFactory.createEngine(RutaEngine.class, typeSystemDescription,
RutaEngine.PARAM_SCRIPT_PATHS, scriptsPath,
RutaEngine.PARAM_RESOURCE_PATHS, resourcesPath,
RutaEngine.PARAM_MAIN_SCRIPT, "Main",
RutaEngine.PARAM_DICT_REMOVE_WS, true)
或在XML定义中:
有关详细信息,请参阅 Ruta 文档:
https://uima.apache.org/d/ruta-current/tools.ruta.book.html#ugr.tools.ruta.ae.basic
dictRemoveWS
与 Wordlist 有关。我想消除我的自定义 ruta 脚本中的空白问题,该脚本从 txt 文件中获取单词列表。
文档说使用 CONFIGURE
方法,示例如下:
ENGINE utils.HtmlAnnotator;
Document{->CONFIGURE(HtmlAnnotator, "onlyContent" = false)};
但我仍然无法将 dictRemoveWS
参数设置为 true
像这样的参数可以在引擎配置上配置:
在Java中:
AnalysisEngineFactory.createEngine(RutaEngine.class, typeSystemDescription,
RutaEngine.PARAM_SCRIPT_PATHS, scriptsPath,
RutaEngine.PARAM_RESOURCE_PATHS, resourcesPath,
RutaEngine.PARAM_MAIN_SCRIPT, "Main",
RutaEngine.PARAM_DICT_REMOVE_WS, true)
或在XML定义中:
有关详细信息,请参阅 Ruta 文档: https://uima.apache.org/d/ruta-current/tools.ruta.book.html#ugr.tools.ruta.ae.basic