WORDTABLE - 不匹配单词 - UIMA RUTA

WORDTABLE - Not matching the word - UIMA RUTA

我尝试使用 WORDTABLE 来匹配单词。但是有些文字不匹配。

在下面输入的单词阿富汗不匹配。如果我从 WORDTABLE 中删除 A Coruña;n.a.,那么它是匹配的。

示例输入:

Afghanistan
Report
report

示例 CSV (test.csv):

Afghanistan;Afghan.
report;rep.
A Coruña;n.a.

代码:

PACKAGE uima.ruta.example;
RETAINTYPE(SPACE);
WORDTABLE Table = 'test.csv';
DECLARE Annotation Abbr(STRING short);
Document{->MARKTABLE(Abbr, 1, Table,true,0,"",0, "short" = 2)};   
RETAINTYPE;

这很可能是词表中的空格造成的。有几个选项可以避免这个问题,例如,激活配置参数 dictRemoveWS.