需要寻找空的通道-uima ruta

Need to find empty passage-uima ruta

我需要在 document.I 使用正则表达式模式注释空段落 annotate.But 它也覆盖非空段落

示例输入文件:

<p class="MsoNormal"><a name="para10001">You can easily change the formatting</a></p>
<p class="MsoNormal"><a name="para10002"> </a></p>
<p class="MsoNormal"><a name="para10003"></a></p>
<p class="MsoNormal"><a name="para10004">To change the overall look of your document</a></p>
<p class="MsoNormal"><a name="para10005"></a></p>
<p class="MsoNormal"><a name="para10006"></a></p>

鲁塔脚本:

   "<p(.*?)><a name=\"para(\d+)\"></a></p>"->EMPTYPASSAGE;
   "<p(.*?)><a name=\"para(\d+)\"> </a></p>"->EMPTYPASSAGE;
                         or
   "<p(.*?)><a name=\"para(.+?)\"></a></p>"->EMPTYPASSAGE;
   "<p(.*?)><a name=\"para(.+?)\"> </a></p>"->EMPTYPASSAGE;

您的正则表达式使用了几个 <p> 标签。尝试类似的东西:

"<p([^>]*?)><a name=\"para(\d+)\"></a></p>"->EMPTYPASSAGE;
"<p([^>]*?)><a name=\"para(\d+)\"> </a></p>"->EMPTYPASSAGE;