我如何 运行 UIMA 上的文件列表?
How do I run UIMA on a list of files?
我在我的 Java 程序中使用 org.apache.uima.examples.cpe.SimpleRunCPE,它以 CpeDescription XML 文件作为输入。
此文件有一个用于 InputDirectory 的名称值对,它指向 UIMA 应该处理的文本文件所在的位置。
我如何 运行 指定文件列表上的 CPE?
背景是我在运行 UIMA 上的目录中有大量的文本文件来生成CAS 文件。
如果 运行ning 几天后 UIMA 进程突然不得不停止(由于堆内存不足或计算机必须重新启动而崩溃),我想 运行 剩余未处理文件的进程只有.
我该怎么做?
在您的 CpeDescription XML 文件中,您需要修改 CollectionReader 以接受新参数(例如文件列表或正则表达式)以过滤掉已处理的文件。 Here some code and tests 让你开始。
另一种解决方法是将大型 InputDirectory 结构化为更小的子目录,并在每个子目录上 运行 一个 UIMA CPE。这样,如果一个 CPE 批处理失败,您可以重新启动它。
我在我的 Java 程序中使用 org.apache.uima.examples.cpe.SimpleRunCPE,它以 CpeDescription XML 文件作为输入。
此文件有一个用于 InputDirectory 的名称值对,它指向 UIMA 应该处理的文本文件所在的位置。
我如何 运行 指定文件列表上的 CPE?
背景是我在运行 UIMA 上的目录中有大量的文本文件来生成CAS 文件。 如果 运行ning 几天后 UIMA 进程突然不得不停止(由于堆内存不足或计算机必须重新启动而崩溃),我想 运行 剩余未处理文件的进程只有.
我该怎么做?
在您的 CpeDescription XML 文件中,您需要修改 CollectionReader 以接受新参数(例如文件列表或正则表达式)以过滤掉已处理的文件。 Here some code and tests 让你开始。
另一种解决方法是将大型 InputDirectory 结构化为更小的子目录,并在每个子目录上 运行 一个 UIMA CPE。这样,如果一个 CPE 批处理失败,您可以重新启动它。