使用 Carrot2 时出现 Java 堆 Space 错误

Getting Java Heap Space error while using Carrot2

我将所有搜索结果格式化为 XML 格式,并尝试 运行 Carrot2 workbench 中的行话算法,并不断 运行 进入 Java 堆 space 错误。

XML 以 Carrot2 使用的方式格式化。我在 MAC 机器上 运行ning Carrot2 workbench。

有没有办法:

  1. 要像某些设置一样为应用程序增加 Java 堆 Space?
  2. 我可以传递给应用程序进行聚类的文档有限制吗? (我有大约 10k 份文件)**

An internal error occurred during: "Searching for 'gene therapy'...". Java heap space

  1. 要设置最大Java堆space,可以在启动时传递合适的-Xmx JVM参数值: carrot2-workbench -vmargs -Xmx256m

  2. Carrot2 专为中小型文档集合(数百个)而设计。这完全取决于算法。有关详细信息,请参阅“”。