Weka 分类器不会 运行 大量实例

Weka classifier does not run for large number of instances

我正在使用我的数据来训练 Weka NaiveBayes 分类器。我正在 运行ning 交叉验证。当我 运行 它有 5000 个实例时,它 运行 很好,但是当我将实例数增加到 100000 时,它只是停留在那里显示:

'Building model on training data'

没有结果,几秒钟后 weka 停止处理数据。

首先,请分享您的代码。您是通过 GUI 使用 java api 还是 运行。 JVM 的大小是多少。

可能的原因是

资源管理器中显示的文本输出是学习时产生的 所有可用数据的模型。这也是保存的模型 当您将序列化分类器导出到磁盘时。理由是 如果您要将模型投入生产以预测未来的情况 您希望使用从所有可用训练数据构建的模型。如果 你对这个模型不感兴趣你可以关闭它(并节省时间) 在 "More options" 对话框中。

provided here

java 虚拟机可能 运行 内存不足。增加 RunWeka.ini 中的堆大小来解决这个问题或者使用更少的数据。您可以在开始训练之前打开并保持打开 CLI window,以便您可以看到错误输出。