LIBSVM 适合很多类别和样本吗?
Is LIBSVM suitable for many categories and samples?
我正在构建一个文本分类器,它应该能够给出文档属于特定类别(即 80% 小说、30% 营销等)的概率
我相信 Libsvm 通过 "predict" 方法做到这一点,但问题是我有大约 20 个类别要测试。另外,我有几百个文档可以用来训练。
问题是训练文件有 1 GB - 2 GB,这使得 Libsvc 超级慢。
如何解决这个问题?我应该改用 Liblinear,还是有更好的选择?
关于这个具体问题,我不得不使用 Liblinear,因为 LibSVC 永远保持 运行。
但如果有人想知道最终结果如何:
- 我从 PHP / C++ 切换到 Python,这非常棒
更容易,没有遇到任何内存问题
- 我的情况是 "multi-labelling"。 This article put me in the right direction, and the magpie project 帮我完成了任务。
我正在构建一个文本分类器,它应该能够给出文档属于特定类别(即 80% 小说、30% 营销等)的概率
我相信 Libsvm 通过 "predict" 方法做到这一点,但问题是我有大约 20 个类别要测试。另外,我有几百个文档可以用来训练。
问题是训练文件有 1 GB - 2 GB,这使得 Libsvc 超级慢。
如何解决这个问题?我应该改用 Liblinear,还是有更好的选择?
关于这个具体问题,我不得不使用 Liblinear,因为 LibSVC 永远保持 运行。
但如果有人想知道最终结果如何:
- 我从 PHP / C++ 切换到 Python,这非常棒 更容易,没有遇到任何内存问题
- 我的情况是 "multi-labelling"。 This article put me in the right direction, and the magpie project 帮我完成了任务。