大量 类

Large number of classes

我正在研究具有大量 类(约 3500)的多类模型。大量 类 会影响我模型的性能吗?我想使用 SVM 和随机森林。有谁知道这些方法的 类 数量是否有限制? 提前致谢

是的,它可能会特别影响性能,因为大多数库通过使用二进制问题的组合来解决多类问题。有不同的策略(一对一、一对一、赢家通吃等),您必须尝试看看哪种策略对您来说效果足够好(假设您可以控制该策略)。

https://en.wikipedia.org/wiki/Support_vector_machine#Multiclass_SVM

过去有时对我有用的一个肮脏的技巧是将问题视为回归问题而不是多类问题,但这对你的情况可能无效,我必须看看问题详细告诉你。