哪些不是 Naive 的文本分类算法?

Text classification algorithms which are not Naive?

朴素贝叶斯算法假定特征之间是独立的。哪些文本分类算法不是 Naive,即不假设其特征之间的独立性。

答案将非常直接,因为几乎 每个 分类器(除了 Naive Bayes)都不是朴素的。特征独立性是非常罕见的假设,并且不被(在其他大量列表中)采用:

  • 逻辑回归(在 NLP 社区中称为最大熵模型)
  • 线性判别分析(fischer线性判别)
  • kNN
  • 支持向量机
  • 决策树/随机森林
  • 神经网络
  • ...

您问的是文本分类,但文本并没有什么特别之处,您可以对此类数据使用任何现有的分类器。