WEKA 中的多ClassClass化

Multi-Class Classification in WEKA

我正在尝试在 WEKA 中实现 Multiclass classification。 我有很多行,比如说银行交易,其中一个被标记为食品、药品、租金等。我想开发一个 classifier,它可以用我以前的数据进行训练,并预测它可以属于未来交易的 class。如果我是对的,这是 Multiclass 而不是多标签,因为每笔交易只能属于一个 class.

以下是我正在考虑的几个算法

  1. 朴素贝叶斯
  2. 多项逻辑回归
  3. 多class SVM
  4. 最大熵
  5. 神经网络(如果可能的话)

在我的数据中,特征数 <<< 事务数,因此我正在考虑一对一二进制 classifier 而不是一对一。

  1. 是否还有其他算法可以帮助我实现目标?
  2. 我放置的算法是否对我的目标无用?

此外,我发现 Python 中的 scikit-learn 比 WEKA 更好,但我只能在一个处理器上 运行 scikit-learn。这是真的吗?

任何问题的答案都会有所帮助。 谢谢!

您可以查看 RandomForest,它是一个众所周知的 class 生成器并且非常高效。

在 scikit-learn 中,您有一些 class 可以在多个核心上使用,例如 RandomForestClassifier。它有一个构造函数参数,可用于定义核心数或将使用每个可用核心的值。看文档,constructor里面包含n_jobs参数可以用过几个core