我想实现用于文本分类的机器学习或深度学习模型 (100 类)

Question

我有一个类似于电影情节及其类型的数据集。 classes的个数在100左右，这100个classclass化应该选择什么算法呢？ classification 是多标签的，因为一部电影可以有多种流派请推荐以下任何人。如果您愿意，可以自由推荐任何其他型号。

1.Naive Bayesian
2.Neural networks
3.SVM
4.Random forest
5.k nearest neighbours

如果你在python

中也提供必要的库，那将很有用

Answer 1

机器学习工程中的一个重要步骤是正确检查数据。 Herby 你会得到一些决定选择哪种算法的洞察力。有时，您可能会尝试不止一种算法并比较模型，以确保您已尽力处理数据。

由于你没有公开你的数据，我只能给你以下建议：如果你的数据是"easy"，意味着你只需要很少的特征和它们的轻微组合就可以解决任务，使用朴素贝叶斯或 k 最近邻。如果您的数据 "medium" 难，则使用随机森林或 SVM。如果解决任务需要一个非常复杂的决策边界，以非线性方式组合特征的多个维度，请选择神经网络架构。

我建议您使用 python 和用于 SVM 或随机森林或 k-NN 的 scikit-learn 包。对于神经网络，使用 keras。

很抱歉，我无法为您提供您可能期望的解决问题的方法。你的问题提得真宽泛。

我想实现用于文本分类的机器学习或深度学习模型 (100 类)

I want to implement a machine learning or deep learning model for text classification (100 classes)

python

machine-learning

text-classification

multilabel-classification