我想实现用于文本分类的机器学习或深度学习模型 (100 类)
I want to implement a machine learning or deep learning model for text classification (100 classes)
我有一个类似于电影情节及其类型的数据集。 classes的个数在100左右,这100个classclass化应该选择什么算法呢? classification 是多标签的,因为一部电影可以有多种流派
请推荐以下任何人。如果您愿意,可以自由推荐任何其他型号。
1.Naive Bayesian
2.Neural networks
3.SVM
4.Random forest
5.k nearest neighbours
如果你在python
中也提供必要的库,那将很有用
机器学习工程中的一个重要步骤是正确检查数据。 Herby 你会得到一些决定选择哪种算法的洞察力。有时,您可能会尝试不止一种算法并比较模型,以确保您已尽力处理数据。
由于你没有公开你的数据,我只能给你以下建议:如果你的数据是"easy",意味着你只需要很少的特征和它们的轻微组合就可以解决任务,使用朴素贝叶斯或 k 最近邻。如果您的数据 "medium" 难,则使用随机森林或 SVM。如果解决任务需要一个非常复杂的决策边界,以非线性方式组合特征的多个维度,请选择神经网络架构。
我建议您使用 python 和用于 SVM 或随机森林或 k-NN 的 scikit-learn 包。
对于神经网络,使用 keras。
很抱歉,我无法为您提供您可能期望的解决问题的方法。你的问题提得真宽泛。
我有一个类似于电影情节及其类型的数据集。 classes的个数在100左右,这100个classclass化应该选择什么算法呢? classification 是多标签的,因为一部电影可以有多种流派 请推荐以下任何人。如果您愿意,可以自由推荐任何其他型号。
1.Naive Bayesian
2.Neural networks
3.SVM
4.Random forest
5.k nearest neighbours
如果你在python
中也提供必要的库,那将很有用机器学习工程中的一个重要步骤是正确检查数据。 Herby 你会得到一些决定选择哪种算法的洞察力。有时,您可能会尝试不止一种算法并比较模型,以确保您已尽力处理数据。
由于你没有公开你的数据,我只能给你以下建议:如果你的数据是"easy",意味着你只需要很少的特征和它们的轻微组合就可以解决任务,使用朴素贝叶斯或 k 最近邻。如果您的数据 "medium" 难,则使用随机森林或 SVM。如果解决任务需要一个非常复杂的决策边界,以非线性方式组合特征的多个维度,请选择神经网络架构。
我建议您使用 python 和用于 SVM 或随机森林或 k-NN 的 scikit-learn 包。 对于神经网络,使用 keras。
很抱歉,我无法为您提供您可能期望的解决问题的方法。你的问题提得真宽泛。