哪种监督机器学习分类方法适合随机传播类?
Which supervised machine learning classification method suits for randomly spread classes?
如果 类 是随机分布的或者它有更多的噪音,哪种类型的监督 ML 分类模型会给出更好的结果,为什么?
很难说哪个分类器在一般问题上表现最好。它通常需要针对给定问题测试各种算法,以确定哪个分类器表现最佳。
最佳性能还取决于问题的性质。 this Whosebug question 中有一个很好的答案,它着眼于各种评分指标。对于每个问题,都需要了解并考虑哪种评分指标最好。
综上所述,神经网络、随机森林分类器、支持向量机和各种其他方法都是创建有用模型的候选者,因为 类 正如您所指出的那样分布均匀。当 类 为 imbalanced 时,规则略有变化,因为大多数 ML 算法都假设平衡。
我的建议是尝试几种不同的算法,并调整超参数,以针对您的特定应用程序比较它们。您经常会发现一种算法更好,但不是特别好。根据我的经验,通常更重要的是如何预处理数据以及如何准备特征。这又是一个高度通用的答案,因为它在很大程度上取决于您给定的应用程序。
如果 类 是随机分布的或者它有更多的噪音,哪种类型的监督 ML 分类模型会给出更好的结果,为什么?
很难说哪个分类器在一般问题上表现最好。它通常需要针对给定问题测试各种算法,以确定哪个分类器表现最佳。
最佳性能还取决于问题的性质。 this Whosebug question 中有一个很好的答案,它着眼于各种评分指标。对于每个问题,都需要了解并考虑哪种评分指标最好。
综上所述,神经网络、随机森林分类器、支持向量机和各种其他方法都是创建有用模型的候选者,因为 类 正如您所指出的那样分布均匀。当 类 为 imbalanced 时,规则略有变化,因为大多数 ML 算法都假设平衡。
我的建议是尝试几种不同的算法,并调整超参数,以针对您的特定应用程序比较它们。您经常会发现一种算法更好,但不是特别好。根据我的经验,通常更重要的是如何预处理数据以及如何准备特征。这又是一个高度通用的答案,因为它在很大程度上取决于您给定的应用程序。