监督机器学习算法
Supervised Machine Learning algorithms
我正在尝试使用监督机器学习算法对数据进行分类。
一切正常,但出于好奇,我尝试了在单个数据集上同时使用 6 种分类算法。之后的步骤如下-
1> Train all the algorithms.
2> predicted the result(either 1 or 0) for all test_data individually, by all algorithms.
3> If most of the algos gave 0, i considered the result for that data pair to be 0, similarly for result 1.
4> Then i found out the overall accuracy.
我预计 总体准确度 会高于单个结果(通过每个算法单独工作),但我几乎得到了平均准确度。(这里的平均值是指单个算法准确度的平均值)。
谁能帮我找出原因吗?
这取决于您选择的算法。许多算法对不同的事物敏感。例如,k-means、线性SVM和幂迭代聚类会得到明显不同的结果。
你得到了你想要的:你平均了选票,没有以任何方式协调算法。你的成绩一般。
我怀疑加权平均会有多大帮助;你所做的只是训练一个元模型。相反,请考虑您拥有的数据集。您需要研究建模算法,并选择一种在数据集的统计形状上能够很好地满足预期目的的算法。由于您已向我们提供了 none 这一背景信息,因此我们无法提供具体信息。
我正在尝试使用监督机器学习算法对数据进行分类。
一切正常,但出于好奇,我尝试了在单个数据集上同时使用 6 种分类算法。之后的步骤如下-
1> Train all the algorithms.
2> predicted the result(either 1 or 0) for all test_data individually, by all algorithms.
3> If most of the algos gave 0, i considered the result for that data pair to be 0, similarly for result 1.
4> Then i found out the overall accuracy.
我预计 总体准确度 会高于单个结果(通过每个算法单独工作),但我几乎得到了平均准确度。(这里的平均值是指单个算法准确度的平均值)。
谁能帮我找出原因吗?
这取决于您选择的算法。许多算法对不同的事物敏感。例如,k-means、线性SVM和幂迭代聚类会得到明显不同的结果。
你得到了你想要的:你平均了选票,没有以任何方式协调算法。你的成绩一般。
我怀疑加权平均会有多大帮助;你所做的只是训练一个元模型。相反,请考虑您拥有的数据集。您需要研究建模算法,并选择一种在数据集的统计形状上能够很好地满足预期目的的算法。由于您已向我们提供了 none 这一背景信息,因此我们无法提供具体信息。