检测优秀学生画像的最佳数据挖掘算法

Best data mining algorithm for detect the profile of students with excellent grades

我有一个学生资料数据集(年龄、性别、地址等)和成绩记录(1 最差,5 最好)。 我想知道什么是最好的数据挖掘算法来确定那些成绩大于 4 的学生的概况。 直到此刻,我一直认为在聚类算法(K-means ...)总线中这些是无监督算法,因此很难以 100% 的概率修复一个具有希望表现的学生的集群。你有什么建议吗?是否有更好的算法来实现目标?谢谢!!

我觉得这不像是集群问题。

相反,您正在寻找目标变量 "grade > 4" 上的决策树。

决策树、神经网络、SVD 可用于表征成绩优异的学生。无法保证完美分类。您可以根据准确度度量查看模型的质量。