预测等级的朴素贝叶斯

naive bayes for Forecast grade

我有 100 名学生的四节课(例如 a 课、b 课、c 课、d 课)的成绩数据集,让我们假设这个成绩与 f课成绩

我想为那个四年级的预测年级课 f 实施朴素贝叶斯,但我不知道如何使用输入。 我阅读了用于垃圾邮件检测的朴素贝叶斯,其中计算了每个单词的可能性。 但是对于成绩,我不知道我必须计算什么可能性。 我试过像垃圾邮件一样,但对于这个例子,我只有四个名字(每节课)

为了进行良好的 class 化,您需要了解一些关于 class 学生的信息。按照您的示例,垃圾邮件检测基于单词、停用词,通常是垃圾邮件(购买、促销、金钱)或 http headers 中的来源。 对于预测学生成绩的案例,您可以想象获得有关学生的信息,例如:社交 class,他是否从事体育运动,男性还是女性等等。

回到你的问题,有趣的不是课程的名称,而是每个学生在这节课上的成绩。您需要对每四课和第 f 课进行评分,以训练朴素贝叶斯 classifier。

您的条目可能如下所示:

StudentID   gradeA  gradeB   gradeC    gradeD   gradeF
1             10       9       8         5         8
2              3       5       3         8         8
3             5        3       1         1         2
4             10      10       10        5         4

在训练您的 classifier 之后,您将像这样为新学生传递新条目:

StudentID   gradeA  gradeB   gradeC    gradeD  
1058          1        5       8         4

class生成器将能够预测 F 课的成绩,同时考虑先行成绩。

你可能已经注意到我有意做了一个训练数据集,其中 gradeF 与 gradeD 高度相关。这就是贝叶斯 classifier 将尝试以更复杂的方式学习的内容。