sklearn 高斯朴素贝叶斯 - 为什么 "Gaussian"?

sklearn Gaussian Naive Bayes - why "Gaussian"?

我了解贝叶斯定理,但不了解分类器中的 "Gaussian" 部分是什么。为什么叫"Gaussian"?

考虑sklearn.naive_bayes.GaussianNB的设置。 fit 方法接受一个 x 和一个 y,并尝试适应它们。它们对应于随机变量Xy的实例,并且y取一些值c ∈ C。因此,我们可以估计 f(X|C = c)。当然,我们感兴趣的是P(C = c|X)。如果你还记得贝叶斯定理,

P(A | B) = P(B | A)P(A) / P(B),

我们需要 X 的先验分布来进行此反转。在 gaussian naive bayes 中,这被假定为正态分布。