朴素贝叶斯分类器伯努利模型

Naïve Bayes Classifier Bernoulli model

我正在class验证发票和收据,我将使用伯努利模型。

这是朴素贝叶斯class化器:

P(c|x) = P(x|c) x P(c) / P(x)

我知道如何计算 P(c) class 先验概率,因为我们假设所有单词都是独立的,所以我们不需要 P(x)。

现在公式将是这样的:P(c|x) = P(x|c) x P(c) 为了计算 P(x|c),我们使用可能性方法计算所有单词概率 P(c|X) = P(x1|c)P(x2|c)*P(x3|c)....

我的问题是在计算出可能性后是否需要将它与P(c)相乘,P(c|X) = P(x1|c)P(x2|c)*P(x3| c)...*P(c)?

P(c|x)等于P(x|c) P(c)。它是 成比例的 ,就像在分类过程中一样

cl(x) = arg max_c P(c|x) = arg max_c P(x|c) P(c) / P(x) = arg max_c P(x|c) P(c)

这适用于每个概率分布,其中P(x)>0,此时不需要任何贝叶斯假设。这只是一个简单的贝叶斯定理+注意到 P(x) 只是这个等式中的一个正常数。

因此你从不实际计算P(c|x),你只计算P(x|c) P(c),这会给你相同的分类.我希望这表明你的分类 必须是 基于 P(x|c)P(c) 的乘积,正如你指出的 P(x|c) = PROD_i P(x_i|c) (这里我们使用关于独立性的朴素贝叶斯假设,而不是之前)。