朴素贝叶斯:观察变量的异构 CPD
Naive Bayes: Heterogeneous CPDs for observation variables
我正在使用朴素贝叶斯模型进行二进制分类,使用离散变量和连续变量的组合。我的问题是,我可以对连续和离散观察变量使用不同的条件概率分布 (CPD) 函数吗?
例如,我对连续变量使用高斯 CPD,对离散变量使用一些确定性 CPD ?
谢谢
是的,在同一模型中混合使用连续变量和离散变量是正常的。考虑以下示例。
假设我有两个随机变量:
- T - 今天的温度
- D - 星期几
注意T是连续的,D是离散的。假设我想预测约翰是否会去海滩,由二进制变量 B 表示。然后我可以如下建立我的推论,假设 T 和 D 在给定 B 的情况下是条件独立的。
p(T|B) • p(D|B) • p(B)
p(B|T,D) = ━━━━━━━━━━━━ ∝ p(T|B) • p(D|B) • p(B)
p(T) • p(D)
p(T|B) 可以是高斯分布,p(D|B) 可以是离散分布,p(B) 可以是约翰去海滩的频率的离散先验。
我正在使用朴素贝叶斯模型进行二进制分类,使用离散变量和连续变量的组合。我的问题是,我可以对连续和离散观察变量使用不同的条件概率分布 (CPD) 函数吗? 例如,我对连续变量使用高斯 CPD,对离散变量使用一些确定性 CPD ?
谢谢
是的,在同一模型中混合使用连续变量和离散变量是正常的。考虑以下示例。
假设我有两个随机变量:
- T - 今天的温度
- D - 星期几
注意T是连续的,D是离散的。假设我想预测约翰是否会去海滩,由二进制变量 B 表示。然后我可以如下建立我的推论,假设 T 和 D 在给定 B 的情况下是条件独立的。
p(T|B) • p(D|B) • p(B)
p(B|T,D) = ━━━━━━━━━━━━ ∝ p(T|B) • p(D|B) • p(B)
p(T) • p(D)
p(T|B) 可以是高斯分布,p(D|B) 可以是离散分布,p(B) 可以是约翰去海滩的频率的离散先验。