在贝叶斯 Probit 回归模型 (rstanarm) 中对独立变量组使用不同的先验

Use of different priors for groups of idepedent variables in a Bayesian Probit regression model (rstanarm)

我正在使用 rstanarm 包中的贝叶斯逻辑回归 (probit) 来训练默认事件模型。作为输入,该模型接受一些财务比率和一些定性数据。有没有一种方法可以使系数真正正则化,仅针对定性数据,使其始终为正?

例如,当我对所有内容使用单一先验时,我得到了这些结果(我使用 MCMC 校准模型,set.seed(12345)):

prior <- rstanarm::normal(location = 0, scale = NULL, autoscale = TRUE)

model.formula <-
  formula(paste0('default_events ~ fin_ratio_1 + ',
                 'fin_ratio_2 + fin_ratio_3 +',
                 'fin_ratio_4 + fin_ratio_5 +',
                 'fin_ratio_6 + fin_ratio_7 +',
                 'fin_ratio_8 + Qual_1 + Qual_2 +',
                 'Qual_3 + Qual_4'))

bayesian.model <- rstanarm::stan_glm(model.formula,
                                     family = binomial(link = "probit"),
                                     data = as.data.frame(ds), prior = prior,
                                     prior_intercept = NULL,
                                     init_r = .1, iter=600, warmup=200)

系数如下:

summary(bayesian.model)

Estimates:
               mean    sd      2.5%    25%     50%     75%     97.5%
(Intercept)    -2.0     0.4    -2.7    -2.3    -2.0    -1.7    -1.3
fin_ratio_1    -0.7     0.1    -0.9    -0.8    -0.7    -0.6    -0.4
fin_ratio_2    -0.3     0.1    -0.5    -0.4    -0.3    -0.2    -0.1
fin_ratio_3     0.4     0.1     0.2     0.4     0.4     0.5     0.6
fin_ratio_4     0.3     0.1     0.1     0.2     0.3     0.3     0.4
fin_ratio_5     0.2     0.1     0.1     0.2     0.2     0.3     0.4
fin_ratio_6    -0.2     0.1    -0.4    -0.2    -0.2    -0.1     0.0
fin_ratio_7    -0.3     0.1    -0.5    -0.3    -0.3    -0.2    -0.1
fin_ratio_8    -0.2     0.1    -0.5    -0.3    -0.2    -0.1     0.0
Qual_1         -0.2     0.1    -0.3    -0.2    -0.2    -0.1    -0.1
Qual_2          0.0     0.1    -0.1    -0.1     0.0     0.0     0.1
Qual_3          0.2     0.0     0.1     0.1     0.2     0.2     0.3
Qual_4          0.0     0.2    -0.3    -0.1     0.0     0.1     0.3

问题是,我可以使用两个不同的发行版吗?喜欢 fin_ratio_x 变量使用正态,Qual_x 变量使用指数或狄利克雷?

rstanarm 包提供的模型既不可能使用不同的先验族,也不可能对系数进行不等式限制。使用 brms 包或编写您自己的 Stan 程序可以很容易地做到其中之一或两者。