从 R 的逻辑回归中解释系数

Interpreting coefficients from Logistic Regression from R

全部,

我 运行 对一组分类变量和连续变量进行逻辑回归,将二元事件作为因变量。

现在 post 建模,我观察到一组显示负号的分类变量,我想这是为了理解如果该分类变量出现的次数多,则因变量出现的概率低。

但是当我看到那个自变量出现的百分比时,我看到了相反的趋势正在发生。因此结果似乎是违反直觉的。这可能发生的任何原因。我尝试用一​​个伪示例在下面进行解释。

因变量 - E 预测因素: 1. 分类变量 - 具有 2 个级别 (0,1) 的 Cat1 2. 连续 Var - Con1 3. 分类变量 - 具有 2 个级别 (0,1) 的 Cat2 Post建模: 假设所有都是显着的,系数如下所示, Cat1 - (-0.6) Con1- (0.3) Cat2 - (-0.4)

但是当我计算事件 E 在 Cat 1 上的发生百分比时,我观察到当 Cat1 为 1 时发生百分比很高,我认为这是违反直觉的。

请帮助理解这一点。

逻辑回归系数与事件概率的变化没有直接关系,而是事件几率变化的相对度量。 This article 对如何解释逻辑回归的系数有详细的推导。在您的上下文中,CAT1 的系数为 -0.6 表示 p(E|CAT1 = 1) < p(E|CAT1 = 0) 并且它与 p(E|CAT1 = 1) 的大小无关。