从 R 的逻辑回归中解释系数
Interpreting coefficients from Logistic Regression from R
全部,
我 运行 对一组分类变量和连续变量进行逻辑回归,将二元事件作为因变量。
现在 post 建模,我观察到一组显示负号的分类变量,我想这是为了理解如果该分类变量出现的次数多,则因变量出现的概率低。
但是当我看到那个自变量出现的百分比时,我看到了相反的趋势正在发生。因此结果似乎是违反直觉的。这可能发生的任何原因。我尝试用一个伪示例在下面进行解释。
因变量 - E
预测因素:
1. 分类变量 - 具有 2 个级别 (0,1) 的 Cat1
2. 连续 Var - Con1
3. 分类变量 - 具有 2 个级别 (0,1) 的 Cat2
Post建模:
假设所有都是显着的,系数如下所示,
Cat1 - (-0.6)
Con1- (0.3)
Cat2 - (-0.4)
但是当我计算事件 E 在 Cat 1 上的发生百分比时,我观察到当 Cat1 为 1 时发生百分比很高,我认为这是违反直觉的。
请帮助理解这一点。
逻辑回归系数与事件概率的变化没有直接关系,而是事件几率变化的相对度量。 This article 对如何解释逻辑回归的系数有详细的推导。在您的上下文中,CAT1 的系数为 -0.6 表示 p(E|CAT1 = 1) < p(E|CAT1 = 0) 并且它与 p(E|CAT1 = 1) 的大小无关。
全部,
我 运行 对一组分类变量和连续变量进行逻辑回归,将二元事件作为因变量。
现在 post 建模,我观察到一组显示负号的分类变量,我想这是为了理解如果该分类变量出现的次数多,则因变量出现的概率低。
但是当我看到那个自变量出现的百分比时,我看到了相反的趋势正在发生。因此结果似乎是违反直觉的。这可能发生的任何原因。我尝试用一个伪示例在下面进行解释。
因变量 - E 预测因素: 1. 分类变量 - 具有 2 个级别 (0,1) 的 Cat1 2. 连续 Var - Con1 3. 分类变量 - 具有 2 个级别 (0,1) 的 Cat2 Post建模: 假设所有都是显着的,系数如下所示, Cat1 - (-0.6) Con1- (0.3) Cat2 - (-0.4)
但是当我计算事件 E 在 Cat 1 上的发生百分比时,我观察到当 Cat1 为 1 时发生百分比很高,我认为这是违反直觉的。
请帮助理解这一点。
逻辑回归系数与事件概率的变化没有直接关系,而是事件几率变化的相对度量。 This article 对如何解释逻辑回归的系数有详细的推导。在您的上下文中,CAT1 的系数为 -0.6 表示 p(E|CAT1 = 1) < p(E|CAT1 = 0) 并且它与 p(E|CAT1 = 1) 的大小无关。