如何解释两个虚拟变量之间相互作用项的系数

Question

使用逻辑回归，我试图模拟女性和收入低于贫困线（两个二元变量）对预测患高血压概率的边际效应。我创建了一个交互项 (poverty_FEMALE) 来尝试对此建模，但不确定我对系数的解释是否正确。

这样说对吗：

低于阈值且男性的边际效应为：.067 - .055
身为女性而不处于贫困中的边际效应是：.041 - .055
女性和贫困的边际效应是 -.055？

如果是这样，当这两个变量的系数本身为正值时，为什么贫困人口和女性的风险较低才有意义？

pov_FEMALE=(df$BELOW_100_POVERTY*(df$FEMALE))

Marginal Effects:
                       dF/dx  Std. Err.       z     P>|z|    
BELOW_100_POVERTY  0.0670417  0.0243266  2.7559 0.0058531 **  
FEMALE             0.0410705  0.0172280  2.3839 0.0171283 *  
pov_FEMALE        -0.0553485  0.0160284 -3.4531 0.0005541 ***

Answer 1

假设 dF/dx 显示的是您想要的边际效应类型，

低于阈值 (0.067) 和男性 (0) 的边际效应是：.067
女性 (0.041) 和不贫困 (0) 的边际效应是：0.041
女性 (0.041) 和贫困 (0.067) 以及联合条件 (-0.055) 的边际效应是：0.041 + 0.067 -.055

想想偏导数的意义。当您对变量 x 求估计方程的偏导数时，直接效应和交互效应是相加的。

假设你描述的变量是指标（值为1或0），基数的边际效应（值为0，比如“男性”）并没有与截距分开识别。只能将结果解释为基线概率加上边际效应，在这种情况下，基线被定义为男性和 non-poor.

如何解释两个虚拟变量之间相互作用项的系数

How to interpret coefficient on interaction term between 2 dummy variables

regression

analysis

r

coefficients

marginal-effects