如何解释两个虚拟变量之间相互作用项的系数

How to interpret coefficient on interaction term between 2 dummy variables

使用逻辑回归,我试图模拟女性和收入低于贫困线(两个二元变量)对预测患高血压概率的边际效应。我创建了一个交互项 (poverty_FEMALE) 来尝试对此建模,但不确定我对系数的解释是否正确。

这样说对吗:

如果是这样,当这两个变量的系数本身为正值时,为什么贫困人口和女性的风险较低才有意义?

pov_FEMALE=(df$BELOW_100_POVERTY*(df$FEMALE))

Marginal Effects:
                       dF/dx  Std. Err.       z     P>|z|    
BELOW_100_POVERTY  0.0670417  0.0243266  2.7559 0.0058531 **  
FEMALE             0.0410705  0.0172280  2.3839 0.0171283 *  
pov_FEMALE        -0.0553485  0.0160284 -3.4531 0.0005541 ***

假设 dF/dx 显示的是您想要的边际效应类型,

  • 低于阈值 (0.067) 和男性 (0) 的边际效应是:.067

  • 女性 (0.041) 和不贫困 (0) 的边际效应是:0.041

  • 女性 (0.041) 和贫困 (0.067) 以及联合条件 (-0.055) 的边际效应是:0.041 + 0.067 -.055

想想偏导数的意义。当您对变量 x 求估计方程的偏导数时,直接效应和交互效应是相加的。

假设你描述的变量是指标(值为1或0),基数的边际效应(值为0,比如“男性”)并没有与截距分开识别。只能将结果解释为基线概率加上边际效应,在这种情况下,基线被定义为男性和 non-poor.