如何解释两个虚拟变量之间相互作用项的系数
How to interpret coefficient on interaction term between 2 dummy variables
使用逻辑回归,我试图模拟女性和收入低于贫困线(两个二元变量)对预测患高血压概率的边际效应。我创建了一个交互项 (poverty_FEMALE) 来尝试对此建模,但不确定我对系数的解释是否正确。
这样说对吗:
- 低于阈值且男性的边际效应为:.067 - .055
- 身为女性而不处于贫困中的边际效应是:.041 - .055
- 女性和贫困的边际效应是 -.055?
如果是这样,当这两个变量的系数本身为正值时,为什么贫困人口和女性的风险较低才有意义?
pov_FEMALE=(df$BELOW_100_POVERTY*(df$FEMALE))
Marginal Effects:
dF/dx Std. Err. z P>|z|
BELOW_100_POVERTY 0.0670417 0.0243266 2.7559 0.0058531 **
FEMALE 0.0410705 0.0172280 2.3839 0.0171283 *
pov_FEMALE -0.0553485 0.0160284 -3.4531 0.0005541 ***
假设 dF/dx 显示的是您想要的边际效应类型,
低于阈值 (0.067) 和男性 (0) 的边际效应是:.067
女性 (0.041) 和不贫困 (0) 的边际效应是:0.041
女性 (0.041) 和贫困 (0.067) 以及联合条件 (-0.055) 的边际效应是:0.041 + 0.067 -.055
想想偏导数的意义。当您对变量 x 求估计方程的偏导数时,直接效应和交互效应是相加的。
假设你描述的变量是指标(值为1或0),基数的边际效应(值为0,比如“男性”)并没有与截距分开识别。只能将结果解释为基线概率加上边际效应,在这种情况下,基线被定义为男性和 non-poor.
使用逻辑回归,我试图模拟女性和收入低于贫困线(两个二元变量)对预测患高血压概率的边际效应。我创建了一个交互项 (poverty_FEMALE) 来尝试对此建模,但不确定我对系数的解释是否正确。
这样说对吗:
- 低于阈值且男性的边际效应为:.067 - .055
- 身为女性而不处于贫困中的边际效应是:.041 - .055
- 女性和贫困的边际效应是 -.055?
如果是这样,当这两个变量的系数本身为正值时,为什么贫困人口和女性的风险较低才有意义?
pov_FEMALE=(df$BELOW_100_POVERTY*(df$FEMALE))
Marginal Effects:
dF/dx Std. Err. z P>|z|
BELOW_100_POVERTY 0.0670417 0.0243266 2.7559 0.0058531 **
FEMALE 0.0410705 0.0172280 2.3839 0.0171283 *
pov_FEMALE -0.0553485 0.0160284 -3.4531 0.0005541 ***
假设 dF/dx 显示的是您想要的边际效应类型,
低于阈值 (0.067) 和男性 (0) 的边际效应是:.067
女性 (0.041) 和不贫困 (0) 的边际效应是:0.041
女性 (0.041) 和贫困 (0.067) 以及联合条件 (-0.055) 的边际效应是:0.041 + 0.067 -.055
想想偏导数的意义。当您对变量 x 求估计方程的偏导数时,直接效应和交互效应是相加的。
假设你描述的变量是指标(值为1或0),基数的边际效应(值为0,比如“男性”)并没有与截距分开识别。只能将结果解释为基线概率加上边际效应,在这种情况下,基线被定义为男性和 non-poor.