Python:具有两个分类变量交互项的 Probit 回归

Python: Probit Regression with interaction term of two categorial variables

我想要 运行 概率回归(见下面的模型),其中两个虚拟变量(性别 x 治疗)相互作用。但是,当在模型中包含 treatment*gender 时,我收到错误消息“分类数据不能 >1 维”。 与使用其他分析软件相比,我通过创建一个额外的虚拟变量来获得近似结果,如果两个虚拟变量都等于 1,该虚拟变量的值为 1 - 但我认为这对于基础统计模型来说并不完全正确。相互作用的边际效应必须是治疗*性别的交叉导数,而不仅仅是共同出现的导数。 不幸的是,我在 Stats 模型文档中找不到任何相关信息。如何正确包含交互项?

非常感谢!

probit_model = probit("decision ~ gender + treatment1 + treatment2 + 
              control1 + control2 + contorl3 + treatment1*Gender + treatment2*Gender", data_probit).fit() 
              #here the error raises

probit_model = probit("decision ~ gender + treatment1 + treatment2 + 
               treatment1_Gender + treatment2_gender + control1 + control2 + contorl3", data_probit).fit()

尝试以下操作:

probit_model = probit("decision ~ control1 + control2 + contorl3 + 
                      treatment1*Gender + treatment2*Gender",
                      data_probit).fit() 

查看 patsy 的文档 here,patsy 似乎在使用 * 时自动添加了主要效果。这意味着通过指定 treatment1*gender,它会自动解释为 treatment1+gender+treatment1:gender。这里的前两项是从您的公式中重复的。

如果这不起作用,请提供包含数据的最小可重现示例。参见 here