R glm回归不包括几个虚拟变量
R glm regression not including several dummy variables
我有一个数据集 (acs_hh
),其中一列是 race_eth
。
对于以下回归:
reg <- glm(acs_hh$own ~ acs_hh$hhincome + acs_hh$race_eth, family = "binomial")
summary(q7reg)
然而,在我的数据中,存在的不仅仅是摘要中提到的四个种族; asian 在我的数据集中也是一个种族。
为什么 R 不计算亚洲人的系数,即 acs_hh$race_ethasian
,非 hisp?
当使用虚拟变量时,其中一个类别被排除,并作为参考类别与所有其他类别进行比较。因此,要计算亚洲人的拟合值,non-hisp 您可以将所有其他类别设置为 0。
因为"asian"是acs_hh$race_eth
的参考水平--所有其他系数代表相对于参考水平的影响(在你的情况下,我怀疑是"asian"
因为这是按字母顺序排列的第一级)。
我有一个数据集 (acs_hh
),其中一列是 race_eth
。
对于以下回归:
reg <- glm(acs_hh$own ~ acs_hh$hhincome + acs_hh$race_eth, family = "binomial")
summary(q7reg)
然而,在我的数据中,存在的不仅仅是摘要中提到的四个种族; asian 在我的数据集中也是一个种族。
为什么 R 不计算亚洲人的系数,即 acs_hh$race_ethasian
,非 hisp?
当使用虚拟变量时,其中一个类别被排除,并作为参考类别与所有其他类别进行比较。因此,要计算亚洲人的拟合值,non-hisp 您可以将所有其他类别设置为 0。
因为"asian"是acs_hh$race_eth
的参考水平--所有其他系数代表相对于参考水平的影响(在你的情况下,我怀疑是"asian"
因为这是按字母顺序排列的第一级)。