线性回归中的sas协变量

sas covariates in a linear regressions

我是运行SAS中的简单线性回归。回归具有三个不同的参与者组作为预测变量(以第 1 组为参考)、结果是一个连续的社会支持变量和五个协变量。其中三个协变量是二分的(agesex、&education),一个是三水平名义变量(marital status),最后一个是连续的(它是一个 chronic disease index)。

我的问题是:我是否需要以某种方式在 SAS 编码中指定不同类型的协变量?

这个编码示例是否正确?:

proc glm data=work.example;

class group age sex education marital education chronic_diseases;

model social_support = group age sex education marital education chronic_diseases;

estimate 'group 1 vs group 2' group -1 1 0;

estimate 'group 1 vs group 3' group -1 0 1;

run;

class 语句告诉 SAS 您要考虑一个变量是非连续的:即分类变量或二元变量。它不区分两者,默认情况下它会根据第一个值按升序选择引用,除非您指定引用组。

例如,如果您比较 ApplesOranges,SAS 将使用 Apples 作为参考值。嘿,它们是水果——你可以将水果与水果进行比较! :)

除非在 class 语句中指定,否则所有模型协变量均被视为数字。由于 chronic_diseases 是连续的,只需将其从 class 语句中删除即可;否则,SAS 将查看 chronic_diseases 的每个值并将其视为一个级别,然后将它们全部与最低级别进行比较。

proc glm data=work.example;
    class group age sex education marital education;

    model social_support = group age sex education marital education chronic_diseases;

    estimate 'group 1 vs group 2' group -1 1 0;
    estimate 'group 1 vs group 3' group -1 0 1;
run;