运行 缺少观察 sas 的回归
Running regression with missing observation sas
我有以下数据集:
Date Lag2_ADS ADS EMP
May06 . 66.2 2
Jun06 . 55 3.3
Jul06 66.2 45.6 1.2
Aug06 55 -7.9 1.2
Sep06 45.6 -16.8 1.3
数据持续到7月15日
然后我运行进行以下回归:
ODS listing;
ODS output FitStatistics =Mydata
proc reg data = my data;
where Date > '01Jul2006";
model Emp = Lag2_ADS;
运行;
退出;
现在,我的问题是当我 运行 程序时,我是否需要指定
其中 Date > '01Jul2006" 或者 SAS 会自动处理缺失的观察结果。
我的另一个问题是,如果我不指定日期 >'01Jul2006',SAS 会使用什么 EMP 和 Lag2_ADS 值开始回归?
P.S。我 运行 使用和不使用 Date 子集的回归以及生成的 R 方对于两者都是不同的,所以我想确保我 运行 进行了正确的回归。
PROC REG constructs only one crossproducts matrix for the variables in
all regressions. If any variable needed for any regression is missing,
the observation is excluded from all estimates. If you include
variables with missing values in the VAR statement, the corresponding
observations are excluded from all analyses, even if you never include
the variables in a model. PROC REG assumes that you might want to
include these variables after the first RUN statement and deletes
observations with missing values.
您的 R 平方值不同,因为您使用的是 >,而不是 >=。
where Date > '01JUL2006'd
包括 Aug06、Sep06
where Date >= '01JUL2006'd
包括 Jul06、Aug06、Sep06
无论是否使用 >= 过滤器,您都应该看到相同的 R 平方值。
我有以下数据集:
Date Lag2_ADS ADS EMP
May06 . 66.2 2
Jun06 . 55 3.3
Jul06 66.2 45.6 1.2
Aug06 55 -7.9 1.2
Sep06 45.6 -16.8 1.3
数据持续到7月15日
然后我运行进行以下回归:
ODS listing;
ODS output FitStatistics =Mydata
proc reg data = my data;
where Date > '01Jul2006";
model Emp = Lag2_ADS;
运行; 退出;
现在,我的问题是当我 运行 程序时,我是否需要指定 其中 Date > '01Jul2006" 或者 SAS 会自动处理缺失的观察结果。
我的另一个问题是,如果我不指定日期 >'01Jul2006',SAS 会使用什么 EMP 和 Lag2_ADS 值开始回归?
P.S。我 运行 使用和不使用 Date 子集的回归以及生成的 R 方对于两者都是不同的,所以我想确保我 运行 进行了正确的回归。
PROC REG constructs only one crossproducts matrix for the variables in all regressions. If any variable needed for any regression is missing, the observation is excluded from all estimates. If you include variables with missing values in the VAR statement, the corresponding observations are excluded from all analyses, even if you never include the variables in a model. PROC REG assumes that you might want to include these variables after the first RUN statement and deletes observations with missing values.
您的 R 平方值不同,因为您使用的是 >,而不是 >=。
where Date > '01JUL2006'd
包括 Aug06、Sep06
where Date >= '01JUL2006'd
包括 Jul06、Aug06、Sep06
无论是否使用 >= 过滤器,您都应该看到相同的 R 平方值。