用一阶差分法处理二元变量来解决自相关问题
Treating binary variables for first difference method to solve autocorrelation issue
我的面板数据存在自相关问题。
所以我决定用一阶差分法来处理这个问题。
我的大部分自变量都是二进制的。
因此,如果我对此进行有限差分法,
我得到 -1、0 和 1,而不是以前的 0 或 1。
这样可以吗?
此外,我的数据集时间流程如下,我不确定在同一天发生多个差异事件时,我如何在这种情况下应用第一个差异方法:
Date ID X Y Z L M A B C D E
01/01/2017 A 0 1 0 0 0 0 1 0 0 7.8
01/01/2017 A 0 1 0 0 0 1 0 0 1 6.5
01/01/2017 B 0 0 0 0 1 1 0 0 1 6.5
01/03/2017 A 0 1 0 0 0 0 0 0 0 7.8
01/04/2017 C 0 0 1 0 0 1 0 0 0 6.5
01/04/2017 C 0 0 0 0 0 0 1 0 0 7.3
我根据日期和ID重新排序,变成如下:
Date ID X Y Z L M A B C D E
01/01/2017 A 0 1 0 0 0 0 1 0 0 7.8
01/01/2017 A 0 1 0 0 0 1 0 0 1 6.5
01/01/2017 B 0 0 0 0 1 1 0 0 1 6.5
01/03/2017 A 0 1 0 0 0 0 0 0 0 7.8
01/04/2017 C 0 0 1 0 0 1 0 0 0 6.5
01/04/2017 C 0 0 0 0 0 0 1 0 0 7.3
此外,这个新的数据排序是否可以在我的面板回归中使用,并且还可以利用这个行序列对此进行第一个差异?
回归量可以是时不变的,也可以是时变的。对于某些估计量,尤其是组内差分估计量和一阶差分估计量,仅识别时变回归变量的系数(Cameron 和 Triverdi,Microeconometric Methods and Applications.)。你的一些回归变量似乎是时不变的。
您处理的不是时间序列,而是面板数据或纵向数据。当然,您有重复的 ID 和日期。也就是说,您需要使用 Arellano-Bond 和 Blundell-Bond 估计器等面板数据工具来处理自相关,仅举几例。请参阅 R plm 包中的 pgmm
或 Stata 中的 xtdpdsys
或 xtabond
。
如果您有多个变量来标识您的小组 ID,那么您可以使用以下方法对其进行聚合:R create ID within a group。如果你正在使用 Stata,你可以这样做:
egen id = group(sub_id_1 sub_id_2)
.
我的面板数据存在自相关问题。 所以我决定用一阶差分法来处理这个问题。
我的大部分自变量都是二进制的。 因此,如果我对此进行有限差分法, 我得到 -1、0 和 1,而不是以前的 0 或 1。
这样可以吗?
此外,我的数据集时间流程如下,我不确定在同一天发生多个差异事件时,我如何在这种情况下应用第一个差异方法:
Date ID X Y Z L M A B C D E
01/01/2017 A 0 1 0 0 0 0 1 0 0 7.8
01/01/2017 A 0 1 0 0 0 1 0 0 1 6.5
01/01/2017 B 0 0 0 0 1 1 0 0 1 6.5
01/03/2017 A 0 1 0 0 0 0 0 0 0 7.8
01/04/2017 C 0 0 1 0 0 1 0 0 0 6.5
01/04/2017 C 0 0 0 0 0 0 1 0 0 7.3
我根据日期和ID重新排序,变成如下:
Date ID X Y Z L M A B C D E
01/01/2017 A 0 1 0 0 0 0 1 0 0 7.8
01/01/2017 A 0 1 0 0 0 1 0 0 1 6.5
01/01/2017 B 0 0 0 0 1 1 0 0 1 6.5
01/03/2017 A 0 1 0 0 0 0 0 0 0 7.8
01/04/2017 C 0 0 1 0 0 1 0 0 0 6.5
01/04/2017 C 0 0 0 0 0 0 1 0 0 7.3
此外,这个新的数据排序是否可以在我的面板回归中使用,并且还可以利用这个行序列对此进行第一个差异?
回归量可以是时不变的,也可以是时变的。对于某些估计量,尤其是组内差分估计量和一阶差分估计量,仅识别时变回归变量的系数(Cameron 和 Triverdi,Microeconometric Methods and Applications.)。你的一些回归变量似乎是时不变的。
您处理的不是时间序列,而是面板数据或纵向数据。当然,您有重复的 ID 和日期。也就是说,您需要使用 Arellano-Bond 和 Blundell-Bond 估计器等面板数据工具来处理自相关,仅举几例。请参阅 R plm 包中的 pgmm
或 Stata 中的 xtdpdsys
或 xtabond
。
如果您有多个变量来标识您的小组 ID,那么您可以使用以下方法对其进行聚合:R create ID within a group。如果你正在使用 Stata,你可以这样做:
egen id = group(sub_id_1 sub_id_2)
.