用一阶差分法处理二元变量来解决自相关问题

Treating binary variables for first difference method to solve autocorrelation issue

我的面板数据存在自相关问题。 所以我决定用一阶差分法来处理这个问题。

我的大部分自变量都是二进制的。 因此,如果我对此进行有限差分法, 我得到 -1、0 和 1,而不是以前的 0 或 1。

这样可以吗?

此外,我的数据集时间流程如下,我不确定在同一天发生多个差异事件时,我如何在这种情况下应用第一个差异方法:

     Date   ID  X   Y   Z   L   M   A   B   C   D   E
 01/01/2017 A   0   1   0   0   0   0   1   0   0   7.8
 01/01/2017 A   0   1   0   0   0   1   0   0   1   6.5
 01/01/2017 B   0   0   0   0   1   1   0   0   1   6.5
 01/03/2017 A   0   1   0   0   0   0   0   0   0   7.8
 01/04/2017 C   0   0   1   0   0   1   0   0   0   6.5
 01/04/2017 C   0   0   0   0   0   0   1   0   0   7.3

我根据日期和ID重新排序,变成如下:

    Date    ID  X   Y   Z   L   M   A   B   C   D   E
 01/01/2017 A   0   1   0   0   0   0   1   0   0   7.8
 01/01/2017 A   0   1   0   0   0   1   0   0   1   6.5
 01/01/2017 B   0   0   0   0   1   1   0   0   1   6.5
 01/03/2017 A   0   1   0   0   0   0   0   0   0   7.8
 01/04/2017 C   0   0   1   0   0   1   0   0   0   6.5
 01/04/2017 C   0   0   0   0   0   0   1   0   0   7.3

此外,这个新的数据排序是否可以在我的面板回归中使用,并且还可以利用这个行序列对此进行第一个差异?

回归量可以是时不变的,也可以是时变的。对于某些估计量,尤其是组内差分估计量和一阶差分估计量,仅识别时变回归变量的系数(Cameron 和 Triverdi,Microeconometric Methods and Applications.)。你的一些回归变量似乎是时不变的。

您处理的不是时间序列,而是面板数据或纵向数据。当然,您有重复的 ID 和日期。也就是说,您需要使用 Arellano-Bond 和 Blundell-Bond 估计器等面板数据工具来处理自相关,仅举几例。请参阅 R plm 包中的 pgmm 或 Stata 中的 xtdpdsysxtabond

如果您有多个变量来标识您的小组 ID,那么您可以使用以下方法对其进行聚合:R create ID within a group。如果你正在使用 Stata,你可以这样做: egen id = group(sub_id_1 sub_id_2).