panelAR 无法将我的列识别为整数

panelAR doesn't recognise my coulmn as an integer

https://easyupload.io/3rnesm

所以我正在处理以下数据集:

# A tibble: 1,136 x 17
   ccode  year vanhdemo pcgnp  left ainew sdnew milctr2 britinfl  lpop  iwar  cwar popinc pcginc polrtnew lag_ainew lag_sdnew
   <dbl> <int>    <dbl> <dbl> <dbl> <dbl> <dbl>   <dbl>    <dbl> <dbl> <dbl> <dbl>  <dbl>  <dbl>    <dbl>     <dbl>     <dbl>
 1     2  1980     18.7  11.3     0     1     1       0        1  19.2     0     0   1.01   7.51        7        NA        NA
 2     2  1981     18.7  12.3     0     1     1       0        1  19.3     0     0   1.01   7.99        7         1         1
 3     2  1982     18.7  13.2     0     1     1       0        1  19.3     0     0   1.01   7.39        7         1         1
 4     2  1983     18.7  14.2     0     1     1       0        1  19.3     0     0   1.01   7.69        7         1         1
 5     2  1984     16.1  15.5     0     1     1       0        1  19.3     0     0   1.01   9.66        7         1         1
 6     2  1985     16.1  16.5     0     1     1       0        1  19.3     0     0   1.01   6.24        7         1         1
 7     2  1986     16.1  17.5     0     1     1       0        1  19.3     0     0   1.01   5.86        7         1         1
 8     2  1987     16.1  18.6     0     2     2       0        1  19.3     0     0   1.01   6.39        7         1         1
 9    20  1980     25.6  10.2     0     1     1       0        1  17.0     0     0   1.08   9.01        7        NA        NA
10    20  1981     25.6  10.7     0     1     1       0        1  17.0     0     0   1.08   5.77        7         1         1
# ... with 1,126 more rows

如您所见,R 将变量 year 识别为整数。最初,列值是数字,但我将它们转换为整数。但是,当我运行以下代码(使用panelAR包)时,我运行陷入困境:

panelAR(vanhdemo ~ pcgnp + left + lpop + iwar + milctr2 + britinfl, data = dat, 
        panelVar = "ccode", timeVar = "year", autoCorr = "psar1", panelCorrMethod = "pcse",
        rho.na.rm = TRUE, panel.weight = "t-1", bound.rho = TRUE)

我收到此错误消息:

Error: The time variable must be defined as an integer.

我不明白我在这里做错了什么。如果我重新创建数据集的一部分(如下所示),模型 运行 没问题。那么问题是否根源于数据集(最初是一个 .dta 文件)?如果有人有兴趣看的话我绝对可以上传

这是相同数据的一个小例子:

ccode  <- c(rep(2,8), rep(20, 2))
year  <- c(1980:1987, 1980, 1981)
vanhdemo <- c(rep(18.7, 4), rep(16.1, 4), rep(25.6, 2))
pcgnp  <- c(11.3, 12.3 , 13.2, 14.2, 15.5, 16.5, 17.5, 18.6, 10.2, 10.7)

dat <- data.frame(ccode, year, vanhdemo, pcgnp)

@xilliam 在评论中回答。解决方案是将 table 从 tibble 转换为数据框。

错误与 data.framestibbles 的不同行为有关。 Tibbles 是 special kind of data.frame 'prevent dimension dropping'。如果您尝试使用单个列名对 tibble 进行子集化, 你会得到一个 single-column tibble。然而,根据您如何对 data.frame 进行子集化,您可能会得到一个向量或 data.frame。您看到的错误是由这种区别引起的。在内部 panelAR() 对时间变量的数据 object 进行子集化:

time.vec <- data[, timeVar]

因此,如果 'data' 是小标题,则 'time.vec' 将是 single-column 小标题,而 如果 'data' 是一个 data.frame,'time.vec' 将是一个向量。 panelAR() 然后 检查 'time.vec' 是否为整数向量,并在数据 object 为 tibble 的情况下抛出错误。

您可以在示例数据中看到此行为,如下所示:

# make a tibble 
dat_tib <- tibble::as_tibble(dat)

# returns a vector
dat[, "year"]

# returns a data.frame
dat["year"]

# returns a tibble
dat_tib[, "year"]

# returns a tibble
dat_tib["year"]