panelAR 无法将我的列识别为整数
panelAR doesn't recognise my coulmn as an integer
所以我正在处理以下数据集:
# A tibble: 1,136 x 17
ccode year vanhdemo pcgnp left ainew sdnew milctr2 britinfl lpop iwar cwar popinc pcginc polrtnew lag_ainew lag_sdnew
<dbl> <int> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
1 2 1980 18.7 11.3 0 1 1 0 1 19.2 0 0 1.01 7.51 7 NA NA
2 2 1981 18.7 12.3 0 1 1 0 1 19.3 0 0 1.01 7.99 7 1 1
3 2 1982 18.7 13.2 0 1 1 0 1 19.3 0 0 1.01 7.39 7 1 1
4 2 1983 18.7 14.2 0 1 1 0 1 19.3 0 0 1.01 7.69 7 1 1
5 2 1984 16.1 15.5 0 1 1 0 1 19.3 0 0 1.01 9.66 7 1 1
6 2 1985 16.1 16.5 0 1 1 0 1 19.3 0 0 1.01 6.24 7 1 1
7 2 1986 16.1 17.5 0 1 1 0 1 19.3 0 0 1.01 5.86 7 1 1
8 2 1987 16.1 18.6 0 2 2 0 1 19.3 0 0 1.01 6.39 7 1 1
9 20 1980 25.6 10.2 0 1 1 0 1 17.0 0 0 1.08 9.01 7 NA NA
10 20 1981 25.6 10.7 0 1 1 0 1 17.0 0 0 1.08 5.77 7 1 1
# ... with 1,126 more rows
如您所见,R 将变量 year
识别为整数。最初,列值是数字,但我将它们转换为整数。但是,当我运行以下代码(使用panelAR包)时,我运行陷入困境:
panelAR(vanhdemo ~ pcgnp + left + lpop + iwar + milctr2 + britinfl, data = dat,
panelVar = "ccode", timeVar = "year", autoCorr = "psar1", panelCorrMethod = "pcse",
rho.na.rm = TRUE, panel.weight = "t-1", bound.rho = TRUE)
我收到此错误消息:
Error: The time variable must be defined as an integer.
我不明白我在这里做错了什么。如果我重新创建数据集的一部分(如下所示),模型 运行 没问题。那么问题是否根源于数据集(最初是一个 .dta 文件)?如果有人有兴趣看的话我绝对可以上传
这是相同数据的一个小例子:
ccode <- c(rep(2,8), rep(20, 2))
year <- c(1980:1987, 1980, 1981)
vanhdemo <- c(rep(18.7, 4), rep(16.1, 4), rep(25.6, 2))
pcgnp <- c(11.3, 12.3 , 13.2, 14.2, 15.5, 16.5, 17.5, 18.6, 10.2, 10.7)
dat <- data.frame(ccode, year, vanhdemo, pcgnp)
@xilliam 在评论中回答。解决方案是将 table 从 tibble 转换为数据框。
错误与 data.frames
和 tibbles
的不同行为有关。 Tibbles 是 special kind of data.frame 'prevent dimension dropping'。如果您尝试使用单个列名对 tibble 进行子集化,
你会得到一个 single-column tibble。然而,根据您如何对 data.frame 进行子集化,您可能会得到一个向量或 data.frame。您看到的错误是由这种区别引起的。在内部 panelAR()
对时间变量的数据 object 进行子集化:
time.vec <- data[, timeVar]
因此,如果 'data' 是小标题,则 'time.vec' 将是 single-column 小标题,而
如果 'data' 是一个 data.frame,'time.vec' 将是一个向量。 panelAR()
然后
检查 'time.vec' 是否为整数向量,并在数据 object 为 tibble 的情况下抛出错误。
您可以在示例数据中看到此行为,如下所示:
# make a tibble
dat_tib <- tibble::as_tibble(dat)
# returns a vector
dat[, "year"]
# returns a data.frame
dat["year"]
# returns a tibble
dat_tib[, "year"]
# returns a tibble
dat_tib["year"]
所以我正在处理以下数据集:
# A tibble: 1,136 x 17
ccode year vanhdemo pcgnp left ainew sdnew milctr2 britinfl lpop iwar cwar popinc pcginc polrtnew lag_ainew lag_sdnew
<dbl> <int> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
1 2 1980 18.7 11.3 0 1 1 0 1 19.2 0 0 1.01 7.51 7 NA NA
2 2 1981 18.7 12.3 0 1 1 0 1 19.3 0 0 1.01 7.99 7 1 1
3 2 1982 18.7 13.2 0 1 1 0 1 19.3 0 0 1.01 7.39 7 1 1
4 2 1983 18.7 14.2 0 1 1 0 1 19.3 0 0 1.01 7.69 7 1 1
5 2 1984 16.1 15.5 0 1 1 0 1 19.3 0 0 1.01 9.66 7 1 1
6 2 1985 16.1 16.5 0 1 1 0 1 19.3 0 0 1.01 6.24 7 1 1
7 2 1986 16.1 17.5 0 1 1 0 1 19.3 0 0 1.01 5.86 7 1 1
8 2 1987 16.1 18.6 0 2 2 0 1 19.3 0 0 1.01 6.39 7 1 1
9 20 1980 25.6 10.2 0 1 1 0 1 17.0 0 0 1.08 9.01 7 NA NA
10 20 1981 25.6 10.7 0 1 1 0 1 17.0 0 0 1.08 5.77 7 1 1
# ... with 1,126 more rows
如您所见,R 将变量 year
识别为整数。最初,列值是数字,但我将它们转换为整数。但是,当我运行以下代码(使用panelAR包)时,我运行陷入困境:
panelAR(vanhdemo ~ pcgnp + left + lpop + iwar + milctr2 + britinfl, data = dat,
panelVar = "ccode", timeVar = "year", autoCorr = "psar1", panelCorrMethod = "pcse",
rho.na.rm = TRUE, panel.weight = "t-1", bound.rho = TRUE)
我收到此错误消息:
Error: The time variable must be defined as an integer.
我不明白我在这里做错了什么。如果我重新创建数据集的一部分(如下所示),模型 运行 没问题。那么问题是否根源于数据集(最初是一个 .dta 文件)?如果有人有兴趣看的话我绝对可以上传
这是相同数据的一个小例子:
ccode <- c(rep(2,8), rep(20, 2))
year <- c(1980:1987, 1980, 1981)
vanhdemo <- c(rep(18.7, 4), rep(16.1, 4), rep(25.6, 2))
pcgnp <- c(11.3, 12.3 , 13.2, 14.2, 15.5, 16.5, 17.5, 18.6, 10.2, 10.7)
dat <- data.frame(ccode, year, vanhdemo, pcgnp)
@xilliam 在评论中回答。解决方案是将 table 从 tibble 转换为数据框。
错误与 data.frames
和 tibbles
的不同行为有关。 Tibbles 是 special kind of data.frame 'prevent dimension dropping'。如果您尝试使用单个列名对 tibble 进行子集化,
你会得到一个 single-column tibble。然而,根据您如何对 data.frame 进行子集化,您可能会得到一个向量或 data.frame。您看到的错误是由这种区别引起的。在内部 panelAR()
对时间变量的数据 object 进行子集化:
time.vec <- data[, timeVar]
因此,如果 'data' 是小标题,则 'time.vec' 将是 single-column 小标题,而
如果 'data' 是一个 data.frame,'time.vec' 将是一个向量。 panelAR()
然后
检查 'time.vec' 是否为整数向量,并在数据 object 为 tibble 的情况下抛出错误。
您可以在示例数据中看到此行为,如下所示:
# make a tibble
dat_tib <- tibble::as_tibble(dat)
# returns a vector
dat[, "year"]
# returns a data.frame
dat["year"]
# returns a tibble
dat_tib[, "year"]
# returns a tibble
dat_tib["year"]