pglm 不使用本地环境中的任何变量

pglm doesn't use any variables from local environment

我正在编写一些可重用(希望如此)的 R 代码,其中一部分是 pglm 辅助函数:

pglm_helper <- function(family, fmla, fixed_effect, tbl) {
  pglm::pglm(
    fmla,
    family=family,
    data=tbl,
    effect="individual",
    model="within",
    index=fixed_effect
  )
}

然而,它试图传入“fixed_effect”作为索引,而不是该符号代表的字符串。如果我传入正确的字符串或使用 fixed_effect <<- fixed_effect 创建一个全局变量,这将起作用。

pglm_helper <- function(family, fmla, fixed_effect, tbl) {
  pglm::pglm(
    fmla,
    family=family,
    data=tbl,
    effect="individual",
    model="within",
    index="pair_id"
  )
}

但是,一旦我让索引开始工作,它就会抱怨 tbl 是一个函数,family 也是。其实连运行这个:


model_3_4_pois <- function(my_tbl) {
  pglm::pglm(
    cites ~
      as.factor(year)
      + as.factor(age)
      + is_brc_window
      + is_brc_post_deposit,
    family="poisson",
    data=my_tbl,
    effect="individual",
    model="within",
    index="article_id"
  )
}

找不到my_tbl

貌似这个函数完全忽略了本地环境;有没有办法让这个函数评估本地环境?

使用调试器有助于了解错误原因。
pglm() 调用一个内部函数 starting.values() 调用 :

eval(startcl, parent.frame())

其中 startcl 是原始表达式:

pglm::pglm(
    cites ~
      as.factor(year)
      + as.factor(age)
      + is_brc_window
      + is_brc_post_deposit,
    family="poisson",
    data=my_tbl,
    effect="individual",
    model="within",
    index="article_id"
  )

如果 my_tbl 不在全局环境中(不是这种情况,因为您创建了一个函数),eval 函数在 parent.frame() 中找不到它,即在 pglm 环境中,因此出现错误。

你对 <<- 所做的是正确的:你将数据强制到全局环境,这允许 eval 工作。

作为解决方法,您可以在 pglm environment 中写入必要的变量,然后再在辅助函数中调用它:

pglm_helper <- function(family, fmla, fixed_effect, tbl) {

# Modify pglm environment 
environment(pglm) <- list2env(list(tbl=tbl,fixed_effect=fixed_effect,family=family,fmla=fmla), parent = environment(pglm))

pglm::pglm(
    fmla,
    family=family,
    data=tbl,
    effect="individual",
    model="within",
    index="pair_id"
  )
}

由于您没有提供数据,我用 pglm Parking 数据进行了测试:

library(pglm)
data('Fairness', package = 'pglm')
Parking <- subset(Fairness, good == 'parking')

pglm_helper <- function(my_tbl,fixed_effect) {
  environment(pglm) <- list2env(list(my_tbl=my_tbl,fixed_effect=fixed_effect), parent = environment(pglm))
  pglm(as.numeric(answer) ~ education + rule,
       data=my_tbl,
       family = ordinal('probit'), R = 5, print.level = 3,
       method = 'bfgs', index = fixed_effect, model = "random")
}

pglm_helper(Parking,"id")
#> Initial function value: -2736.51 
#> Initial gradient value:
#>      (Intercept)      educationno        ruleadmin      rulelottery 
#>      -11.4914740       -2.8847481      -16.3558672      -10.1084711 
#>    ruleaddsupply      rulequeuing        rulemoral rulecompensation 
#>        0.1128396        4.3919960       14.9698844       10.8792330 
#>             mu_1             mu_2            sigma 
#>       23.2267330       49.7890848      -97.9365186 
#> initial  value 2736.509920 
#> iter   2 value 2722.178812
#> iter   3 value 2721.077354
#> iter   4 value 2720.804310
#> iter   5 value 2720.398072
#> iter   6 value 2720.232869
#> iter   7 value 2719.917545
#> iter   8 value 2719.854690
#> iter   9 value 2719.622599
#> iter  10 value 2718.012705
#> iter  11 value 2717.614770
#> iter  12 value 2717.603369
#> iter  13 value 2717.154671
#> iter  14 value 2716.906182
#> iter  15 value 2716.688790
#> iter  16 value 2716.688702
#> final  value 2716.688698 
#> converged
#> Maximum Likelihood estimation
#> BFGS maximization, 68 iterations
#> Return code 0: successful convergence 
#> Log-Likelihood: -2716.689 (11 free parameter(s))
#> Estimate(s): -0.2670471 -0.2835027 -0.0670941 0.2372356 1.225338 1.850054 2.837842 2.628994 1.016765 2.517224 0.5495621