从 R 中的 gam.check 中提取 p 值

Extract p-value from gam.check in R

当我 运行 gam.check(my_spline_gam) 时,我得到以下输出。

Method: GCV   Optimizer: magic
Smoothing parameter selection converged after 9 iterations.
The RMS GCV score gradiant at convergence was 4.785628e-06 .
The Hessian was positive definite.
The estimated model rank was 25 (maximum possible: 25)
Model rank =  25 / 25 

Basis dimension (k) checking results. Low p-value (k-index<1) may
indicate that k is too low, especially if edf is close to k'.

         k'    edf k-index p-value
s(x) 24.000 22.098   0.849    0.06

我的问题是我是否可以将这个 p 值单独提取到 table。

看起来您无法以正常方式将结果存储在对象中。您可以使用 capture.output 将控制台输出存储在对象中,然后使用 str_split 获取正确的值。因此,对于帮助文件中的示例,这将是:

library(mgcv)
set.seed(0)
dat <- gamSim(1,n=200)
b <- gam(y~s(x0)+s(x1)+s(x2)+s(x3),data=dat)
r <- capture.output(gam.check(b))
p <- strsplit(r[12], " ")[[1]][11]

但是因为 p 值只是一个字符串,所以您无法通过这种方式获得准确的 p 值。

编辑:user20650 的答案将为您提供正确的输出:

r <- k.check(b)
r[,'p-value']

使用 capture.output 加上一点字符串操作 -

gam_obj <- capture.output(gam.check(b,pch=19,cex=.3))
gam_tbl <- gam_obj[12:length(gam_obj)]
str_spl = function(x){
  p_value <- strsplit(x, " ")[[1]]
  output_p <- as.numeric(p_value[length(p_value)])
}
p_values <- data.frame(sapply(gam_tbl, str_spl))

输出