使用 R Bootstrap 获取回归系数名称
Get Regression Coefficient Names with R Bootstrap
我正在使用 R 中的 boot
包来计算 bootstrapped SE 和置信区间。我试图找到一种优雅而有效的方法来获取我的参数名称及其估计值的 bootstrap 分布。例如,考虑给出的简单示例 here:
# Bootstrap 95% CI for regression coefficients
library(boot)
# function to obtain regression weights
bs = function(data, indices, formula) {
d = data[indices,] # allows boot to select sample
fit = lm(formula, data=d)
return(coef(fit))
}
# bootstrapping with 1000 replications
results = boot(
data=mtcars,
statistic=bs,
R=1000,
formula=mpg~wt+disp)
这工作正常,除了结果只是显示为数字索引:
# view results
results
Bootstrap Statistics :
original bias std. error
t1* 34.96055404 0.1559289371 2.487617954
t2* -3.35082533 -0.0948558121 1.152123237
t3* -0.01772474 0.0002927116 0.008353625
特别是当涉及到各种因子变量的长而复杂的回归公式时,可能需要做一些工作才能准确跟踪哪些指数与哪些系数估计值相符。
我当然可以在 bootstrap 函数之外再次重新拟合我的模型,并使用 names(coef(fit))
或其他东西提取名称,或者可能使用其他东西,例如调用 model.matrix()
。这些看起来很麻烦,无论是在额外编码方面还是在额外 CPU 和 ram 资源方面。
在这种情况下,我怎样才能更轻松地获得一个漂亮的系数名称向量来配对系数标准误差向量?
更新
基于 lmo 的出色回答,这是我获得基本回归的基本代码 table:
Names = names(results$t0)
SEs = sapply(data.frame(results$t), sd)
Coefs = as.numeric(results$t0)
zVals = Coefs / SEs
Pvals = 2*pnorm(-abs(zVals))
Formatted_Results = cbind(Names, Coefs, SEs, zVals, Pvals)
在原始数据上调用 "boot strapped" 函数(此处 lm
)的估计值存储在名为 "t0" 的列表元素中。
results$t0
(Intercept) wt disp
34.96055404 -3.35082533 -0.01772474
此对象保留原始函数调用的估计名称,然后您可以使用 names
.
访问这些名称
names(results$t0)
[1] "(Intercept)" "wt" "disp"
我正在使用 R 中的 boot
包来计算 bootstrapped SE 和置信区间。我试图找到一种优雅而有效的方法来获取我的参数名称及其估计值的 bootstrap 分布。例如,考虑给出的简单示例 here:
# Bootstrap 95% CI for regression coefficients
library(boot)
# function to obtain regression weights
bs = function(data, indices, formula) {
d = data[indices,] # allows boot to select sample
fit = lm(formula, data=d)
return(coef(fit))
}
# bootstrapping with 1000 replications
results = boot(
data=mtcars,
statistic=bs,
R=1000,
formula=mpg~wt+disp)
这工作正常,除了结果只是显示为数字索引:
# view results
results
Bootstrap Statistics :
original bias std. error
t1* 34.96055404 0.1559289371 2.487617954
t2* -3.35082533 -0.0948558121 1.152123237
t3* -0.01772474 0.0002927116 0.008353625
特别是当涉及到各种因子变量的长而复杂的回归公式时,可能需要做一些工作才能准确跟踪哪些指数与哪些系数估计值相符。
我当然可以在 bootstrap 函数之外再次重新拟合我的模型,并使用 names(coef(fit))
或其他东西提取名称,或者可能使用其他东西,例如调用 model.matrix()
。这些看起来很麻烦,无论是在额外编码方面还是在额外 CPU 和 ram 资源方面。
在这种情况下,我怎样才能更轻松地获得一个漂亮的系数名称向量来配对系数标准误差向量?
更新
基于 lmo 的出色回答,这是我获得基本回归的基本代码 table:
Names = names(results$t0)
SEs = sapply(data.frame(results$t), sd)
Coefs = as.numeric(results$t0)
zVals = Coefs / SEs
Pvals = 2*pnorm(-abs(zVals))
Formatted_Results = cbind(Names, Coefs, SEs, zVals, Pvals)
在原始数据上调用 "boot strapped" 函数(此处 lm
)的估计值存储在名为 "t0" 的列表元素中。
results$t0
(Intercept) wt disp
34.96055404 -3.35082533 -0.01772474
此对象保留原始函数调用的估计名称,然后您可以使用 names
.
names(results$t0)
[1] "(Intercept)" "wt" "disp"