如何通过fitdistrplus包select分布参数?
How to select the distribution parameter through fitdistrplus package?
library(fitdistrplus)
data(groundbeef)
serving <- groundbeef$serving
fitg <- fitdist(serving, "gamma")
res<-bootdist(fitg)#further accuracy estimate
#which parameter should be selected?
> summary(res)
Parametric bootstrap medians and 95% percentile CI
Median 2.5% 97.5%
shape 4.04523398 3.41773958 4.80480936
rate 0.05495878 0.04632007 0.06587446
> res$fitpart$estimate
shape rate
4.00825257 0.05441911
bootdist()
总是用于在 fitdis()
之后获得更准确的参数。
如上例,summary(res)
提供了几个参数,res$fitpart$estimate
提供了一个参数,应该选择哪个?
来自help(bootdist)
:
Uses parametric or nonparametric bootstrap resampling in order to simulate uncertainty in the parameters of the distribution fitted to non-censored data.
因此,bootdist
的目的不是确定参数,而是估计参数拟合的不确定性。
因此,一般来说,您应该使用:
fitg$estimate
shape rate
4.00825257 0.05441911
当您执行 bootstrap 时,您通过替换对数据进行采样,并重新估计参数。在这种情况下,您将分布拟合到从原始数据集中采样的数据集中。
通过这 N 个估计值,您可以得到中位数和置信区间。
如果您想要最适合您数据的参数,您需要从 fitdist(serving, "gamma")
中获取
library(fitdistrplus)
data(groundbeef)
serving <- groundbeef$serving
fitg <- fitdist(serving, "gamma")
res<-bootdist(fitg)#further accuracy estimate
#which parameter should be selected?
> summary(res)
Parametric bootstrap medians and 95% percentile CI
Median 2.5% 97.5%
shape 4.04523398 3.41773958 4.80480936
rate 0.05495878 0.04632007 0.06587446
> res$fitpart$estimate
shape rate
4.00825257 0.05441911
bootdist()
总是用于在 fitdis()
之后获得更准确的参数。
如上例,summary(res)
提供了几个参数,res$fitpart$estimate
提供了一个参数,应该选择哪个?
来自help(bootdist)
:
Uses parametric or nonparametric bootstrap resampling in order to simulate uncertainty in the parameters of the distribution fitted to non-censored data.
因此,bootdist
的目的不是确定参数,而是估计参数拟合的不确定性。
因此,一般来说,您应该使用:
fitg$estimate
shape rate
4.00825257 0.05441911
当您执行 bootstrap 时,您通过替换对数据进行采样,并重新估计参数。在这种情况下,您将分布拟合到从原始数据集中采样的数据集中。
通过这 N 个估计值,您可以得到中位数和置信区间。
如果您想要最适合您数据的参数,您需要从 fitdist(serving, "gamma")