Gamma 相当于标准偏差

Gamma equivalent to standard deviations

我使用 libary(fitdistrplus) 对我的数据进行伽马分布拟合。我需要确定一种方法来定义可以 "reasonably" 预期的 x 值范围,类似于使用正态分布的标准偏差。

例如,与平均值相差两个标准差内的 x 值可以被认为是正态分布预期值的合理范围。关于如何根据伽马分布的形状和速率参数定义类似范围的预期值有什么建议吗?

...也许是识别 x 的两个值,这两个值之间包含 95% 的数据?

gamma 的平均期望值为:

E[X] = k * theta  

方差为 Var[X] = k * theta^2,其中 k 是形状,theta 是比例。

但通常我会使用 95% 的分位数来表示数据分布。

假设我们有一个随机变量,它服从形状 alpha=2 和速率 beta=3 的伽马分布。 We would expect 该分布的均值为 2/3,标准差为 sqrt(2)/3,我们确实在模拟数据中看到了这一点:

mean(rgamma(100000, 2, 3))
# [1] 0.6667945
sd(rgamma(100000, 2, 3))
# [1] 0.4710581
sqrt(2) / 3
# [1] 0.4714045

将置信度范围定义为 [mean - gamma*sd, mean + gamma*sd] 会很奇怪。要了解原因,请考虑我们是否在上面的示例中选择了 gamma=2。这将产生置信区间 [-0.276, 1.609],但伽玛分布甚至不能取负值,并且 4.7% 的数据落在 1.609 以上。这至少不是一个平衡的置信区间。

更自然的选择可能是将分布的 0.025 和 0.975 个百分位数作为置信范围。我们预计 2.5% 的数据将低于该范围,2.5% 的数据将高于该范围。我们可以使用 qgamma 来确定我们的示例参数的置信范围为 [0.081, 1.857].

qgamma(c(0.025, 0.975), 2, 3)
# [1] 0.08073643 1.85721446