计算一个样本中某个比例的置信区间

Calculating Confidence Interval for a Proportion in One Sample

当样本量很小甚至样本量为 1 时,计算比例的置信区间 (CI) 的更好方法是什么?

我目前正在计算 CI 一个样本中的比例 w/:

不过我的样本量很小,有时甚至是1。我也试过 一个小群体的比例 p 的近似 (1−α)100% 置信区间使用:

具体来说,我正在尝试实现这两个公式来计算 CI 的比例。如下图所示,在 2018 年第一季度,蓝色组周围没有 CI,因为在 2018 年第一季度有十分之一的人选择了该项目。如果使用有限种群校正 (FPC),如果 N 为 1,它不会校正 CI。 所以,我的问题是,解决这个 100% 比例的小样本问题的最佳统计方法是什么。

试试看 statsmodels.stats.proportion.proportion_confint

http://www.statsmodels.org/devel/generated/statsmodels.stats.proportion.proportion_confint.html

根据他们的文档,您可以这样使用它:

ci_low, ci_upp = proportion_confint(count, nobs, alpha=0.05, method='normal')

其中参数为:

  • count (int or array_array_like) – 成功次数,可以是pandas Series或DataFrame
  • nobs (int) – 试验总数
  • alpha (float in (0, 1)) – 显着性水平,默认0.05
  • method(['normal'] 中的字符串)- 用于置信区间的方法,当前可用的方法:

    • 正态:渐近正态近似
    • agresti_coull:Agresti-Coull 区间
    • beta:基于 Beta 分布的 Clopper-Pearson 区间
    • 威尔逊:威尔逊得分区间
    • 杰弗里斯:杰弗里斯贝叶斯区间
    • binom_test :实验性的,binom_test
    • 的反转