如何计算抛硬币的p值?

How to calculate p-value for coin toss?

我正在尝试计算以下抛硬币示例的 p 值:

n = 5
h = 4  # out of 5 toss 4 are head

# calculate pvalue using equal or more extreme cases
pval = P(4H1T) + P(4T1H) + P(5H) + P(5T)
     = 5/32    + 5/32    + 1/32  + 1/32
     = 12/32
     = 0.375

但是当我尝试标准方法时:

from scipy import stats

phat = h / n
p0 = 0.5  # for unbiased coin
q0 = 1 - p0
z = (phat - p0) / sqrt(p0q0/n)      

pval = 1 - stats.norm.cdf(z)

我得到了:

0.08985624743949994.

问题 1

如何使用 python scipy 统计数据(答案 = 0.375)获得相似的结果?

参考资料

在这个 statquest 视频中,作者解释了如何使用相等或更多的极值获得 pvalue,我们得到 0.375

但是在这里,

使用给定的公式我们得到另一个答案。

问题 2

哪种方法比较好,我们可以比较 pvalue 和 alpha?

z 值是正态分布的标准化值,不是概率。此外,连续分布中精确值的概率有点棘手。这种情况听起来最适合二项分布。

from scipy.stats import binom
binom.pmf(4,5,0.5)

输出:

0.15625

这是一个二项分布情况。按照scipy.stats.binom_test中的官方示例:

import numpy as np
from scipy import stats

alpha = 0.05
pval = stats.binom_test(4, n=5, p=0.5, alternative='two-sided')

print('pvalue = ', pval)
if pval< alpha:
    print("We Reject the Null Hypothesis.")
else:
    print("We Accept the Null Hypothesis.")

输出

pvalue =  0.375
We Accept the Null Hypothesis.