pandas.value_counts() 的 Beta 分布

Beta distribution for pandas.value_counts()

我有一个包含 'delta' column/attribute 的 CSV 文件,其中包含两个日期时间列之间的小时差。我正在使用 Python3。当我在删除小值后对其应用 'value_count()' 时,我得到以下信息:

delta_filtered['difference'].value_counts()
0    44895
1     8605
2     4624
3     2759
4     1829
5     1449
6     1015
Name: difference, dtype: int64

在图片中,x 轴包含小时数,y 轴是计数。从它的外观来看,可视化表明它是一个 beta 分布。我现在有兴趣使用来自 scipy.

的 beta 分布为其计算 pdf 和 cdf

如何计算 scipy.stats.beta() 函数所需的此分布的 'a' 和 'b' 参数?

谢谢

一般情况下,您可以按如下方式计算参数:

from scipy.stats import beta
a, b, loc, scale = beta.fit(x)

请参阅文档 here

但是,beta 分布仅定义在 01 之间。