pandas.value_counts() 的 Beta 分布

Question

我有一个包含 'delta' column/attribute 的 CSV 文件，其中包含两个日期时间列之间的小时差。我正在使用 Python3。当我在删除小值后对其应用 'value_count()' 时，我得到以下信息：

delta_filtered['difference'].value_counts()
0    44895
1     8605
2     4624
3     2759
4     1829
5     1449
6     1015
Name: difference, dtype: int64

在图片中，x 轴包含小时数，y 轴是计数。从它的外观来看，可视化表明它是一个 beta 分布。我现在有兴趣使用来自 scipy.

的 beta 分布为其计算 pdf 和 cdf

如何计算 scipy.stats.beta() 函数所需的此分布的 'a' 和 'b' 参数？

谢谢

Answer 1

一般情况下，您可以按如下方式计算参数：

from scipy.stats import beta
a, b, loc, scale = beta.fit(x)

请参阅文档 here。

但是，beta 分布仅定义在 0 和 1 之间。

pandas.value_counts() 的 Beta 分布

Beta distribution for pandas.value_counts()

python

distribution

pandas