pandas.value_counts() 的 Beta 分布
Beta distribution for pandas.value_counts()
我有一个包含 'delta' column/attribute 的 CSV 文件,其中包含两个日期时间列之间的小时差。我正在使用 Python3。当我在删除小值后对其应用 'value_count()' 时,我得到以下信息:
delta_filtered['difference'].value_counts()
0 44895
1 8605
2 4624
3 2759
4 1829
5 1449
6 1015
Name: difference, dtype: int64
在图片中,x 轴包含小时数,y 轴是计数。从它的外观来看,可视化表明它是一个 beta 分布。我现在有兴趣使用来自 scipy.
的 beta 分布为其计算 pdf 和 cdf
如何计算 scipy.stats.beta() 函数所需的此分布的 'a' 和 'b' 参数?
谢谢
一般情况下,您可以按如下方式计算参数:
from scipy.stats import beta
a, b, loc, scale = beta.fit(x)
请参阅文档 here。
但是,beta 分布仅定义在 0
和 1
之间。
我有一个包含 'delta' column/attribute 的 CSV 文件,其中包含两个日期时间列之间的小时差。我正在使用 Python3。当我在删除小值后对其应用 'value_count()' 时,我得到以下信息:
delta_filtered['difference'].value_counts()
0 44895
1 8605
2 4624
3 2759
4 1829
5 1449
6 1015
Name: difference, dtype: int64
在图片中,x 轴包含小时数,y 轴是计数。从它的外观来看,可视化表明它是一个 beta 分布。我现在有兴趣使用来自 scipy.
的 beta 分布为其计算 pdf 和 cdf如何计算 scipy.stats.beta() 函数所需的此分布的 'a' 和 'b' 参数?
谢谢
一般情况下,您可以按如下方式计算参数:
from scipy.stats import beta
a, b, loc, scale = beta.fit(x)
请参阅文档 here。
但是,beta 分布仅定义在 0
和 1
之间。