为什么要除以计数以获得概率密度函数

why to divide by counts for getting probability density function

count, bin_edges = np.histogram(iris_setosa['petal_length'], bins=10, 
                             density = True)

我找到了这个获取概率密度函数的代码。当我设置密度 =True 时,计数必须是标准化形式,即介于 0 到 1 之间。但我得到输出: 计数:(数组([0.22222222, 0.22222222, 0.44444444, 1.55555556, 2.88888889 2.88888889, 1.55555556, 0.88888889, 0.0, 0.44444444])

然后计算pdf,我找到了下面的代码

pdf=count/sum(count)

为什么我们要除以计数

根据定义,密度需要某种归一化。我们通常需要某些东西的密度来了解整个系统的一小部分是如何工作的。就像物理对象的密度一样,我们需要将质量除以整个体积,从而得到单位体积的 'uniformed' 质量。 类似地,如果我们将个体概率除以所有概率之和,我们将得到 'density' 将较小系统连接到整个系统的概率。