解释 pdf 的 y 值
Interpreting the y values of a pdf
为了理解正态分布图的 y 值,我使用了以下代码:
%reset -f
import numpy as np
from scipy.stats import norm
import matplotlib.pyplot as plt
data = [10,10,20,40,50,60,70,80,90,100]
# Fit a normal distribution to the data:
mu, std = norm.fit(data)
# Plot the histogram.
plt.hist(data, bins=10, density=True, alpha=0.6, color='g')
# Plot the PDF.
xmin, xmax = plt.xlim()
x = np.linspace(xmin, xmax, 100)
p = norm.pdf(x, mu, std)
plt.plot(x, p, 'k', linewidth=2)
title = "Fit results: mu = %.2f, std = %.2f" % (mu, std)
plt.title(title)
plt.show()
生成此图:
数据为一组人的年龄:[10,10,20,40,50,60,70,80,90,100]
如何解释生成的 pdf 图的 y 值?例如,应该如何解释 play 大约等于 0.027 的柱?
我读过各种帖子,例如:
https://stats.stackexchange.com/questions/332984/interpreting-a-pdf-plot
但找不到详细解释绘图 y 轴值的信息。
0.027
年龄在 0 到大约 20 岁之间的概率是?
x_0和x_1两个年龄段pdf曲线下的面积代表一个点采样的概率P(x_0 <= X <= x_1)来自 X 属于区间 [x_0、x_1],其中 X 是适合数据集的(正常)随机变量。
对于直方图,每个条形代表一个区间,条形的高度等于属于该区间的样本数,标准化后直方图的区间总面积等于1。类似地pdf 曲线,bin 的面积给出了随机样本属于由 bin 定义的区间的概率估计。
如果正态分布确实是对随机变量建模的一个不错的选择,那么人们会期望直方图和拟合的 pdf 在您向数据集添加点时越来越接近(对于精心选择的箱数).
为了理解正态分布图的 y 值,我使用了以下代码:
%reset -f
import numpy as np
from scipy.stats import norm
import matplotlib.pyplot as plt
data = [10,10,20,40,50,60,70,80,90,100]
# Fit a normal distribution to the data:
mu, std = norm.fit(data)
# Plot the histogram.
plt.hist(data, bins=10, density=True, alpha=0.6, color='g')
# Plot the PDF.
xmin, xmax = plt.xlim()
x = np.linspace(xmin, xmax, 100)
p = norm.pdf(x, mu, std)
plt.plot(x, p, 'k', linewidth=2)
title = "Fit results: mu = %.2f, std = %.2f" % (mu, std)
plt.title(title)
plt.show()
生成此图:
数据为一组人的年龄:[10,10,20,40,50,60,70,80,90,100]
如何解释生成的 pdf 图的 y 值?例如,应该如何解释 play 大约等于 0.027 的柱?
我读过各种帖子,例如:
https://stats.stackexchange.com/questions/332984/interpreting-a-pdf-plot
但找不到详细解释绘图 y 轴值的信息。
0.027
年龄在 0 到大约 20 岁之间的概率是?
x_0和x_1两个年龄段pdf曲线下的面积代表一个点采样的概率P(x_0 <= X <= x_1)来自 X 属于区间 [x_0、x_1],其中 X 是适合数据集的(正常)随机变量。
对于直方图,每个条形代表一个区间,条形的高度等于属于该区间的样本数,标准化后直方图的区间总面积等于1。类似地pdf 曲线,bin 的面积给出了随机样本属于由 bin 定义的区间的概率估计。
如果正态分布确实是对随机变量建模的一个不错的选择,那么人们会期望直方图和拟合的 pdf 在您向数据集添加点时越来越接近(对于精心选择的箱数).