如何在 x 轴上使用对数刻度将 pdf 叠加到 seaborn histplot

How to overlay pdf to seaborn histplot with log scale on x axis

之后,我正在尝试使用从 scipy.stats 获得的 pdf 绘制一个 seaborn histplot。问题是绘制的 pdf 灾难性地超出了比例(下面的示例):

from scipy import stats
import matplotlib.pyplot as plt
import seaborn as sns

params = (20, -1500, 8000)
sample = stats.invgauss.rvs(size=1000, *params)
fig, ax = plt.subplots()
sns.histplot(sample, log_scale=True, kde=False, stat='density')
x0, x1 = ax.get_xlim()
x_pdf = np.exp(np.linspace(np.log(x0),np.log(x1),500))
fitted_params = stats.invgauss.fit(sample)
y_pdf = stats.invgauss.pdf(x_pdf, *fitted_params)
y_cdf = stats.invgauss.cdf(x_pdf, *fitted_params)
ax.plot(x_pdf, y_pdf, 'r', lw=2)
plt.savefig('Pdf_check.png')

另一方面,cdf 打印效果很好,与我的预期一致:

# same as above
ax.plot(x_pdf, y_cdf, 'r', lw=2)
plt.savefig('Cdf_check.png')

我找到了解决办法。抱歉 self-answering,但我认为将其写在这里以备将来使用。

使用 log_scale=Truestat='density',seaborn 使用对数 bin 并重新调整 bin 高度,使积分为 1。因此需要使用函数 pdf 代替 [=14] =] 这样重新缩放的 bins 上的积分与 pdf 相同。这给出 g(x) = f(x) * x * log(10) 并且确实有效:

params = (20, -1500, 8000)
sample = stats.invgauss.rvs(size=1000, *params)
fig, ax = plt.subplots()
sns.histplot(sample, log_scale=True, kde=False, stat='density')
x0, x1 = ax.get_xlim()
x_pdf = np.exp(np.linspace(np.log(x0),np.log(x1),500))
fitted_params = stats.invgauss.fit(sample)
y_pdf = stats.invgauss.pdf(x_pdf, *fitted_params)
y_cdf = stats.invgauss.cdf(x_pdf, *fitted_params)
# rescaled pdf:
y_pdf_rescaled = y_pdf * x_pdf * np.log(10)
ax.plot(x_pdf, y_pdf_rescaled, 'r', lw=2)
plt.savefig('{}/Pdf_check.png'.format(out_dir))