scipy.stats:高斯核密度估计器中的带宽因子
scipy.stats : bandwidth factor in gaussian kernel density estimator
我生成了二维高斯分布(不相关数据)
dist2=np.array([np.random.normal(loc=10,scale=3, size=50000),np.random.normal(loc=5,scale=2, size=50000)])
我计算了协方差矩阵除以带宽因子,因为协方差属性是数据集的协方差矩阵,按计算带宽缩放(kde.factor)(https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.gaussian_kde.html)
from scipy.stats import kde
# Use a kernel density estimator to produce local-counts in this space, and grid them to plot.
k = kde.gaussian_kde(dist2)
k.covariance/k.factor
对角线元素不是预期的 sigma 的平方。
我想我对这个带宽因素有些不了解。
如有任何解释,我们将不胜感激。感谢您的帮助。
在 scipy.stats.kde.gaussian_kde
中实现了协方差因子,因此 k.covariance / k.factor**2
是 ~ 到 np.cov(dist2)
。
详情请看这里Getting bandwidth used by SciPy's gaussian_kde function
我生成了二维高斯分布(不相关数据)
dist2=np.array([np.random.normal(loc=10,scale=3, size=50000),np.random.normal(loc=5,scale=2, size=50000)])
我计算了协方差矩阵除以带宽因子,因为协方差属性是数据集的协方差矩阵,按计算带宽缩放(kde.factor)(https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.gaussian_kde.html)
from scipy.stats import kde
# Use a kernel density estimator to produce local-counts in this space, and grid them to plot.
k = kde.gaussian_kde(dist2)
k.covariance/k.factor
对角线元素不是预期的 sigma 的平方。
我想我对这个带宽因素有些不了解。
如有任何解释,我们将不胜感激。感谢您的帮助。
在 scipy.stats.kde.gaussian_kde
中实现了协方差因子,因此 k.covariance / k.factor**2
是 ~ 到 np.cov(dist2)
。
详情请看这里Getting bandwidth used by SciPy's gaussian_kde function