python 中的 KDE 具有不同的 mu、sigma / 将函数映射到数组

KDE in python with different mu, sigma / mapping a function to an array

我有一个二维值数组,我想对其执行高斯 KDE,但有一个问题:假定这些点具有不同的方差。为此,我有第二个二维数组(具有相同的形状),它是用于每个点的高斯方差。在简单的例子中,

import numpy as np
data = np.array([[0.4,0.2],[0.1,0.5]])
sigma = np.array([[0.05,0.1],[0.02,0.3]])

会有四个高斯分布,第一个以 x=0.4 为中心,σ=0.05。 注:实际数据远大于2x2

我正在寻找以下两件事之一:

  1. 一个高斯 KDE 求解器,允许每个点改变带宽

  1. 一种将每个高斯的结果映射到 3 维数组的方法,每个高斯在一系列点上进行评估(例如,沿 np.linspace(0,1,101) 评估每个中心/σ 对).在这种情况下,我可以例如通过取出 outarray[:,:,51].
  2. 使 KDE 值在 x=0.5

我发现处理此问题的最佳方法是通过 sigma 数组和数据数组的数组乘法。然后,我为要解决 KDE 问题的每个值堆叠数组。

import numpy as np

def solve_gaussian(val,data_array,sigma_array):
    return (1. / sigma_array) * np.exp(- (val - data_array) * (val - data_array) / (2 * sigma_array * sigma_array))

def solve_kde(xlist,data_array,sigma_array):
    kde_array = np.array([])
    for xx in xlist:
        single_kde = solve_gaussian(xx,data_array,sigma_array)
        if np.ndim(kde_array) == 3:
            kde_array = np.concatenate((kde_array,single_kde[np.newaxis,:,:]),axis=0)
        else:
            kde_array = np.dstack(single_kde)
    return kde_array

xlist = np.linspace(0,1,101) #Adjust as needed
kde_array = solve_kde(xlist,data_array,sigma_array)
kde_vector = np.sum(np.sum(kde_array,axis=2),axis=1)
mode_guess = xlist[np.argmax(kde_vector)]

请注意,任何试图使用此代码的人:高斯值沿轴 0,而不是原始问题中指定的轴 2。