python 中的 KDE 具有不同的 mu、sigma / 将函数映射到数组

Question

我有一个二维值数组，我想对其执行高斯 KDE，但有一个问题：假定这些点具有不同的方差。为此，我有第二个二维数组（具有相同的形状），它是用于每个点的高斯方差。在简单的例子中，

import numpy as np
data = np.array([[0.4,0.2],[0.1,0.5]])
sigma = np.array([[0.05,0.1],[0.02,0.3]])

会有四个高斯分布，第一个以 x=0.4 为中心，σ=0.05。 注：实际数据远大于2x2

我正在寻找以下两件事之一：

一个高斯 KDE 求解器，允许每个点改变带宽

或

一种将每个高斯的结果映射到 3 维数组的方法，每个高斯在一系列点上进行评估（例如，沿 np.linspace(0,1,101) 评估每个中心/σ 对).在这种情况下，我可以例如通过取出 outarray[:,:,51].

Answer 1

我发现处理此问题的最佳方法是通过 sigma 数组和数据数组的数组乘法。然后，我为要解决 KDE 问题的每个值堆叠数组。

import numpy as np

def solve_gaussian(val,data_array,sigma_array):
    return (1. / sigma_array) * np.exp(- (val - data_array) * (val - data_array) / (2 * sigma_array * sigma_array))

def solve_kde(xlist,data_array,sigma_array):
    kde_array = np.array([])
    for xx in xlist:
        single_kde = solve_gaussian(xx,data_array,sigma_array)
        if np.ndim(kde_array) == 3:
            kde_array = np.concatenate((kde_array,single_kde[np.newaxis,:,:]),axis=0)
        else:
            kde_array = np.dstack(single_kde)
    return kde_array

xlist = np.linspace(0,1,101) #Adjust as needed
kde_array = solve_kde(xlist,data_array,sigma_array)
kde_vector = np.sum(np.sum(kde_array,axis=2),axis=1)
mode_guess = xlist[np.argmax(kde_vector)]

请注意，任何试图使用此代码的人：高斯值沿轴 0，而不是原始问题中指定的轴 2。

python 中的 KDE 具有不同的 mu、sigma / 将函数映射到数组

KDE in python with different mu, sigma / mapping a function to an array

python

arrays

kernel-density