高斯过程回归的内核参数：如何在 Scikit-learn 中获取它们？

Question

我使用 Scikit-learn 的平方指数内核或 RBF in my regression operation using GaussianProcessRegressor。此外，我使用内部可用的优化器'fmin_l_bfgs_b'（L-BFGS-B算法）来优化内核参数。在我的例子中，内核参数是长度尺度和信号方差。关于log_marginal_likelihood的文档如下：

我按照此文档打印了 GPML kernel 和 log_marginal_likelihood。以下是代码片段：

print("GPML kernel: %s" % gp.kernel_)
print("Log-marginal-likelihood:",
       gp.log_marginal_likelihood(gp.kernel_.theta, eval_gradient = True))

在控制台打印以下值：

    GPML kernel: 31.6**2 * RBF(length_scale=1.94)
Log-marginal-likelihood: (-115.33295413296841, array([ 1.01038168e+02, -2.16465175e-07]))

在这里，我无法计算出打印在对数边际似然上的值。数组中的值是什么？

我关于回归的代码片段如下：

x_train = np.array([[0,0],[2,2],[3,3]])
y_train = np.array([200,321,417])
xvalues = np.array([0,1,2,3])
yvalues = np.array([0,1,2,3])
a,b = np.meshgrid(xvalues,yvalues)
positions = np.vstack([a.ravel(), b.ravel()])
x_test = (np.array(positions)).T
kernel = C(1.0, (1e-3, 1e3)) * RBF(10)
gp = GaussianProcessRegressor(kernel=kernel, optimizer = 'fmin_l_bfgs_b',alpha = 1.5, n_restarts_optimizer=5)
gp.fit(x_train, y_train)
y_pred_test, sigma = gp.predict(x_test, return_std =True)

我打印内核参数的方法是否正确？

谢谢！

Answer 1

gp.log_marginal_likelihood 返回的值在您附加的文档中指出，第一个值实际上是所传递参数的结果对数边际似然，在您的情况下 gp.kernel_.theta 和中的值该数组是关于内核参数的梯度。

真正得到结果内核参数post-优化。使用返回的内核：

gp.kernel_.get_params()

其中 returns 一个包含参数的字典，或者您可以使用以下方法单独获取它们：

gp.kernel_.k1

和

gp.kernel_.k2

高斯过程回归的内核参数：如何在 Scikit-learn 中获取它们？

Kernel parameters of Gaussian Process Regression: How to get them in Scikit-learn?

python

regression

scikit-learn

hyperparameters