gpflow分类实现
gpflow classification implementation
我想使用高斯过程实现二进制 class化模型。根据official documentation,我有如下代码。
X 有 2048 个特征,Y 不是 0 就是 1。优化模型后,我正在尝试评估性能。
然而,predict_y
方法产生了一个奇怪的结果;预期的 pred
应该有一个像 (n_test_samples, 2) 的形状,它代表 class 0 和 1 的概率。但是我得到的结果却是 (n_test_samples , n_training_samples).
出了什么问题?
def model(X,Y):
'''
X: (n_training_samples, n_features) , my example is (n, 2048)
Y: (n_training_samples,) , binary classification
'''
m = gpflow.models.VGP(
(X, Y), likelihood=gpflow.likelihoods.Bernoulli(), kernel=gpflow.kernels.SquaredExponential()
)
opt = gpflow.optimizers.Scipy()
opt.minimize(m.training_loss, variables=m.trainable_variables)
return m
def evaluate(model,X,Y,accuracy, MCC, Kappa):
'''
X: (n_test_samples, n_features) , my example is (n, 2048)
Y: (n_test_samples,) , binary classification
'''
pred,_ = model.predict_y(X)
print('pred.shape is {}'.format(pred)) # I got wired result (num of test samples <X.shape[0]>, num of training samples)
accuracy += [accuracy_score(Y, pred)]
MCC += [matthews_corrcoef(Y, pred)]
Kappa += [cohen_kappa_score(Y, pred)]
return accuracy, MCC, Kappa
我终于明白了。原因是 VGP 模型的 Y 形状应该像 (n_training_samples, 1) 而不是 (n_training_samples,).
我想使用高斯过程实现二进制 class化模型。根据official documentation,我有如下代码。
X 有 2048 个特征,Y 不是 0 就是 1。优化模型后,我正在尝试评估性能。
然而,predict_y
方法产生了一个奇怪的结果;预期的 pred
应该有一个像 (n_test_samples, 2) 的形状,它代表 class 0 和 1 的概率。但是我得到的结果却是 (n_test_samples , n_training_samples).
出了什么问题?
def model(X,Y):
'''
X: (n_training_samples, n_features) , my example is (n, 2048)
Y: (n_training_samples,) , binary classification
'''
m = gpflow.models.VGP(
(X, Y), likelihood=gpflow.likelihoods.Bernoulli(), kernel=gpflow.kernels.SquaredExponential()
)
opt = gpflow.optimizers.Scipy()
opt.minimize(m.training_loss, variables=m.trainable_variables)
return m
def evaluate(model,X,Y,accuracy, MCC, Kappa):
'''
X: (n_test_samples, n_features) , my example is (n, 2048)
Y: (n_test_samples,) , binary classification
'''
pred,_ = model.predict_y(X)
print('pred.shape is {}'.format(pred)) # I got wired result (num of test samples <X.shape[0]>, num of training samples)
accuracy += [accuracy_score(Y, pred)]
MCC += [matthews_corrcoef(Y, pred)]
Kappa += [cohen_kappa_score(Y, pred)]
return accuracy, MCC, Kappa
我终于明白了。原因是 VGP 模型的 Y 形状应该像 (n_training_samples, 1) 而不是 (n_training_samples,).