如何从我的代码 Keras python 中获取聚类数据 (y_true, y_pred)

Question

我正在使用带有自动编码器的 CNN 来聚类不同类型的 RNA。聚类是根据不同 RNA 的压缩表示计算的。每个 RNA 都有对应于 RNA 类型的标签。在我的例子中有 7 个不同的 classes。得到聚类结果后，我想可视化结果并查看哪些 RNA 聚类在哪里，但现在 y_pred 值不对应于 RNA-class 而是对应于聚类由 kmeans 初始化。


kmeans = KMeans(n_clusters=self.n_clusters, n_init=20)
self.y_pred = kmeans.fit_predict(self.encoder.predict(x))
y_pred_last = np.copy(self.y_pred)
        self.model.get_layer(name='clustering').set_weights([kmeans.cluster_centers_])
print(kmeans.labels_)

self.y_pred = q.argmax(1)
if y is not None:
    acc = np.round(metrics.acc(y, self.y_pred), 5)
    nmi = np.round(metrics.nmi(y, self.y_pred), 5)
    ari = np.round(metrics.ari(y, self.y_pred), 5)
    loss = np.round(loss, 5)
    logdict = dict(iter=ite, acc=acc, nmi=nmi, ari=ari, L=loss[0], Lc=loss[1], Lr=loss[2])

optimizer = 'adam'
dcec.compile(loss=['kld', 'mse'], loss_weights=[args.gamma, 1], optimizer=optimizer)
dcec.fit(x, y=y, tol=args.tol, maxiter=args.maxiter,
         update_interval=args.update_interval,
         save_dir=args.save_dir,
         cae_weights=args.cae_weights)
y_pred = dcec.y_pred


result = list(itertools.chain(y))

with open('datapoints.csv', mode='w', newline='') as data_points:
    data_writer = csv.writer(data_points)
    data_writer.writerow(['id', 'ytrue', 'ypred'])
    truth= y
    prediction = dcec.y_pred
    for i in range(len(result)):
         data_writer.writerow([i, truth[i], prediction[i]])

我现在的问题是这部分：预测= dcec.y_pred 输出显示正确的真实标签但不是 "correct" 预测标签。它 returns 一个值，但这不对应于 RNA 类型

不知道这条路对不对。主要是我只想可视化簇，看看哪种 RNA 类型被正确和错误地class化。

Answer 1

您可能没有使用正确的函数调用来从 Keras 模型中获取预测。我相信你应该做这样的事情：

prediction = dcec.predict(x)

这里有更多详细信息：https://keras.io/models/model/

希望对您有所帮助。

如何从我的代码 Keras python 中获取聚类数据 (y_true, y_pred)

How to get the clustering data (y_true, y_pred) from my code, Keras, python

python

cluster-analysis

autoencoder

conv-neural-network

keras