具有 metric='russellrao' 的 DBSCAN 集群

DBSCAN cluster with metric='russellrao'

我在使用 sklearn.cluster.DBSCAN 时遇到问题。 如果我使用DBSCAN(metric="russellrao"),应该是哪种数据格式? 我尝试了两种方法 return pred = [-1 -1 -1 ..., -1 -1 -1] 。您可以在下面看到2数据格式。

npy = df2.values
y_pred = DBSCAN(metric="russellrao").fit_predict(npy)

1。 npy =

2。 npy =

打印y_pred [-1 -1 -1 ..., -1 -1 -1]

那么,哪种格式才是正确的答案?

您需要适当地选择其他DBSCAN参数。

恕我直言,sklearn 应该 有它们的默认值。特别是 epsilon 在很大程度上取决于您的数据集和指标,因此默认值几乎总是一个糟糕的选择。与其提供错误的默认值,不如强制用户选择参数。