具有 metric='russellrao' 的 DBSCAN 集群
DBSCAN cluster with metric='russellrao'
我在使用 sklearn.cluster.DBSCAN 时遇到问题。
如果我使用DBSCAN(metric="russellrao")
,应该是哪种数据格式?
我尝试了两种方法 return pred = [-1 -1 -1 ..., -1 -1 -1]
。您可以在下面看到2数据格式。
npy = df2.values
y_pred = DBSCAN(metric="russellrao").fit_predict(npy)
1。
npy =
2。
npy =
打印y_pred
[-1 -1 -1 ..., -1 -1 -1]
那么,哪种格式才是正确的答案?
您需要适当地选择其他DBSCAN参数。
恕我直言,sklearn 应该不 有它们的默认值。特别是 epsilon 在很大程度上取决于您的数据集和指标,因此默认值几乎总是一个糟糕的选择。与其提供错误的默认值,不如强制用户选择参数。
我在使用 sklearn.cluster.DBSCAN 时遇到问题。
如果我使用DBSCAN(metric="russellrao")
,应该是哪种数据格式?
我尝试了两种方法 return pred = [-1 -1 -1 ..., -1 -1 -1]
。您可以在下面看到2数据格式。
npy = df2.values
y_pred = DBSCAN(metric="russellrao").fit_predict(npy)
1。
npy =
2。
npy =
打印y_pred [-1 -1 -1 ..., -1 -1 -1]
那么,哪种格式才是正确的答案?
您需要适当地选择其他DBSCAN参数。
恕我直言,sklearn 应该不 有它们的默认值。特别是 epsilon 在很大程度上取决于您的数据集和指标,因此默认值几乎总是一个糟糕的选择。与其提供错误的默认值,不如强制用户选择参数。