根据地理坐标查找具有最大内距的聚类
Finding Clusters with Max Intra-Distance Based on Geo Co-ordinates
我有包含经纬度数据的数据集。
('ID','Latitude','Longitude')
('A0001',19.222,71.555)
我使用这些数据计算了距离矩阵,其中 M[i][j] 是 ID:i 和 ID:j 之间的距离。
使用以下代码计算距离:
geopy.distance.vincenty((a,b),(c,d)).miles
有没有找到半径 X 英里内的集群的最佳方法。
大多数当前聚类,如 "DBSCAN" K-Means 提供了最小距离和最小样本的选项,但是我正在寻找提供最大距离的聚类方法。
其次,如果不需要的话,我可以不计算距离矩阵。
做完整的连锁层次聚类。
如果你在距离x处砍树,同一簇中的任意两点的距离最多为x。它不是最佳的(因为那将是 NP 完全的)但通常足够好。
我有包含经纬度数据的数据集。
('ID','Latitude','Longitude')
('A0001',19.222,71.555)
我使用这些数据计算了距离矩阵,其中 M[i][j] 是 ID:i 和 ID:j 之间的距离。
使用以下代码计算距离:
geopy.distance.vincenty((a,b),(c,d)).miles
有没有找到半径 X 英里内的集群的最佳方法。
大多数当前聚类,如 "DBSCAN" K-Means 提供了最小距离和最小样本的选项,但是我正在寻找提供最大距离的聚类方法。
其次,如果不需要的话,我可以不计算距离矩阵。
做完整的连锁层次聚类。
如果你在距离x处砍树,同一簇中的任意两点的距离最多为x。它不是最佳的(因为那将是 NP 完全的)但通常足够好。