根据历史温度数据对气象站进行聚类

clustering weather stations by historical temperature data

我对机器学习的了解非常有限。我正在寻找一种特定的聚类算法,它可以帮助我通过这些点的一些历史数据将数据点分组在一起。想想这个例子: 有 n 个气象站(例如 200 个),我有这 n 个气象站 5 年的每小时温度数据。所以数据看起来像

timestamp, station_1, station_2, ...
1900-01-01 00:00:00, 80, 60, 81, ...
1900-01-01 01:00:00, 82, 59, 83

我正在寻找一种将气象站组合在一起的聚类算法,因此在一个集群中,气象站的温度非常接近。比如80和81接近,80和60不接近

另外,如果算法也能tell/calculate如何'close'将数据指向聚类中心,那就太好了...

天下没有免费的午餐

不要指望找到完全满足您需要的算法。

根据您的问题自定义算法。这就是数据科学热议的故事,需要试验和定制而不是希望获得交钥匙解决方案。

您对自己的需求有非常明确的想法。您必须将这个想法转化为代码并将其插入某种算法。例如,考虑具有最大范数的完全连锁聚类。可能是你上面解释的,但我认为它不会有用。