如何使用测地线创建距离 table

How to create distance table using geodesic

我正在用 Python 计算。假设我有这种 DataFrame,它由一些点组成

import pandas as pd
dfa=pd.DataFrame(([1,2],[1,3],[1,1],[1,4]), columns=['y','x'])

之前,我使用了 scipy.spatial 的距离矩阵,并使用此代码创建了另一个 DataFrame。但它似乎无法精确计算点之间的距离(长纬度)

from scipy.spatial import distance_matrix
pd.DataFrame(distance_matrix(dfa.values, dfa.values), index=dfa.index, columns=dfa.index)

您认为可以用测地线更改计算吗?这是我试过的。

from geopy.distance import geodesic
pd.DataFrame(geodesic(dfa.values[0], dfa.values[0]).kilometers, index=dfa.index, columns=dfa.index)

# i don't know how to change [0] adjusted to column and index

有什么建议吗?

给定一个列表或类似列表的对象locations,你可以

distances = pd.DataFrame([[geodesic(a,b) for a in locations] 
                          for b in locations])

不过,这将是多余的,因为它会计算 a,b 和 b,a 的距离,即使它们应该相同。根据 geodesic 的成本,您可能会更快地找到以下一些替代方案:

distances = pd.DataFrame([[geodesic(a,b)  if a > b else 0 
                           for a in locations] 
                              for b in locations])
distances = distances.add(distances.T) 

size = len(locations)
distances = pd.DataFrame(columns = range(size), index = range(size))
def get_distance(i,j):
    if distances.loc[j,i]:
        return distances.loc[j,i]
    if i == j:
        return 0
    return geodesic(locations[i], locations[j])
for i in range(size):
    for j in range(size):
        distances.loc[i,j] = get_distance(i,j)

您还可以将数据存储为字典,其中的键从 itertools.combinations 输出。还有 this article 关于创建对称矩阵 class。